期刊文献+
共找到264篇文章
< 1 2 14 >
每页显示 20 50 100
Research on the Structured Data Mining Algorithm and the Applications on Machine Learning Field
1
作者 Xiaodui Deng 《International Journal of Technology Management》 2016年第1期82-84,共3页
In this paper, we conduct research on the structured data mining algorithm and applications on machine learning field. Various fields due to the advancement of informatization and digitization, a lot of multi-source a... In this paper, we conduct research on the structured data mining algorithm and applications on machine learning field. Various fields due to the advancement of informatization and digitization, a lot of multi-source and heterogeneous data distributed storage, in order to achieve the sharing, we must solve from the storage management to the interoperability of a series of mechanism, the method and implementation technology. Unstructured data does not have strict structure, therefore, compared with structured information that is more difficult to standardization, with management more difficult. According to these characteristics, the large capacity of unstructured data or using files separately store, is stored in the database index of similar pointer. Under this background, we propose the new idea on the structured data mining algorithm that is meaningful. 展开更多
关键词 data mining STRUCTURED applicationS Machine Learning Model analysis.
在线阅读 下载PDF
基于数据挖掘的Web Archive资源应用分析 被引量:5
2
作者 吴振新 张智雄 孙志茹 《现代图书情报技术》 CSSCI 北大核心 2009年第1期28-33,共6页
介绍Web Archive资源应用的基本情况,从数据挖掘的角度,对Web Archive资源的深层次应用进行总结和分析。
关键词 web archive 应用分析 数据挖掘
在线阅读 下载PDF
国外Web Archive资源开发利用的途径及趋势展望 被引量:12
3
作者 王萍 黄新平 张楠雪 《图书馆学研究》 CSSCI 2015年第23期43-49,共7页
基于文献与网络资源调研,对国外主要Web Archive项目存档资源应用的基本情况进行梳理,总结和分析当前网络存档资源开发利用的途径。在此基础上,立足于网络技术的不断发展和演变,以及未来对网络存档资源的应用需求,对其开发利用的发展趋... 基于文献与网络资源调研,对国外主要Web Archive项目存档资源应用的基本情况进行梳理,总结和分析当前网络存档资源开发利用的途径。在此基础上,立足于网络技术的不断发展和演变,以及未来对网络存档资源的应用需求,对其开发利用的发展趋势进行展望,以期对我国网络存档资源的开发利用起到参考作用。 展开更多
关键词 web archive 资源利用 学术研究 数据挖掘
原文传递
IMPROVING THE INTERESTINGNESS OF WEB USAGE MINING 被引量:1
4
作者 杨怡玲 管旭东 尤晋元 《Journal of Shanghai Jiaotong university(Science)》 EI 2002年第1期15-22,共8页
Improvement on mining the frequently visited groups of web pages was studied. First, in the data preprocessing phrase, we introduce an extra frame filtering step that reduces the negative influence of frame pages on t... Improvement on mining the frequently visited groups of web pages was studied. First, in the data preprocessing phrase, we introduce an extra frame filtering step that reduces the negative influence of frame pages on the result page groups. Through recognizing the frame pages in the site documents and constructing the frame subframe relation set, the subframe pages that influence the final mining result can be efficiently filtered. Second, we enhance the mining algorithm with the consideration of both the site topology and the content of the web pages. By the introduction of the normalized content link ratio of the web page and the group interlink degree of the page group, the enhanced algorithm concentrates more on the content pages that are less interlinked together. The experiments show that the new approach can effectively reveal more interesting page groups, which would not be found without these enhancements. 展开更多
关键词 data mining web mining web USAGE mining LOG analysis INTERESTINGNESS ENHANCEMENT
在线阅读 下载PDF
Analysis and Visualization of Marketing, Statistical and Macroeconomic Data With GIS
5
作者 Krassimira Schwertner 《Economics World》 2017年第5期389-398,共10页
The most common way to analyze economics data is to use statistics software and spreadsheets.The paper presents opportunities of modern Geographical Information System (GIS) for analysis of marketing, statistical, a... The most common way to analyze economics data is to use statistics software and spreadsheets.The paper presents opportunities of modern Geographical Information System (GIS) for analysis of marketing, statistical, and macroeconomic data. It considers existing tools and models and their applications in various sectors. The advantage is that the statistical data could be combined with geographic views, maps and also additional data derived from the GIS. As a result, a programming system is developed, using GIS for analysis of marketing, statistical, macroeconomic data, and risk assessment in real time and prevention. The system has been successfully implemented as web-based software application designed for use with a variety of hardware platforms (mobile devices, laptops, and desktop computers). The software is mainly written in the programming language Python, which offers a better structure and supports for the development of large applications. Optimization of the analysis, visualization of macroeconomic, and statistical data by region for different business research are achieved. The system is designed with Geographical Information System for settlements in their respective countries and regions. Information system integration with external software packages for statistical calculations and analysis is implemented in order to share data analyzing, processing, and forecasting. Technologies and processes for loading data from different sources and tools for data analysis are developed. The successfully developed system allows implementation of qualitative data analysis. 展开更多
关键词 GIS statistical analysis marketing data analysis location analytics web business software application management information systems
在线阅读 下载PDF
Particle Swarm Optimization: Advances, Applications, and Experimental Insights 被引量:1
6
作者 Laith Abualigah 《Computers, Materials & Continua》 2025年第2期1539-1592,共54页
Particle Swarm Optimization(PSO)has been utilized as a useful tool for solving intricate optimization problems for various applications in different fields.This paper attempts to carry out an update on PSO and gives a... Particle Swarm Optimization(PSO)has been utilized as a useful tool for solving intricate optimization problems for various applications in different fields.This paper attempts to carry out an update on PSO and gives a review of its recent developments and applications,but also provides arguments for its efficacy in resolving optimization problems in comparison with other algorithms.Covering six strategic areas,which include Data Mining,Machine Learning,Engineering Design,Energy Systems,Healthcare,and Robotics,the study demonstrates the versatility and effectiveness of the PSO.Experimental results are,however,used to show the strong and weak parts of PSO,and performance results are included in tables for ease of comparison.The results stress PSO’s efficiency in providing optimal solutions but also show that there are aspects that need to be improved through combination with algorithms or tuning to the parameters of the method.The review of the advantages and limitations of PSO is intended to provide academics and practitioners with a well-rounded view of the methods of employing such a tool most effectively and to encourage optimized designs of PSO in solving theoretical and practical problems in the future. 展开更多
关键词 Particle swarm optimization(PSO) optimization algorithms data mining machine learning engineer-ing design energy systems healthcare applications ROBOTICS comparative analysis algorithm performance evaluation
在线阅读 下载PDF
Web大数据环境下的不一致跨源数据发现 被引量:24
7
作者 余伟 李石君 +4 位作者 杨莎 胡亚慧 刘晶 丁永刚 王骞 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期295-308,共14页
Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源We... Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源Web数据的多源异构特性和Web大数据的5V特征,将从站点结构、特征数据和知识规则3个方面建立统一数据抽取算法和Web对象数据模型;研究不同类型的Web数据不一致特征,建立不一致分类模型、一致性约束机制和不一致推理代数运算系统;从而在跨源Web数据一致性理论体系的基础上,实现通过约束规则检测、统计偏移分析的Web不一致数据自动发现方法,并结合这两种方法的特点,基于Hadoop MapReduce架构提出了基于层次概率判定的Web不一致数据的自动发现算法.该框架在Hadoop平台上对多个B2C电子商务大数据进行实验,并与传统架构和其他方法进行了比较,实验结果证明该方法具有良好的精确性和高效性. 展开更多
关键词 web大数据 web数据挖掘 数据一致性 web数据管理 数据质量评估 跨源数据分析
在线阅读 下载PDF
Web使用挖掘技术研究综述 被引量:17
8
作者 陈健 印鉴 《计算机工程》 CAS CSCD 北大核心 2005年第9期4-6,共3页
Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程。该文介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术... Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程。该文介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术;对将来Web使用挖掘领域的研究问题作了展望。 展开更多
关键词 web使用挖掘 数据预处理 模式挖掘 模式分析 web应用
在线阅读 下载PDF
Web使用挖掘技术研究 被引量:37
9
作者 涂承胜 陆玉昌 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1177-1184,共8页
简要介绍了 WEB挖掘的基本概念及其分类 ,讨论了 Web使用挖掘的有关理论及其应用 .重点分析了 Web使用挖掘的主要研究对象和研究方法 ,包括 :挖掘的数据对象、数据的采集、数据预处理、模式发现、模式分析及其相关技术 .展望了
关键词 web挖掘 web网络使用挖掘 数据预处理 模式发现 模式分析
在线阅读 下载PDF
Web日志挖掘预处理中的Frame页面过滤算法 被引量:14
10
作者 杨怡玲 管旭东 尤晋元 《计算机工程》 CAS CSCD 北大核心 2001年第2期76-77,共2页
Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式。在介绍了典型的数据预处理技术的基础上,指出Frame页面降低了挖掘结果的兴趣性,并提出相应的解决方法--Frame页面过滤算法消除其影响。通过实验数据对... Web日志挖掘是将数据挖掘技术应用到Web服务器的日志中,发现Web用户的行为模式。在介绍了典型的数据预处理技术的基础上,指出Frame页面降低了挖掘结果的兴趣性,并提出相应的解决方法--Frame页面过滤算法消除其影响。通过实验数据对该算法进行验证,说明Frame页面过滤算法可以显著地提高Web日志挖掘结果的兴趣性。 展开更多
关键词 web 日志挖掘 数据预处理 数据挖掘 FrAme页面 过滤算法
在线阅读 下载PDF
Web使用挖掘技术的分析与研究 被引量:23
11
作者 朱志国 邓贵仕 《计算机应用研究》 CSCD 北大核心 2008年第1期29-32,36,共5页
首先给出Web使用挖掘的定义和完整模型框架;然后对Web使用挖掘中主要步骤的最新研究进展状况作了详细的阐述和分析,其中包括数据采集、数据预处理、模式发现和模式分析;最后对未来的研究重点进行了展望。
关键词 web挖掘 web使用挖掘 数据预处理 模式发现 模式分析
在线阅读 下载PDF
数据抽取及语义分析在Web数据挖掘中的应用 被引量:6
12
作者 袁占亭 张秋余 李威 《计算机工程与设计》 CSCD 北大核心 2005年第6期1425-1427,1437,共4页
把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的... 把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,使数据提取更加准确。 展开更多
关键词 web 数据挖掘 数据抽取 语义分析 数据结构
在线阅读 下载PDF
Web使用挖掘研究 被引量:9
13
作者 高晓琴 蒋朝哲 +2 位作者 涂瑞 李慧 杨占华 《微计算机信息》 北大核心 2006年第07X期200-202,共3页
本文首先由Web挖掘的分类提出了Web使用挖掘,进一步介绍了Web使用挖掘的概念、分类及其采用技术,最后介绍了数据预处理方法以及Web使用挖掘的应用及其下一步将要研究的内容。
关键词 使用挖掘 据预处理 日志数据格式 使用挖掘应用
在线阅读 下载PDF
Web数据挖掘研究 被引量:9
14
作者 曹聪聪 康耀红 《现代电子技术》 2007年第4期92-94,97,共4页
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。
关键词 数据挖掘 web挖掘 web挖掘分类 算法与应用
在线阅读 下载PDF
Web使用挖掘技术分析 被引量:4
15
作者 李超锋 卢炎生 《计算机科学》 CSCD 北大核心 2006年第2期220-222,共3页
介绍了一种 Web 挖掘的分类,包括 Web 内容挖掘、Web 结构挖掘和 Web 使用挖掘。讨论了 Web 使用挖掘过程的三个步骤,即数据获取与数据预处理、模式发现和模式分析,详细分析了每一个步骤中所使用的技术。指出了目前 Web 使用挖掘研究存... 介绍了一种 Web 挖掘的分类,包括 Web 内容挖掘、Web 结构挖掘和 Web 使用挖掘。讨论了 Web 使用挖掘过程的三个步骤,即数据获取与数据预处理、模式发现和模式分析,详细分析了每一个步骤中所使用的技术。指出了目前 Web 使用挖掘研究存在的不足,给出了 Web 使用挖掘未来的研究方向。 展开更多
关键词 web使用挖掘 数据预处理 模式发现.模式分析
在线阅读 下载PDF
一个基于Web的金融多层聚类系统 被引量:2
16
作者 梅永国 杨杰 陈文中 《上海交通大学学报》 EI CAS CSCD 北大核心 2002年第12期1816-1820,共5页
介绍了一个基于 Web的用于金融数据挖掘的多层聚类系统的设计与实现 .该系统基于金融比率对香港、大陆股市中的上市公司进行了聚类分析 .它采用 3层的体系结构 ,即用户层、应用层和数据库层 .应用层使用了 Java Servlet、Java Script和 ... 介绍了一个基于 Web的用于金融数据挖掘的多层聚类系统的设计与实现 .该系统基于金融比率对香港、大陆股市中的上市公司进行了聚类分析 .它采用 3层的体系结构 ,即用户层、应用层和数据库层 .应用层使用了 Java Servlet、Java Script和 JDBC等编程技术 .系统数据库中存储了大量的金融数据 ,并实现了 2 4个金融比率的计算和存储 ,用户还可以自己定义新的金融比率和众多金融比率之间构成层次关系 .用户可以在不同的比率层次上对公司聚类 ,显然 ,采用多层次的聚类比单层次聚类有明显的优越性 .测试结果表明 ,该系统灵活、快速、扩展性好、结果易理解 ,有助于金融专家和有经验的投资者进行正确分析和合理投资 . 展开更多
关键词 金融多层聚类系统 数据挖掘 聚类分析 金融比率 web JAVASERVLET JDBC dataBASE
在线阅读 下载PDF
基于CRISP-DM模型的时序预测Web服务设计与实现 被引量:2
17
作者 王慧敏 陈泽宇 张驰 《计算机应用与软件》 CSCD 2011年第1期92-95,共4页
基于CRISP-DM(cross-industry standard process for data mining)模型设计与实现了一个时序预测Web服务,对网站资源的下载需求量进行预测。重点阐述了CRISP-DM模型应用于时序预测任务时的设计思想和实现的关键技术。测试结果表明,该时... 基于CRISP-DM(cross-industry standard process for data mining)模型设计与实现了一个时序预测Web服务,对网站资源的下载需求量进行预测。重点阐述了CRISP-DM模型应用于时序预测任务时的设计思想和实现的关键技术。测试结果表明,该时序预测Web服务具有较高的预测准确率,部署快速,使用方便,对解决同类问题具有一定的示范和参考价值。 展开更多
关键词 数据挖掘 跨行业数据挖掘标准过程(CRISP-DM) 分析管理对象(AMO) web服务
在线阅读 下载PDF
Web数据挖掘技术及其在旅游电子商务的应用 被引量:6
18
作者 辛海涛 《哈尔滨商业大学学报(自然科学版)》 CAS 2010年第4期483-485,497,共4页
分析了数据挖掘技术,及Web记录挖掘过程,利用Web记录挖掘技术和推荐引擎技术,帮助旅游电子商务建立个性化的旅游网络,为旅游者推荐旅游计划,提高网络旅游的预订率,从而使旅游企业更多地获利.
关键词 web 数据挖掘 电子商务 应用
在线阅读 下载PDF
Web文本挖掘在辅助研究中的应用 被引量:1
19
作者 刘进锋 荣冈 《情报科学》 CSSCI 北大核心 2006年第3期400-404,共5页
应用Web文本挖掘对网络数据库中检索到的信息进行分析,能够得到对研究工作有辅助作用的知识。文中对数据收集、预处理和数据挖掘的方法进行了详细的介绍。实例证明利用Web文本挖掘能充分利用网络数据库中的信息,对辅助研究是有效的。
关键词 数据挖掘 web文本挖掘 网络数据库 辅助研究 应用
在线阅读 下载PDF
网络计量学与Web挖掘对比研究 被引量:1
20
作者 赵蓉英 魏明坤 《情报杂志》 CSSCI 北大核心 2016年第3期131-136,共6页
[目的/意义]以网络计量学和Web挖掘的概念为出发点,对网络计量学与Web挖掘进行对比研究,掌握两者之间的区别与联系,有利于学者对网络计量学的深入研究。[方法/过程]利用Cite Space软件绘制网络计量学与Web挖掘领域研究热点可视化知识图... [目的/意义]以网络计量学和Web挖掘的概念为出发点,对网络计量学与Web挖掘进行对比研究,掌握两者之间的区别与联系,有利于学者对网络计量学的深入研究。[方法/过程]利用Cite Space软件绘制网络计量学与Web挖掘领域研究热点可视化知识图谱;运用词频分析方法,统计各领域的高频关键词;最后,通过对比分析法,比较两者研究方向的差异。[结果/结论]研究发现两者都是基于对网络数据的分析,其中网络计量学注重现象与结构研究,而Web挖掘注重算法与试验性研究;在研究对象层面,网络计量学侧重于学术领域的研究,对科研领域的贡献较大,而Web挖掘侧重于电子商务领域的研究,以商业利益为导向。 展开更多
关键词 网络计量学 web挖掘 信息检索 链接分析 大数据
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部