期刊文献+
共找到166篇文章
< 1 2 9 >
每页显示 20 50 100
基于TF-IDF算法的智能手部按摩仪设计研究
1
作者 张琳 赵晶冉 林君晖 《工业设计》 2026年第1期142-145,共4页
文章旨在拓展亚健康青年群体的消费市场,满足现代青年群体对情绪价值的诉求。在消费者购买动机理论的指导下,文章针对新兴智能手部按摩产品开展设计方法方面的系统性研究。同时,借助TF-IDF算法与问卷调查法提取设计特征,通过排序转化构... 文章旨在拓展亚健康青年群体的消费市场,满足现代青年群体对情绪价值的诉求。在消费者购买动机理论的指导下,文章针对新兴智能手部按摩产品开展设计方法方面的系统性研究。同时,借助TF-IDF算法与问卷调查法提取设计特征,通过排序转化构建设计指标及原则,据此完成产品方案设计并引入灰色关联度分析法对原型进行优选。在案例研究中,所采用的TF-IDF算法可有效提炼出消费者的购买动机,将消费动机要素量化为数据形式。以期为智能手部按摩产品设计提取提供科学依据,使产品原型设计与青年群体消费心理相契合,亦为同类新兴智能康养按摩产品的创新研发提供理论参考与实践路径。 展开更多
关键词 工业设计 tf-idf算法 智能手部按摩仪 灰色关联度分析法 消费者购买动机
在线阅读 下载PDF
基于TF-IDF算法的无线传感网络攻击流量检测方法研究 被引量:1
2
作者 王晨 刘鑫 《传感技术学报》 北大核心 2025年第4期744-748,共5页
无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归... 无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归一化处理离散型流量;然后通过TF-IDF算法提取无线传感网络流量特征,利用特征向量集训练多通道自编码器,利用TF-IDF算法计算待检测的攻击流量数据特征在无线传感网络流量内出现的频率,以此对攻击流量进行排序;最后通过Softmax分类器输出最终流量类型检测结果。仿真结果表明,所提方法的检测精确度最低值为97.05%,虚警率最高值为2.01%、测试时间平均值为20.1 s,证明所提方法能高效、精确地实现无线传感网络攻击流量检测。 展开更多
关键词 无线传感网络 攻击流量检测 tf-idf算法 多通道自编码器
在线阅读 下载PDF
基于网络爬虫与TF-IDF算法的非遗产品创新 被引量:1
3
作者 王菁 杨晓翔 《佳木斯大学学报(自然科学版)》 2025年第8期52-54,74,共4页
非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统T... 非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统TF-IDF算法中引入词跨度,选取权重最高的前n个作为非遗产品创新设计的关键词,获得符合非遗产品创新设计需求的结果。测试结果显示:该方法抽取的非遗创新关键词与人工抽取结果更契合,准确度均在90%以上,基于网络爬虫与TF-IDF算法的非遗产品创新具有良好的推广应用前景。 展开更多
关键词 网络爬虫 tf-idf算法 语料库 词频率 非遗创新 产品
在线阅读 下载PDF
基于改进TF-IDF算法的毕业生就业推荐算法研究 被引量:6
4
作者 李龙 金铄 黄霞 《计算机与数字工程》 2023年第9期1985-1989,2118,共6页
针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计... 针对传统就业推荐算法不能够对每一个毕业生进行精准的推荐的局限性,论文提出一种结合TF-IDF算法和K-means++算法的双向推荐系统,一方面对毕业生信息使用K-means++算法进行聚类,对新用户根据其初始信息与行为信息进行用户画像建模,并计算与往届毕业生的相似度;另一方面使用TF-IDF算法对各个招聘网站所发布的招聘信息中的关键词进行统计转换词频等操作。实验结果表明,该双向就业推荐系统比起之前单向就业推荐提高了毕业生就业推荐的满意度,提升推荐效率。 展开更多
关键词 K-means++算法 tf-idf算法 用户画像 推荐系统
在线阅读 下载PDF
基于改进TF-IDF算法的日本文学语料处理计算机系统方法研究 被引量:1
5
作者 魏海燕 沈进 《自动化与仪器仪表》 2023年第1期162-165,共4页
对日本文学进行语料处理,有助于快速提取具有一定价值的文本信息,从而方便阅读和理解。为此,基于深度学习算法,构建了日本文学语料处理模型。首先,利用改进TF-IDF算法进行情感语料分类;其次,结合卷积神经网络与自循环思想构建自循环CNN... 对日本文学进行语料处理,有助于快速提取具有一定价值的文本信息,从而方便阅读和理解。为此,基于深度学习算法,构建了日本文学语料处理模型。首先,利用改进TF-IDF算法进行情感语料分类;其次,结合卷积神经网络与自循环思想构建自循环CNN模型,以处理不等长语料的分类问题;最后,结合卷积神经网络与双向门控循环单元处理特定主题语料分类问题。综合上述内容,构建日本文学语料处理模型。经多次实验结果显示,该模型的分类准确率超过90%,表明该模型能够有效实现日本文学的语料处理。 展开更多
关键词 tf-idf算法 卷积神经网络 语料处理 日本文学
原文传递
结合改进的CHI统计方法的TF-IDF算法优化 被引量:23
6
作者 马莹 赵辉 +2 位作者 李万龙 庞海龙 崔岩 《计算机应用研究》 CSCD 北大核心 2019年第9期2596-2598,2603,共4页
为了克服传统的CHI统计方法存在特征项出现频率与类别负相关的情况和某一个特征项存在于某一个文本中的概率问题,针对传统的CHI统计方法引入了负相关判定、频度等重要因素进行了改进,并结合语义相似度的计算方法对TF-IDF算法进行了优化,... 为了克服传统的CHI统计方法存在特征项出现频率与类别负相关的情况和某一个特征项存在于某一个文本中的概率问题,针对传统的CHI统计方法引入了负相关判定、频度等重要因素进行了改进,并结合语义相似度的计算方法对TF-IDF算法进行了优化,在WEKA软件上采用了KNN(K-nearest neighbor)分类器和支持向量机(SVM)分类器分别对微博情感语料进行分类,该实验结果表明,新方法在文本分类的准确性上有明显的提高。 展开更多
关键词 文本分类 CHI统计 tf-idf算法 特征选择
在线阅读 下载PDF
基于TF-IDF算法的方剂构成相似度可视化研究 被引量:11
7
作者 郭文龙 罗熊 +2 位作者 姜惠娟 谢永红 陈茂建 《中国中医药信息杂志》 CAS CSCD 2019年第7期104-108,共5页
目的构建中药方剂数据挖掘系统,直观反映方剂属性及方剂之间的相似度,为方剂研究及应用提供参考。方法应用爬虫框架和手工录入方式获取一定数量的经典方剂,采用中文分词工具和手工整理方式对方剂信息进行名称、功能、来源、中药组成、... 目的构建中药方剂数据挖掘系统,直观反映方剂属性及方剂之间的相似度,为方剂研究及应用提供参考。方法应用爬虫框架和手工录入方式获取一定数量的经典方剂,采用中文分词工具和手工整理方式对方剂信息进行名称、功能、来源、中药组成、剂量、剂量单位、炮制方法、忌宜、主治等属性拆分,构造语料词库,Python3.5环境下采用TF-IDF算法计算方剂间相似度并进行功能主治验证,采用d3.js进行可视化展示。结果经过分词和手工整理得到不同类型方剂7710首,包含药物8957味,构建的中药方剂数据挖掘系统实现了相似度和方剂构成等信息可视化展示。同时,相似度高的方剂在功能主治方面具相似性。结论本研究构建的中药方剂数据挖掘系统可直观展示方剂信息、方剂与药物间的关联关系及方剂之间的相似度。 展开更多
关键词 方剂 tf-idf算法 相似度 可视化 中药方剂数据挖掘系统
在线阅读 下载PDF
基于TF-IDF算法的农产品消费者购买情感分析——来自京东电商平台在线点评数据 被引量:3
8
作者 邓颖仪 邱秀芳 +1 位作者 黄华乾 庞青 《安徽农业科学》 CAS 2022年第11期203-206,共4页
“互联网+农产品”模式大大拓宽了农产品的销售渠道,为乡村振兴注入活力。于京东电商平台甄选出点评数达200条以上的农产品共2090种112779条评论,借助Hanlp工具对评论文本进行分词,并利用TF-IDF算法对特征词进行关注度分析。研究表明,... “互联网+农产品”模式大大拓宽了农产品的销售渠道,为乡村振兴注入活力。于京东电商平台甄选出点评数达200条以上的农产品共2090种112779条评论,借助Hanlp工具对评论文本进行分词,并利用TF-IDF算法对特征词进行关注度分析。研究表明,消费者网购农产品过程中,较关心农产品的新鲜度、品质、快递服务及包装;消费者网购水果类、蔬菜类等农产品的比例最高,其中对水果类“甜”“熟”“酸”等特征词的关注度最高,对蔬菜类“糯”“好吃”“香甜”等特征词关注度最高。以上结论既丰富了农产品网络营销的相关研究,也可用于指导农产品的网络营销实践。 展开更多
关键词 农产品 网络营销 tf-idf算法 京东
在线阅读 下载PDF
基于TF-IDF算法的AAA服务异常检测机制研究 被引量:2
9
作者 黄晓丹 罗伟 +2 位作者 李秀峰 李晓冰 刘建建 《移动通信》 2016年第2期83-87,共5页
首先基于某电信公司2014年度的AAA服务日志文件,统计了其认证结果的比例分布,归纳了导致服务状态异常的数据源行为类型,即恶意登录和唯N性授权攻击。接着针对现有异常检测策略在效率和准确性上的不足,提出了一种基于参数替换的TF-IDF算... 首先基于某电信公司2014年度的AAA服务日志文件,统计了其认证结果的比例分布,归纳了导致服务状态异常的数据源行为类型,即恶意登录和唯N性授权攻击。接着针对现有异常检测策略在效率和准确性上的不足,提出了一种基于参数替换的TF-IDF算法的服务状态异常检测机制,通过计算待筛选数据源与已确认的异常源集的关联度,高效地发现和确定其他异常源。最后通过模拟实验,验证了该机制的有效性和高效性。 展开更多
关键词 AAA服务 异常日志 tf-idf算法 异常检测
在线阅读 下载PDF
基于TF-IDF算法的分层搜索引擎设计 被引量:8
10
作者 张贤亮 张尤赛 《计算机与数字工程》 2021年第3期456-461,共6页
随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求。据此,论文提出了一种两阶段的搜索引擎设计方案。在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第... 随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求。据此,论文提出了一种两阶段的搜索引擎设计方案。在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条。该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护。实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点。 展开更多
关键词 搜索引擎 网络爬虫 tf-idf算法 Flask框架
在线阅读 下载PDF
基于Python技术和TF-IDF算法的科技专家库建设案例研究 被引量:3
11
作者 杨好 周长海 《科技促进发展》 2022年第7期864-871,共8页
本研究以中国科学院科技专家库建设为案例,探讨了在信息安全环境下利用智能技术完善并更新专家库信息、运用综合指标遴选专家的路径,在此基础上总结了中科院科技专家库信息系统的设计与实践。首先,基于Python大数据网络爬虫技术和文献... 本研究以中国科学院科技专家库建设为案例,探讨了在信息安全环境下利用智能技术完善并更新专家库信息、运用综合指标遴选专家的路径,在此基础上总结了中科院科技专家库信息系统的设计与实践。首先,基于Python大数据网络爬虫技术和文献情报分析相结合的方式,补充专家基础数据,并定期更新专家信息;其次,建立专家信誉度评价指标体系;第三,在遴选专家时,运用TF-IDF算法对项目和专家信息进行关联分析,并结合学科分类标准对专家研究领域分类,以提高项目-专家研究领域的匹配度;第四,综合各项关键指标遴选确定最终候选专家;最后,在此基础上设计并开发了中科院科技专家库信息系统,有效提升了专家库管理和专家遴选的工作效率。 展开更多
关键词 科技专家库 Python技术 tf-idf算法 专家遴选 专家库信息系统
原文传递
基于改进TF-IDF算法的灌区水权市场运行效果评价 被引量:1
12
作者 万福兵 代小平 《中国农村水利水电》 北大核心 2022年第6期147-153,共7页
水权市场是促进水资源优化配置的重要手段,水权市场运行效果评价对指导水权市场建设和运行具有重要意义。从公平、效率和可持续三方面构建水权市场运行效果评价指标体系,采用改进的TF-IDF算法确定指标权重,基于问卷调查和统计数据,对石... 水权市场是促进水资源优化配置的重要手段,水权市场运行效果评价对指导水权市场建设和运行具有重要意义。从公平、效率和可持续三方面构建水权市场运行效果评价指标体系,采用改进的TF-IDF算法确定指标权重,基于问卷调查和统计数据,对石羊河流域一个以地表水为主的灌区和一个井灌区的水权市场运行效果进行评价。两个灌区的水权市场运行效果评价为中等,其中“可持续性”指标得分最高,“公平”指标得分最低。井灌区水权市场的运行效果高于以地表水为主的灌区,灌区水权市场运行效果的差异来自水权交易层次、水权监控方式、灌溉水源可靠性、灌溉组织方式等,以地表水为主的灌区的水权市场运行效果在2008-2012年间呈下降趋势,水权交易政策对水权市场运行效果具有重要影响。建议根据水权市场的时空差异采取适宜的水权政策。改进的TF-IDF算法可通过量化分析官员和学者的观点来确定指标权重,为指标权重计算提供新的思路。 展开更多
关键词 石羊河流域 灌区 水权市场 运行效果 tf-idf算法
在线阅读 下载PDF
基于TF-IDF算法和DTM模型的网络学习社区主题分析 被引量:15
13
作者 董伟 董思遥 +1 位作者 王聪 陶金虎 《现代教育技术》 CSSCI 2022年第2期90-98,共9页
随着信息技术的快速发展,网络学习社区已成为重要的学习平台之一。在此背景下,文章采用词频—逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法和动态主题模型(Dynamic Topic Models,DTM),以951条相关文献作为数据来... 随着信息技术的快速发展,网络学习社区已成为重要的学习平台之一。在此背景下,文章采用词频—逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法和动态主题模型(Dynamic Topic Models,DTM),以951条相关文献作为数据来源,首先对网络学习社区的研究热点和研究主题进行了分析,发现网络学习社区具有明确的教育属性,并将网络学习社区领域的相关研究划分为九类主题。随后,文章基于时序绘制了热度高低均值图和热度曲线图,对网络学习社区主题热度与演化情况进行了分析,发现混合教学和学习服务等主题具有核心热点特征,平台建设、学习者交互、社区生态等主题发展较为稳定,学习环境主题有一定的发展潜力,而学习模式、知识共享、学习动机等主题热度逐渐弱化。最后,文章梳理了研究结论,并针对网络学习社区的发展提出了建议。文章的研究为网络学习社区领域中理论和实践研究提供了一定的数据和理论支持,明确了该领域的研究主题和结构,为探讨该领域的未来研究方向提供了新的思路。 展开更多
关键词 网络学习社区 tf-idf算法 DTM模型 主题热度 演化情况
在线阅读 下载PDF
基于TF-IDF算法和LDA主题模型数据挖掘技术在电力客户抱怨文本中的应用 被引量:9
14
作者 李锐 张伟彬 《自动化技术与应用》 2018年第11期46-50,共5页
随着大数据时代的到来,数据挖掘涉及的领域愈发广泛,语意丰富的非结构化文本中的价值也越发增加,文本挖掘技术显得尤为重要,客户抱怨的文本数据成为审视自己产品与服务的关键所在。本文对文本挖掘技术进行梳理,采用TF-IDF算法有效处理... 随着大数据时代的到来,数据挖掘涉及的领域愈发广泛,语意丰富的非结构化文本中的价值也越发增加,文本挖掘技术显得尤为重要,客户抱怨的文本数据成为审视自己产品与服务的关键所在。本文对文本挖掘技术进行梳理,采用TF-IDF算法有效处理词频信息,并将词频信息通过LDA主题模型有效的分类,采用电力客户抱怨文本数据库,得到了有意义的结果。最后通过实验验证了理论的可行性,实验结果表明,基于TF-IDF算法和LDA主题模型挖掘技术在电力客户抱怨文本中能够有效的呈现客户抱怨的问题。 展开更多
关键词 文本挖掘 客户抱怨 tf-idf算法 LDA主题模型
在线阅读 下载PDF
基于改进TF-IDF算法的关键词抽取系统 被引量:2
15
作者 胡亮 夏磊 李伟 《厦门理工学院学报》 2017年第5期67-72,共6页
为克服传统TF-IDF概念思想与关键词抽取的逻辑相冲问题,引入卡方校验的方法优化TFIDF算法,设计了一个包含文件存储、文本预处理、度量值计算、排序抽取和优化输出4个流程的关键词抽取系统。实验结果表明,该系统能够很好地完成关键词分... 为克服传统TF-IDF概念思想与关键词抽取的逻辑相冲问题,引入卡方校验的方法优化TFIDF算法,设计了一个包含文件存储、文本预处理、度量值计算、排序抽取和优化输出4个流程的关键词抽取系统。实验结果表明,该系统能够很好地完成关键词分类抽取的任务,可为数据检索、文本聚类、摘要生成等提供基础支持。 展开更多
关键词 关键词抽取 tf-idf算法 卡方校验
在线阅读 下载PDF
基于TF-IDF算法的新词发现系统原理与实现 被引量:6
16
作者 金宇杰 袁明 《信息化研究》 2020年第5期39-44,共6页
为正确及时发现互联网新出现的各类网络用语和新词,文章提出基于TF-IDF算法的新词发现系统,自动识别并筛选关键新词,解决网络舆情工作中被动识别和手动添加新词的问题,帮助相关人员监测网络舆情并及时进行处理。
关键词 tf-idf算法 新词发现 网络舆情 数据采集
在线阅读 下载PDF
改进型TF-IDF算法在软件开发过程控制中的应用
17
作者 张鲲 《重庆科技学院学报(自然科学版)》 CAS 2014年第5期137-140,共4页
软件企业随着业务的积累与规模的增加,其所积累的领域知识与开发过程材料也变得愈加丰富。这些知识对于企业的发展有重要的意义,但由于内容庞大,难以转化为对当前工作的支持。为了解决这一问题,提出使用中文分词相关技术对企业知识自动... 软件企业随着业务的积累与规模的增加,其所积累的领域知识与开发过程材料也变得愈加丰富。这些知识对于企业的发展有重要的意义,但由于内容庞大,难以转化为对当前工作的支持。为了解决这一问题,提出使用中文分词相关技术对企业知识自动提取关键词、摘要、技术要点等以此达到快速检索企业已有知识的目的,最大程度提高软件的可重用性,为软件整个开发过程控制与信息化管理提供支持。 展开更多
关键词 中文分词 tf-idf算法 快速检索
在线阅读 下载PDF
改进的TF-IDF算法在作品抄袭判定中的应用——以《梦里花落知多少》和《圈里圈外》为例 被引量:1
18
作者 吉志薇 《文教资料》 2014年第31期120-124,共5页
TF-IDF算法在文本相似性的度量中有着广泛地应用,但也存在着明显的缺陷。本文运用一种综合考虑词频、逆向文本频率、类间信息熵和类内信息熵四个方面的改进的TF-IDF算法计算了郭敬明的《梦里花落知多少》和庄羽的《圈里圈外》的相似性... TF-IDF算法在文本相似性的度量中有着广泛地应用,但也存在着明显的缺陷。本文运用一种综合考虑词频、逆向文本频率、类间信息熵和类内信息熵四个方面的改进的TF-IDF算法计算了郭敬明的《梦里花落知多少》和庄羽的《圈里圈外》的相似性,从定量的角度判定了前者的确抄袭了后者。 展开更多
关键词 tf-idf算法 文本相似度 梦里花落知多少 圈里圈外
在线阅读 下载PDF
基于TF-IDF算法的文本量化方法及作者识别应用 被引量:2
19
作者 李楚 《现代信息科技》 2022年第19期1-6,12,共7页
作者识别任务旨在找到匿名文本的作者,在互联网蓬勃发展的时代,准确识别出匿名文本的作者对维护网络环境的安全有着积极作用。在该任务中,文本内容的量化非常关键,能直接影响作者识别的准确率。基于词频-逆文档频率(TF-IDF)算法,文章提... 作者识别任务旨在找到匿名文本的作者,在互联网蓬勃发展的时代,准确识别出匿名文本的作者对维护网络环境的安全有着积极作用。在该任务中,文本内容的量化非常关键,能直接影响作者识别的准确率。基于词频-逆文档频率(TF-IDF)算法,文章提出了一种文本量化方法将文本转变为向量。为评估闵可夫斯基距离和余弦相似度识别作者的共同作用,提出了一种混合距离用于计算两个文本之间的距离。实验结果显示在中英文两种数据集上,运用提出的量化方法量化文本能有效提高支持向量机、K近邻和闵可夫斯基距离(p=1和p=2)识别文本作者的准确率。 展开更多
关键词 作者识别 文本量化 tf-idf算法 文本距离
在线阅读 下载PDF
基于TF-IDF算法的自动派单系统建设方案
20
作者 王小栋 王轶峰 +2 位作者 宗钰 谢劲鸥 吴敏 《自动化应用》 2022年第3期109-112,共4页
由于非抢修工单都是由人工进行接收和派发,即使工单量非常少,也需要有人员值班,时刻关注工单情况,对工单进行接收和派发,由此降低了工作效率和应急处置能力。为了解决以上问题,提出一种基于TF-IDF算法的自动派单系统建设方案。该建设方... 由于非抢修工单都是由人工进行接收和派发,即使工单量非常少,也需要有人员值班,时刻关注工单情况,对工单进行接收和派发,由此降低了工作效率和应急处置能力。为了解决以上问题,提出一种基于TF-IDF算法的自动派单系统建设方案。该建设方案解决了非抢修工单都是由人工进行接收和派发的问题,在自动派发环节,使用TF-IDF算法提取工单关键字,帮助坐席人员迅速完成工作,减轻工单处理人员和服务人员的工作量,提高管理水平与用户满意度,降低因此产生的投诉率,从而提高公司在民间的企业形象。 展开更多
关键词 工单 tf-idf算法 自动派发 关键字 自动接收
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部