期刊文献+
共找到1,408篇文章
< 1 2 71 >
每页显示 20 50 100
基于TF-IDF和面向学科的图书推荐方法研究与实践
1
作者 沈静萍 张旭 韩立峰 《微型电脑应用》 2025年第3期210-214,219,共6页
随着智慧图书馆建设的不断发展,图书推荐已成为图书馆智慧服务的重要项目之一。传统的基于协同过滤的图书推荐方法主要基于个体用户的阅读历史和评价,未考虑图书本身的特征对推荐结果的影响,存在较大的用户-物品矩阵稀疏性,推荐偏差大... 随着智慧图书馆建设的不断发展,图书推荐已成为图书馆智慧服务的重要项目之一。传统的基于协同过滤的图书推荐方法主要基于个体用户的阅读历史和评价,未考虑图书本身的特征对推荐结果的影响,存在较大的用户-物品矩阵稀疏性,推荐偏差大。为此,从学科角度分析用户和图书特征,将推荐对象聚类为不同的学科群体,通过训练词频-逆文档频率(TF-IDF)算法从图书题名和文摘中提取图书特征词,构建图书—特征词—特征词权重矩阵;从学科群体用户的借阅历史中获取其阅读偏好,推荐与偏好内容相似的图书,实现对不同学科用户的精准推荐。结果证明所提方法具有较高的精准度和非热门图书曝光率,对深化学科建设、构建学院学科图书馆、提升馆藏资源利用率具有很好的实践意义。 展开更多
关键词 TF-idf算法 学科 图书推荐 个性化推荐 阅读偏好
在线阅读 下载PDF
基于TF-IDF和GloVe算法面向多种类别文本自动分类系统的优化研究
2
作者 刘爱琴 王上丹 《新世纪图书馆》 2025年第10期40-46,共7页
通过检索关键词,指定一个或多个类别标签实现文本的高效组织和自动分类,是发现文档中的隐含关系、推动知识传播和创新的重要途径。然而,检索关键词的获取位置、词性以及选取是否全面等因素,会导致关键词语义信息缺失和关键词识别准确性... 通过检索关键词,指定一个或多个类别标签实现文本的高效组织和自动分类,是发现文档中的隐含关系、推动知识传播和创新的重要途径。然而,检索关键词的获取位置、词性以及选取是否全面等因素,会导致关键词语义信息缺失和关键词识别准确性较差;这两大问题,正是影响文档高效、精准自动分类的突出障碍。基于此,论文构建了一个融合TF-IDF(Term Frequency-Inverse Document Frequency)和GloVe(Global Vectors for Word Representation)的文本自动分类系统。该系统首先就词性影响因子和位置权重系数对TF-IDF算法进行改进,以弥补传统TF-IDF算法在关键词识别和语义分析上的不足;其次,使用GloVe模型对关键词集进一步扩充,使文本自动分类的准确率和召回率分别达到92.6%和90.9%;最后,通过实验比对,进一步验证该系统在处理多类别文本自动分类任务中的有效性。 展开更多
关键词 TF-idf算法 GloVe模型 文本自动分类 关键词位置 词性 语义扩展
在线阅读 下载PDF
基于TF-IDF算法的无线传感网络攻击流量检测方法研究 被引量:1
3
作者 王晨 刘鑫 《传感技术学报》 北大核心 2025年第4期744-748,共5页
无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归... 无线传感网络攻击流量类型较多,攻击流量检测方法难以满足多类型的流量数据,导致检测精度较差,为此提出基于TF-IDF算法的无线传感网络攻击流量检测方法。首先划分无线传感网络流量为连续型和离散型两类,采用独热编码处理连续型流量,归一化处理离散型流量;然后通过TF-IDF算法提取无线传感网络流量特征,利用特征向量集训练多通道自编码器,利用TF-IDF算法计算待检测的攻击流量数据特征在无线传感网络流量内出现的频率,以此对攻击流量进行排序;最后通过Softmax分类器输出最终流量类型检测结果。仿真结果表明,所提方法的检测精确度最低值为97.05%,虚警率最高值为2.01%、测试时间平均值为20.1 s,证明所提方法能高效、精确地实现无线传感网络攻击流量检测。 展开更多
关键词 无线传感网络 攻击流量检测 TF-idf算法 多通道自编码器
在线阅读 下载PDF
基于熵优化的TF-IDF算法研究
4
作者 王逸蓓 王芳 《燕山大学学报》 北大核心 2025年第5期422-428,共7页
传统的TF-IDF(Term Frequency-Inverse Document Frequency)算法通过特征项的频率对文本特征项进行表示,然而该算法在考虑类别分布信息存在一定的局限性,即忽略了特征项在类内和类间分布。针对这一问题,本文首先提出基于信息熵优化的TF-... 传统的TF-IDF(Term Frequency-Inverse Document Frequency)算法通过特征项的频率对文本特征项进行表示,然而该算法在考虑类别分布信息存在一定的局限性,即忽略了特征项在类内和类间分布。针对这一问题,本文首先提出基于信息熵优化的TF-IDF算法,引入去中心化词频因子和信息熵,捕捉特征项在类内和类间的分布特征。在此基础上,进一步结合期望信息熵理论,提出基于期望交叉熵优化的TF-IDF算法。通过对比实验,基于信息熵优化的TF-IDF算法一定程度上提升了模型性能,但基于期望交叉熵优化的TF-IDF算法在精度、召回率和F1值上表现更佳。 展开更多
关键词 TF-idf 特征项 词频 期望交叉熵
在线阅读 下载PDF
基于网络爬虫与TF-IDF算法的非遗产品创新
5
作者 王菁 杨晓翔 《佳木斯大学学报(自然科学版)》 2025年第8期52-54,74,共4页
非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统T... 非遗产品创新无法满足当前流行趋势,提出基于网络爬虫与TF-IDF算法的非遗产品创新方法。以百度百科、天猫商城为对象基于网络爬虫技术爬取非遗产品创新热点的网络词条,构造一个语料库粗糙集;利用TF-IDF算法对语料库进行精确搜索,在传统TF-IDF算法中引入词跨度,选取权重最高的前n个作为非遗产品创新设计的关键词,获得符合非遗产品创新设计需求的结果。测试结果显示:该方法抽取的非遗创新关键词与人工抽取结果更契合,准确度均在90%以上,基于网络爬虫与TF-IDF算法的非遗产品创新具有良好的推广应用前景。 展开更多
关键词 网络爬虫 TF-idf算法 语料库 词频率 非遗创新 产品
在线阅读 下载PDF
基于电网对账系统的TF-IDF优化算法
6
作者 王岩 郭威 +1 位作者 隋海滨 符贵谦 《兵工自动化》 北大核心 2025年第4期83-87,共5页
为提高电网集团对账系统的工作效率,优化电网集团的服务效果,设计一种TF-IDF词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)优化算法。论述电网集团对账系统的基本设计,讨论服务器和浏览器(browser/server,B/S... 为提高电网集团对账系统的工作效率,优化电网集团的服务效果,设计一种TF-IDF词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)优化算法。论述电网集团对账系统的基本设计,讨论服务器和浏览器(browser/server,B/S)架构下的TF-IDF算法优化设计方法,对B/S架构下使用TF-IDF算法优化设计在电网系统中的综合应用效果进行分析。结果表明:该算法的对账效果提升明显,为优化电网对账系统提供了技术基础,为提升电网集团服务质量做出了贡献。 展开更多
关键词 电网集团 B/S架构 TF-idf算法 电网对账系统 对账效果
在线阅读 下载PDF
TF-IDF和Word2Vec组合算法的招标工程量清单标准化方法研究
7
作者 潘定才 钱琪琪 万正东 《建筑经济》 2025年第S1期137-141,共5页
为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先... 为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先将文本进行向量化表示,然后根据文本的特征,使用余弦相似度的方法,对招标工程量清单的相似度进行计算,根据相似度水平,进而实现招标工程量清单和标准化招标工程量清单差异的智能识别和智能比对检查,以提升招标工程量清单编制质量和编制效率。结果表明,使用TF-IDF和Word2Vec组合方法和使用单一模型相比,对招标工程量清单识别的准确性更高,效果更好,具有较好的应用前景。 展开更多
关键词 标准化清单 TF-idf Word2Vec 相似度 文本识别
在线阅读 下载PDF
基于机器学习与TF-IDF、Word2Vec的文本情感分析
8
作者 张立伟 曹佳慧 +2 位作者 陆傲鹏 魏鸣辰 张庆莉 《电脑与信息技术》 2025年第4期23-26,共4页
在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Ve... 在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Vec算法与传统机器学习模型相结合,分别用TF-IDF和Word2Vec算法提取文本情感特征,构建机器学习模型,如随机梯度下降(Stochastic-Gradient-Descent,SGD)、支持向量机(Support-VectorMachine,SVM)等,计算精确率、召回率和F1值来评估模型性能。实验结果及评测显示,Word2Vec-SVM模型在文本情感分类中的F1值达0.958 2,能够取得较好的文本情感分类效果。 展开更多
关键词 TF-idf Word2Vec 机器学习 SVM 文本情感分析
在线阅读 下载PDF
基于改进TF-IDF的FastText新闻文本分类算法
9
作者 李卫卫 葛欣杭 刘晓丹 《电脑与电信》 2025年第1期27-31,共5页
新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本... 新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本数据,以验证该模型的分类性能。实验结果表明,所提分类模型的财经新闻文本分类精确率达到95.82%,相较于对比方案,最高提升6.91%,证明所提方案具有一定的有效性以及可行性,能够有效提升新闻文本分类效果。 展开更多
关键词 新闻文本分类 FastText 特征因子 离散度 改进TF-idf
在线阅读 下载PDF
基于TF-IDF加权机制的交通事故致因关联规则挖掘研究
10
作者 熊杰 李慧 《农业装备与车辆工程》 2025年第10期113-119,共7页
基于我国西部M市2023—2024年道路交通事故数据,围绕“人-车-路-环境-管理”五大致因维度构建系统性变量体系,引入事故参与方数量作为致因复杂度代理指标,利用TF-IDF加权机制优化Apriori算法,通过对伤亡事故复合致因模式的挖掘,提升低... 基于我国西部M市2023—2024年道路交通事故数据,围绕“人-车-路-环境-管理”五大致因维度构建系统性变量体系,引入事故参与方数量作为致因复杂度代理指标,利用TF-IDF加权机制优化Apriori算法,通过对伤亡事故复合致因模式的挖掘,提升低频高价值致因的识别能力。研究结果显示:车辆违法(不按规定让行、违反信号灯)与行人违法穿行是导致伤亡事故的核心因素;低能见度、交通设施效能不足加剧了事故风险;“刮撞行人”的事故形态在人员受伤中高频出现;死亡事故呈现人、车、路、环境、管理多因素交织的复合致因,可为交通事故预防与差异化治理提供理论与方法参考。 展开更多
关键词 交通事故 致因分析 关联规则挖掘 TF-idf加权
在线阅读 下载PDF
应急决策文本的多维语义挖掘方法——基于TF-IDF和PMI的技术框架
11
作者 邓云峰 冯永康 王双燕 《中国安全生产科学技术》 北大核心 2025年第5期36-45,共10页
为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词... 为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词和LTP平台的依存句法分析,挖掘文本中的目标和行动信息,利用TF-IDF算法和词云图展示关键行动,然后通过PMI构建复杂网络,揭示行动间的关联性和决策偏好。研究结果表明:结合应急行动分类体系,TF-IDF算法能精确提取文本中目标和行动信息,以频次反映行动的受关注程度,为理解决策者的决心和意图提供支持;PMI和改良PMI方法能有效挖掘行动的共现关系,揭示行动之间的关联性和决策偏好,其中PMI方法适合分析行动之间的平均相关性,而改良PMI方法能识别出低频高权重的行动关联。研究结果可为分析决策行为特征,细化实化应急决策部署提供可扩展的支持性工具。 展开更多
关键词 应急决策文本 词频-逆文档频率 点互信息 关联性分析 复杂网络 依存句法分析
在线阅读 下载PDF
基于TF-IDF算法的运营商客户投诉原因研究 被引量:6
12
作者 张爱华 孙嘉鸿 《北京邮电大学学报(社会科学版)》 2024年第2期39-49,共11页
针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值... 针对运营商人工处理客户投诉工单高成本低效率问题,提出了一种基于TF-IDF算法的定量研究方法,旨在高效精准地识别客户投诉原因。选用Jieba分词,导入自定义词典和停用词列表,对运营商客户投诉工单进行关键词抽取,获取各类问题中TF-IDF值排名前6的关键词,输出关键词集。提高了关键词抽取的准确性和效率。此外,对比仅对文档集使用TF进行统计和使用TextRank算法的情况,突显了IDF的重要性及算法原理的差异。实验结果表明,光猫、路由器、机顶盒问题广泛存在于各类投诉中。针对这三类问题,为运营商提供了改进产品、服务的相关建议,对运营商集中治理、解决问题具有一定的实用价值。 展开更多
关键词 投诉工单 投诉原因 关键词抽取 TF-idf
在线阅读 下载PDF
基于TF-IDF算法的通信工单分类处理与分配研究
13
作者 樊广佺 黄劲佐 +3 位作者 金天顺 宋昭昭 张少娜 裴康 《新一代信息技术》 2024年第4期6-10,共5页
本文针对某通信公司大量工单处理效率低下的问题,提出了一种基于词频-逆向文件频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法的文本分类与协同过滤推荐系统结合的优化方案,提升工单分类的准确性和推荐的合理性。对工单... 本文针对某通信公司大量工单处理效率低下的问题,提出了一种基于词频-逆向文件频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法的文本分类与协同过滤推荐系统结合的优化方案,提升工单分类的准确性和推荐的合理性。对工单中的客户问题进行数据预处理,包括分词、去除停用词及文本清理,结合客户提出问题的渠道等多维特征,采用TF-IDF方法对问题文本进行特征提取,通过支持向量机(Support Vector Machines,SVM)模型对工单内容进行最优分类超平面处理,使不同类别的工单之间的间隔最大化,并通过决策函数对新工单进行分类。某通信公司可以借此高效分类用户工单,并为不同类别的工单制定专门的处理流程,提升工作效率和客户满意度。 展开更多
关键词 工单处理 TF-idf 工单分类 特征提取
在线阅读 下载PDF
基于TF-IDF和多头注意力Transformer模型的文本情感分析 被引量:19
14
作者 高佳希 黄海燕 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期129-136,共8页
文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Documen... 文本情感分析旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理,是自然语言处理中一项重要任务。针对现有的计算方法不能充分处理复杂度和混淆度较高的文本数据集的问题,提出了一种基于TF-IDF(Term Frequency-Inverse Document Frequency)和多头注意力Transformer模型的文本情感分析模型。在文本预处理阶段,利用TF-IDF算法对影响文本情感倾向较大的词语进行初步筛选,舍去常见的停用词及其他文本所属邻域对文本情感倾向影响较小的专有名词。然后,利用多头注意力Transformer模型编码器进行特征提取,抓取文本内部重要的语义信息,提高模型对语义的分析和泛化能力。该模型在多领域、多类型评论语料库数据集上取得了98.17%的准确率。 展开更多
关键词 文本情感分析 自然语言处理 多头注意力机制 TF-idf算法 Transformer模型
在线阅读 下载PDF
基于TF⁃IDF算法的舆情分析研究——以日本排放核废水事件为例 被引量:2
15
作者 杜宇灏 李环宇 林晓霞 《现代计算机》 2024年第23期108-112,共5页
日本核废水排海事件在互联网引起了极大的反响,迅速放大扩散到社会多个方面形成了一次舆情事件,在一定程度上影响到了社会管理甚至社会的安定。由此可见及时捕捉网络舆情,分析其特点,相关职能部分据此采取化解防范措施,已经成为当前亟... 日本核废水排海事件在互联网引起了极大的反响,迅速放大扩散到社会多个方面形成了一次舆情事件,在一定程度上影响到了社会管理甚至社会的安定。由此可见及时捕捉网络舆情,分析其特点,相关职能部分据此采取化解防范措施,已经成为当前亟待解决的问题。针对这一需求,开发了一个基于TF⁃IDF和Word2Vec算法的舆情监测程序。首先对微博内容文本进行清洗和分词处理,后利用TF⁃IDF算法提取微博文本关键词;其次按照关键词权重排序并生成词云图;最后将单词转换为高维向量并可视化在二维平面上,为舆情监测提供决策依据。 展开更多
关键词 核废水 舆情监测 TF⁃idf 可视化
在线阅读 下载PDF
基于改进TF-IDF和AGLCNN的新闻长文本分类模型 被引量:2
16
作者 周宪溪 牟莉 《计算机与现代化》 2024年第8期120-126,共7页
新闻长文本分类是自然语言处理中的一项重要任务,但传统的文本表示方法存在特征稀疏、语义不足等问题。此外,新闻长文本含有大量的冗余信息,并且可能涉及其他主题,以上问题都会导致文本特征提取不全面。为此,本文提出一种基于改进TF-ID... 新闻长文本分类是自然语言处理中的一项重要任务,但传统的文本表示方法存在特征稀疏、语义不足等问题。此外,新闻长文本含有大量的冗余信息,并且可能涉及其他主题,以上问题都会导致文本特征提取不全面。为此,本文提出一种基于改进TF-IDF算法和AGLCNN的新闻长文本分类模型。该模型首先利用特征项在类间与类内分布情况及其位置信息来改进TF-IDF算法,并结合Word2Vec词向量进行文本表示;利用注意力机制突出关键字信息,输入至Bi-LSTM捕获文本上下文特征;接着利用CNN突出新闻主题的显著特征;考虑到新闻长文本中可能存在涉及其他主题信息的句子,引入门控机制对Bi-LSTM和CNN输出特征进行融合,获得最终的文本特征表示;最后,将特征向量输入Softmax层进行新闻分类。在THUCNews数据集和搜狐新闻数据集上进行对比实验,结果表明,所提模型在2个数据集上的召回率分别为0.985和0.976,优于其他分类模型。 展开更多
关键词 文本分类 TF-idf 注意力机制 卷积神经网络 特征项
在线阅读 下载PDF
探索中文预训练模型的混合粒度编码和IDF遮蔽
17
作者 邵云帆 孙天祥 邱锡鹏 《中文信息学报》 CSCD 北大核心 2024年第1期57-64,共8页
目前大多数中文预训练语言模型采用字级别编码,因为字符级编码序列长而产生大量计算开销。词级别编码尽管能够缓解这一问题,但也会带来其他问题,如词典外词、数据稀疏等。针对中文不同粒度的编码,该文提出使用混合粒度编码的中文预训练... 目前大多数中文预训练语言模型采用字级别编码,因为字符级编码序列长而产生大量计算开销。词级别编码尽管能够缓解这一问题,但也会带来其他问题,如词典外词、数据稀疏等。针对中文不同粒度的编码,该文提出使用混合粒度编码的中文预训练模型。这一编码所用的词表在大规模预训练语料上得到,因此缓解了词典外词和数据稀疏问题。为了更进一步增强模型性能,该文提出了一种选择性的遮蔽语言建模训练策略——IDF遮蔽。这一策略基于词在大规模预训练语料上统计的逆文档频率。实验表明,与之前的中文预训练语言模型相比,该文所提出方法预训练的模型在多个中文自然语言数据集上取得了更好或相当的性能,并且能更高效地编码文本。 展开更多
关键词 中文预训练 混合粒度编码 idf遮蔽
在线阅读 下载PDF
基于改进TF-IDF融合二进制灰狼优化的短文本分类
18
作者 杨东 毋涛 +1 位作者 赵雪青 李猛 《计算机技术与发展》 2024年第8期37-41,共5页
为了提高特殊类型短文本分类准确度和降低特征维度,提出了基于改进TF-IDF方法融合二进制灰狼优化的短文本分类。为了提高特征向量文本权重计算准确度,提出了点赞排列因子,并融合了文本特征集中度,对附有点赞数的特殊类型文本进行权重计... 为了提高特殊类型短文本分类准确度和降低特征维度,提出了基于改进TF-IDF方法融合二进制灰狼优化的短文本分类。为了提高特征向量文本权重计算准确度,提出了点赞排列因子,并融合了文本特征集中度,对附有点赞数的特殊类型文本进行权重计算,设计改进了TF-IDF-RANK方法对特征进行加权;同时,基于初选特征向量,设计优化了二进制灰狼优化算法(BGWO)搜寻最优特征子集,引入衰减系数向量和多优解迭代机制,提高灰狼搜寻性能。结果表明,该方法有效地提升了权重准确率,更好地表征初选特征向量,增强特征选择时寻找全局最优解的能力,进而提高短文本的分类效果。通过LABIC和抖音开放平台数据集测试,综合指标F1值分别提高了14.76%和14.02%,验证了该方法对于特殊类型文本分类的有效性。 展开更多
关键词 短文本分类 特征加权 TF-idf-RANK方法 特征选择 二进制灰狼优化
在线阅读 下载PDF
长三角一体化发展特征与动力探究——基于TF-IDF算法与格兰杰检验
19
作者 关硕 赵雪 刘毅 《科技和产业》 2024年第5期40-47,共8页
从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设... 从政策观念视角出发,深入探讨长三角区域一体化发展进程,有助于洞察区域内生发展动力和经济增长潜力。应用话语制度主义和间断-均衡框架,结合TF-IDF(词频-逆文档频率)算法与格兰杰检验,揭示长三角一体化发展特征与动因。研究发现:建设主体对5个发展目标的注意力分配不均衡;在创新共建目标方面,地方主体的注意力变动会引起中央主体的注意力变动;长三角一体化发展呈现小间断大均衡特征,体现“自下而上”的地方主导模式。 展开更多
关键词 长三角一体化 话语制度主义 间断-均衡框架 TF-idf(词频-逆文件频率)算法 格兰杰检验
在线阅读 下载PDF
Research on User Profile Construction Method Based on Improved TF-IDF Algorithm
20
作者 SHAO Ze-ming LI Yu-ang +4 位作者 YANG Ke WANG Guo-peng LIU Xing-guo CHEN Han-ning SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第6期110-116,共7页
In the data-driven era of the internet and business environments,constructing accurate user profiles is paramount for personalized user understanding and classification.The traditional TF-IDF algorithm has some limita... In the data-driven era of the internet and business environments,constructing accurate user profiles is paramount for personalized user understanding and classification.The traditional TF-IDF algorithm has some limitations when evaluating the impact of words on classification results.Consequently,an improved TF-IDF-K algorithm was introduced in this study,which included an equalization factor,aimed at constructing user profiles by processing and analyzing user search records.Through the training and prediction capabilities of a Support Vector Machine(SVM),it enabled the prediction of user demographic attributes.The experimental results demonstrated that the TF-IDF-K algorithm has achieved a significant improvement in classification accuracy and reliability. 展开更多
关键词 TF-idf-K algorithm User profiling Equalization factor SVM
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部