期刊文献+
共找到639篇文章
< 1 2 32 >
每页显示 20 50 100
基于词典-TextCNN-Word2Vec组合模型的在线评价细粒度情感分析 被引量:7
1
作者 惠调艳 王智 +1 位作者 何振华 秦春秀 《情报理论与实践》 北大核心 2025年第2期168-177,共10页
[目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protég&#... [目的/意义]线上购物逐渐成为消费主流,在线情感评价成为消费者购买、厂商产品改进的重要决策依据。[方法/过程]深度挖掘商品显性和隐性属性特征,提出了融合词典-TextCNN-Word2Vec的在线评价细粒度情感分析模型。首先,利用Protégé软件和Pellet推理机推理等,构建了涵盖外观、硬件、软件、价格、质量、物流和服务7大主题维度的领域本体模型,并建立属性特征词典和情感词典;其次,针对三类在线评价,分别应用基于词典的显性属性情感分析模型、基于TextCNN的显性特征情感分类模型、基于Word2Vec的隐性特征情感分析模型,计算属性特征词的情感值;最后,通过词频加权法和熵权法,自下而上计算各层级主题属性的情感值,实现了多层次细粒度的情感挖掘。[结果/结论]综合基于词典、TextCNN和Word2Vec情感属性映射的三种模型的在线情感分析,显著提高了商品属性特征和情感分析的准确性,商品显性和隐性属性特征的总提取率高达93.77%,商品特征情感分析的加权平均准确率为86.78%。该组合模型为数字经济时代商品多属性特征的细粒度在线情感评价提供了创新研究方法。 展开更多
关键词 细粒度情感分析 情感词典 TextCNN word2vec
原文传递
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
2
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 LDA主题模型 word2vec词嵌入算法
在线阅读 下载PDF
基于LDA-Word2vec的人工智能技术主题演化与热点主题识别
3
作者 王向前 高润凤 李慧宗 《九江学院学报(自然科学版)》 2025年第2期19-31,共13页
为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主... 为识别人工智能关键技术,深入研究人工智能技术发展态势,有助于国家和企业及时把握人工智能发展动向,本文以人工智能领域中2009—2023年的专利文献为基础,融合运用LDA模型和Word2vec词向量技术,从主题强度和内容双重维度系统考察技术主题的动态演变过程,同时构建主题热度、新颖度、影响力指标识别人工智能阶段性的热点主题。研究结果表明:①结合LDA主题建模能力和Word2vec语义处理能力能够有效提升技术主题识别精度,直观呈现人工智能领域细粒度技术主题的演化规律与特征;②人工智能领域的技术主题主要分为核心算法与技术基础、感知与交互技术、自然语言与语义理解、数据处理与安全、智能应用与自动化5大类范畴,且主题之间的关联和互动日益紧密;③通过对设计的指标进行综合评估,可以较好识别2009—2014年、2015—2019年和2020—2023年3个不同阶段的热点技术主题。 展开更多
关键词 人工智能 LDA模型 主题识别 word2vec 主题演化 热点技术主题
在线阅读 下载PDF
基于Word2Vec模型的泥石流多源灾害数据融合研究 被引量:1
4
作者 晋磊 徐鹏 +2 位作者 黎杰 蔡迎春 杨海波 《人民黄河》 北大核心 2025年第7期97-102,共6页
在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合... 在大数据、物联网与人工智能技术快速发展的背景下,泥石流灾害数据正日益呈现出海量、多源、异构的特点。主要采用jieba、NLPIR和LTP等分词工具抽取模型库,对非结构化存储的泥石流灾害数据进行解析与抽取,并汇聚至数据库,实现数据融合。通过Word2Vec模型将词语映射到高维空间中,实现文本中的词汇转换为实数向量;采用t-SNE算法和Kernel PCA算法将高维词向量转换为低维度的向量,使用K-means算法对其进行聚类可视化。研究结果表明:在数据抽取评估方面,一致性、完整性、准确性的评估均值在0.800以上,均方差小于0.050。对比PCA和t-SNE两种降维方法,通过轮廓系数(Silhouette Score,SS)评估聚类效果,PCA的SS指标值为0.359,t-SNE的SS指标值为0.336,结果显示PCA表现更优。Bert模型具有较强的上下文理解能力,更加适合泥石流灾害数据抽取,依托Word2Vec模型的CBOW架构获取词向量,结果显示PCA在评价指标上整体表现优于t-SNE。针对泥石流灾害数据多源和语义一致性问题,涵盖从数据抽取、降维到聚类的全过程,为实现泥石流灾害数据的语义融合与统一管理提供了有效支持。 展开更多
关键词 泥石流灾害 知识抽取 质量评估 知识融合 word2vec
在线阅读 下载PDF
基于Word2vec的哈萨克文词向量化模型的实现
5
作者 吾塔嗯拜克·阿萨汗 亚森·艾则孜 阿依努尔·努尔太 《数字通信世界》 2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源... 词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。 展开更多
关键词 哈萨克文 word2vec 词向量 相似度分析
在线阅读 下载PDF
基于Word2vec-CNN与情感词典的情感分析模型构建及性能对比
6
作者 戴鹏 麻翊晨 +1 位作者 张静 裘坚杰 《信息系统工程》 2025年第4期129-132,共4页
情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化... 情感分析是自然语言处理(NLP)领域的重要任务,广泛应用于舆情监测、产品评价分析等领域。传统的情感词典方法因高可解释性和低计算成本,在计算资源受限的环境下仍具有一定应用价值。然而,该方法难以处理新词、隐喻等复杂情感表达,泛化能力有限。为提升情感分析的准确率和鲁棒性,构建了基于Word2vec-CNN的深度学习情感分析模型,并将其与情感词典方法在NLPCC 2014数据集上进行实验对比。 展开更多
关键词 情感分析 word2vec 卷积神经网络(CNN) 情感词典
在线阅读 下载PDF
基于机器学习与TF-IDF、Word2Vec的文本情感分析
7
作者 张立伟 曹佳慧 +2 位作者 陆傲鹏 魏鸣辰 张庆莉 《电脑与信息技术》 2025年第4期23-26,共4页
在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Ve... 在目前网络环境下,由于各社交平台发言难度低,网络空间中往往充斥着大量不和谐评论。为了净化网络环境,需要对网络热点话题进行快速、准确的舆情判断,采用词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)、Word2Vec算法与传统机器学习模型相结合,分别用TF-IDF和Word2Vec算法提取文本情感特征,构建机器学习模型,如随机梯度下降(Stochastic-Gradient-Descent,SGD)、支持向量机(Support-VectorMachine,SVM)等,计算精确率、召回率和F1值来评估模型性能。实验结果及评测显示,Word2Vec-SVM模型在文本情感分类中的F1值达0.958 2,能够取得较好的文本情感分类效果。 展开更多
关键词 TF-IDF word2vec 机器学习 SVM 文本情感分析
在线阅读 下载PDF
TF-IDF和Word2Vec组合算法的招标工程量清单标准化方法研究
8
作者 潘定才 钱琪琪 万正东 《建筑经济》 2025年第S1期137-141,共5页
为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先... 为进一步发挥标准化招标工程清单的作用,提高招标工程量清单的准确性,及时发现招标工程量清单中漏项、项目特征不规范、逻辑不合理等问题,本文引入TF-IDF和Word2Vec组合方法,进而提出一种兼顾文本特征和语义特征的文本特征提取算法,先将文本进行向量化表示,然后根据文本的特征,使用余弦相似度的方法,对招标工程量清单的相似度进行计算,根据相似度水平,进而实现招标工程量清单和标准化招标工程量清单差异的智能识别和智能比对检查,以提升招标工程量清单编制质量和编制效率。结果表明,使用TF-IDF和Word2Vec组合方法和使用单一模型相比,对招标工程量清单识别的准确性更高,效果更好,具有较好的应用前景。 展开更多
关键词 标准化清单 TF-IDF word2vec 相似度 文本识别
在线阅读 下载PDF
我国慢性病医防融合领域文献主题演化——基于Word2vec与LDA模型的可视化分析
9
作者 李艳 唐岚 黄豪 《临床医学进展》 2025年第3期980-989,共10页
为了深入研究我国慢性病医防融合领域的发展趋势和演化过程,本文收集了2006~2024年的373篇相关文献,经过数据清洗和预处理后,引入Word2vec的LDA模型进行文献的主题挖掘,确定每个时期的最佳主题数量,并生成主题演化桑基图。计算不同时间... 为了深入研究我国慢性病医防融合领域的发展趋势和演化过程,本文收集了2006~2024年的373篇相关文献,经过数据清洗和预处理后,引入Word2vec的LDA模型进行文献的主题挖掘,确定每个时期的最佳主题数量,并生成主题演化桑基图。计算不同时间段内各主题强度,并通过交互式条形图描述热点主题。结果显示,在第一阶段2006~2020年,大部分研究主要集中在如何整合医疗服务,以及如何将慢性病防控与医防结合;在第二阶段2021~2022年,除了延续既有的主题,部分研究焦点转移到如何更好地管理和融合综合医疗服务,以及如何将公共卫生服务与医疗体系更有效地结合;在第三阶段2023~2024年,研究重点在于如何实现健康服务与医防的深度融合,以及如何在医疗服务中具体落实医防融合的理念,研究更加注重实际操作和具体应用。通过主题演化分析揭示了不同时期内主题之间的关联和演化过程,综合医疗服务、慢性病防控与医防结合等主题在不同阶段都有较强的延续性,而研究重点随着时间的推移逐渐从综合医疗服务向医防融合和健康服务管理方向转移。研究发现,一些主题在不同时期内保持较高的强度,从本研究主题强度图可以看出,在慢性病医防融合领域,社区基层医疗机构在医防融合中具有重要作用,此外2021年及以后的阶段中公共卫生体系建设及医防融合成为研究的共识热点。该研究有助于更全面地理解慢性病医防融合领域的研究动态,为未来的研究方向和政策制定提供有益的参考,同时也为文本分析方法的应用提供了实践示范。未来的研究可以进一步挖掘基层医疗与医防协同机制以及健康服务管理与慢性病防控方面的潜力,更好地帮助社区基层医疗机构服务提供者应对来自人口老龄化社会慢性病高发以及多样化健康需求的挑战,同时也要关注对应的新兴技术如人工智能和大数据分析和对应的数据隐私和伦理挑战,以及政策实施中的风险。In this paper, in order to deeply study the development trend and evolution process in the field of chronic disease medical preventive integration in China, 373 relevant literatures from 2006~2024 were collected, and after data cleaning and pre-processing, the LDA model of Word2vec was introduced in the theme mining of the literature to determine the optimal number of themes in each period and generate the theme evolution Sankey diagram. The intensity of each topic in different time periods is calculated and hot topics are described by interactive bar charts. The results show that in the first period of 2006~2020, most of the studies focused on how to integrate healthcare services and how to combine chronic disease prevention and control with medical prevention;in the second period of 2021~2022, in addition to the continuation of the existing themes, some of the studies shifted their focus to how to better manage and integrate integrated healthcare services and how to combine public health services with the healthcare system more effectively;in the third stage, 2023~2024, the research focused on how to realize the deep integration of health services and medical preventive, and how to implement the concept of medical prevention integration in health care services, and the research focused more on practical operation and specific application. The analysis of theme evolution reveals the connection and evolution process between themes in different periods. The themes of comprehensive medical service, chronic disease prevention and control and medical prevention integration have strong continuity in different stages, while the focus of research gradually shifts from comprehensive medical service to medical prevention integration and health service management over time. It is found that some themes maintain a high intensity in different periods, and the intensity map of the themes in this study shows that in the field of chronic disease medical prevention integration, community-based primary healthcare organizations have an important role in medical prevention integration, and in addition, public health system construction and medical prevention integration have become consensus hotspots in research in the stage of 2021 and beyond. This study contributes to a more comprehensive understanding of the research dynamics in the field of chronic disease medical prevention integration, provides useful references for future research directions and policy formulation, and also provides a practical demonstration of the application of text analysis methods. Future research can further explore the potential of primary care and medical prevention synergistic mechanisms as well as health service management and chronic disease prevention and control to better help community-based primary care providers to cope with the challenges from the high prevalence of chronic diseases and diversified health needs of an aging population, as well as to pay attention to the corresponding emerging technologies such as artificial intelligence and big data analytics and the corresponding data privacy and ethical challenges, and the risks in policy implementation. 展开更多
关键词 文本挖掘 主题识别 LDA word2vec 慢性病 医防融合
暂未订购
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析 被引量:6
10
作者 王孟 苏进城 陈志德 《福建师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期41-51,共11页
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将... 选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。 展开更多
关键词 硕士学位论文 自然语言处理 LDA模型 word2vec模型 TextRank方法
在线阅读 下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究 被引量:3
11
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 LDA主题模型 word2vec 五年规划 文化政策 文本分析
在线阅读 下载PDF
基于Word2vec与注意力机制的情感分析研究 被引量:1
12
作者 任伟建 徐海杰 +3 位作者 康朝海 霍凤财 任璐 张永丰 《计算机与数字工程》 2024年第10期2991-2995,3147,共6页
针对传统情感分析模型对关键词特征抓取不准确、局部情感特征提取不全面造成分类效果差的问题,提出一种基于TW-BiLSTM-ATT情感分析模型。通过对TF-IDF改进,并与Word2vec结合,使权重特征融入词向量提升对关键信息的抓取能力;将词向量的... 针对传统情感分析模型对关键词特征抓取不准确、局部情感特征提取不全面造成分类效果差的问题,提出一种基于TW-BiLSTM-ATT情感分析模型。通过对TF-IDF改进,并与Word2vec结合,使权重特征融入词向量提升对关键信息的抓取能力;将词向量的位置特征融入到注意力机制中,使模型可以关注到目标词汇附近的词,进而更加全面地将情感特征提取出来。对比实验结果表明TW-BiLSTM-ATT模型在处理情感分析任务中分类效果好于同类模型。 展开更多
关键词 word2vec TF-IDF BiLSTM ATTENTION 情感分析
在线阅读 下载PDF
结合Word2vec和BiLSTM的民航非计划事件分析方法 被引量:1
13
作者 王捷 周迪 +1 位作者 左洪福 黄维 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期917-924,共8页
安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采... 安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采用Word2vec模型针对事件文本语料进行词向量训练,缩小空间向量维度;然后通过BiLSTM模型自动提取特征,获取事件文本的完整序列信息和上下文特征向量;最后采用softmax函数对民航非计划事件进行分类。实验结果表明,所提出的方法分类效果更好,能达到更优的准确率和F 1值,对不平衡数据样本同样具有较稳定的分类性能,证明了该方法在民航非计划事件分析上的适用性和有效性。 展开更多
关键词 民航安全 文本分析 非计划事件 word2vec 双向长短期记忆(BiLSTM)神经网络
在线阅读 下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:35
14
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 word2vec 主题演化 热点主题 主题影响力 主题关注度
在线阅读 下载PDF
基于Word2Vec和决策树的故障定位技术 被引量:1
15
作者 王露露 陈军华 《上海师范大学学报(自然科学版中英文)》 2024年第2期223-227,共5页
利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验... 利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验结果表明:该模型在各项目中的故障定位准确率均高于83%. 展开更多
关键词 故障定位 语义表示 word2vec 决策树
在线阅读 下载PDF
基于LSTM+Word2vec的微博评论情感分析 被引量:4
16
作者 王剑辉 闫芳序 《沈阳师范大学学报(自然科学版)》 CAS 2024年第2期138-144,共7页
微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。... 微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。采用Word2vec中的连续词袋模型(continuous bag of words,CBOW),利用语境的上下文结构及语义关系将每个词语映射为向量空间,增强词向量之间的稠密度;采用长短时记忆神经网络模型实现对文本上下文序列的线性抓取,最后输出分类预测的结果。实验结果的准确率可达95.9%,通过对照实验得到情感词典、RNN、SVM三种模型的准确率分别为52.3%、92.7%、85.7%,对比发现基于LSTM+Word2vec的深度学习情感分析模型的准确率更高,具有一定的鲁棒性和泛化性,对用户个性化推送和网络舆情监控具有重要意义。 展开更多
关键词 情感分析 word2vec 长短时记忆神经网络 社交平台 微博
在线阅读 下载PDF
基于Word2Vec模型与RAG框架的医疗检索增强生成算法 被引量:3
17
作者 刘彦宏 崔永瑞 《人工智能与机器人研究》 2024年第3期479-486,共8页
当今通用人工智能(AGI)发展火热,各大语言模型(LLMs)层出不穷。大语言模型的广泛应用大大提高了人们的工作水平和效率,但大语言模型也并非完美的,同样伴随着诸多缺点。如:敏感数据安全性、幻觉性、时效性等。同时对于通用大语言模型来讲... 当今通用人工智能(AGI)发展火热,各大语言模型(LLMs)层出不穷。大语言模型的广泛应用大大提高了人们的工作水平和效率,但大语言模型也并非完美的,同样伴随着诸多缺点。如:敏感数据安全性、幻觉性、时效性等。同时对于通用大语言模型来讲,对于一些专业领域问题的回答并不是很准确,这就需要检索增强生成(RAG)技术的支持。尤其是在智慧医疗领域方面,由于相关数据的缺乏,不能发挥出大语言模型优秀的对话和解决问题的能力。本算法通过使用Jieba分词,Word2Vec模型对文本数据进行词嵌入,计算句子间的向量相似度并做重排序,帮助大语言模型快速筛选出最可靠可信的模型外部的医疗知识数据,再根据编写相关的提示词(Prompt),可以使大语言模型针对医生或患者的问题提供令人满意的答案。Nowadays, general artificial intelligence is developing rapidly, and major language models are emerging one after another. The widespread application of large language models has greatly improved people’s work level and efficiency, but large language models are not perfect and are also accompanied by many shortcomings. Such as: data security, illusion, timeliness, etc. At the same time, for general large language models, the answers to questions in some professional fields are not very accurate, which requires the support of RAG technology. Especially in the field of smart medical care, due to the lack of relevant data, the excellent conversation and problem-solving capabilities of the large language model cannot be brought into play. This algorithm uses Jieba word segmentation and the Word2Vec model to embed text data, calculate the vector similarity between sentences and reorder them, helping the large language model to quickly screen out the most reliable and trustworthy medical knowledge data outside the model, and then write relevant prompts to enable the large language model to provide satisfactory answers to doctors or patients’ questions. 展开更多
关键词 通用人工智能 大语言模型 检索增强生成 Jieba分词 word2vec PROMPT
在线阅读 下载PDF
基于K-means与Word2vec的哺乳文胸评论主题挖掘研究
18
作者 刘妍 刘驰 《人类工效学》 2024年第2期40-45,共6页
目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义... 目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义聚类、主题识别、主题词挖掘及主题重要度计算。结果哺乳文胸评论文本聚类后的主题重要程度排名是:产品品质(45.47%)、产品外观(35.83%)、产品服务(18.79%)。结论通过该方法能够有效的识别和构建哺乳文胸主题及主题词,同时,通过主题的重要程度,能够了解消费者对于网络平台购买哺乳文胸时关注的重点方向,为哺乳内衣企业进行产品改善及生产等提供理论参考。 展开更多
关键词 服装工程 文本聚类分析 哺乳文胸 在线评论 K-MEANS word2vec 主题挖掘 主题重要程度 文献计量分析
在线阅读 下载PDF
关于Word2Vec文本分类效果若干影响因素的分析 被引量:5
19
作者 谢庆恒 《现代信息科技》 2024年第1期125-129,共5页
Word2Vec向量模型参数众多,在不同情景下分类效果不一,分析其影响因素很有必要。从Word2Vec模型基本原理出发,分析讨论了预训练语料、词向量预训练参数以及分类模型参数三大因素对模型分类效果的影响。结果表明限定域预料效果好于广域预... Word2Vec向量模型参数众多,在不同情景下分类效果不一,分析其影响因素很有必要。从Word2Vec模型基本原理出发,分析讨论了预训练语料、词向量预训练参数以及分类模型参数三大因素对模型分类效果的影响。结果表明限定域预料效果好于广域预料;预训练参数中向量维度越大,效果越好,窗口大小存在最优值,分类算法影响不大;分类模型参数中学习率、激活函数、批次大小对模型分类效果影响较大,训练轮次相对较小。 展开更多
关键词 word2vec 文本分类 模型效果 影响因素
在线阅读 下载PDF
基于Word2vec的二语教学“基本形式库”构建方法初探 被引量:1
20
作者 杨苛鑫 庄会彬 杨牧 《国际汉语教学研究》 2024年第3期76-84,共9页
二语教学中,重视表达取向的“基本形式”观致力于构建一个“基本形式库”。本文以微博语料库为例,将其中高频词设置为检索词,依据Word2vec训练的词向量进行检索,围绕检索词查找近似词来构成(准)等义组,继而进一步确定该组的“基本形式... 二语教学中,重视表达取向的“基本形式”观致力于构建一个“基本形式库”。本文以微博语料库为例,将其中高频词设置为检索词,依据Word2vec训练的词向量进行检索,围绕检索词查找近似词来构成(准)等义组,继而进一步确定该组的“基本形式”。本文初步提出了一种兼具可操作性和效率性的建设方法,作为人工建设“基本形式库”的辅助工具,并检索出了一部分基本形式(准)等义组作为前人研究的补充,为“基本形式”观理论进一步发展提供工具与思考。 展开更多
关键词 基本形式 word2vec 词向量 (准)等义组
原文传递
上一页 1 2 32 下一页 到第
使用帮助 返回顶部