期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
基于文献计量的液体有机肥研究现状及热点分析
1
作者 高梦雅 杨莉莉 +3 位作者 马龙 孟冉冉 韩璐 支金虎 《寒旱农业科学》 2026年第1期71-77,共7页
有机肥种类繁多,特点各异。顺应现代农业发展趋势的液体有机肥备受推崇,厘清研究现状以及关注热点,对有机肥的选用及今后相关研究方向具有重要指导意义。为系统把握液体有机肥的研究现状与热点,以指导科学选用及明确未来研究方向,基于... 有机肥种类繁多,特点各异。顺应现代农业发展趋势的液体有机肥备受推崇,厘清研究现状以及关注热点,对有机肥的选用及今后相关研究方向具有重要指导意义。为系统把握液体有机肥的研究现状与热点,以指导科学选用及明确未来研究方向,基于文献计量法,以“液体有机肥”为主题,对中国知网CNKI和Web of science数据库中的文献进行检索分析,重点对年度论文发表量、文献类型、主题分布、研究层次、机构分布等方面进行统计分析。结果表明,中外关于液体有机肥大规模研究始于21世纪前后;中文核心期刊论文占整体研究量的20%,英文期刊论文占整体的89%,表明国内在液体有机肥方面的深入系统核心研究相对不足;现有研究内容主要偏向液体有机肥应用效果、施用技术与产品研发,研究目的更倾向于验证新产品肥效、促进新产品的推广应用,而对它作用机理以及生态、环境方面效应的系统研究较为欠缺。本研究认为,未来可就液体有机肥的作用机制及其对生态环境方面的影响作更深入研究。 展开更多
关键词 液体有机肥 传统有机肥 主题词 文献计量 研究热点 可持续发展
在线阅读 下载PDF
基于领域术语的国内图书情报学科主题演化分析
2
作者 刘瑜 叶均玲 徐雷 《图书馆学研究》 北大核心 2025年第2期22-34,共13页
为了能从更专业、更完备的角度对图书情报学科进行主题演化分析,揭示图书情报学科的发展历程与趋势,文章以2019年出版的《图书馆·情报与文献学名词》中的术语作为主题词在中国知网平台进行检索,得到1992—2022年间各主题词出现在... 为了能从更专业、更完备的角度对图书情报学科进行主题演化分析,揭示图书情报学科的发展历程与趋势,文章以2019年出版的《图书馆·情报与文献学名词》中的术语作为主题词在中国知网平台进行检索,得到1992—2022年间各主题词出现在图书情报学科中文核心期刊的文献数量,利用探索性数据分析方法、DTW时间序列相似度算法、AP聚类算法从宏观和微观两个主题视角对数据进行分析,得出图书情报学科近30年的宏观主题演化规律以及微观主题中冷门类与热门类的趋势特征。 展开更多
关键词 主题演化 图书情报学科 领域术语
原文传递
基于词对主题模型的社区高血压患者戒烟动机与复吸诱因的主题研究 被引量:1
3
作者 陈俏名 刘玉燕 +5 位作者 吉宁 丁贤彬 贾艾楠 陈婷 刘敏 白雅敏 《卫生研究》 北大核心 2025年第1期99-105,135,共8页
目的 了解戒烟者的戒烟动机和明确引发复吸的因素。方法 2021年重庆市北碚区社区卫生服务中心所收集的156份有效高血压戒烟者访谈资料,描述戒烟者的人口学特征。使用Python 3.7程序进行词对主题模型建模,对戒烟动机及复吸诱因进行描述... 目的 了解戒烟者的戒烟动机和明确引发复吸的因素。方法 2021年重庆市北碚区社区卫生服务中心所收集的156份有效高血压戒烟者访谈资料,描述戒烟者的人口学特征。使用Python 3.7程序进行词对主题模型建模,对戒烟动机及复吸诱因进行描述和主题分析,并对复吸诱因进行时间趋势分析。结果 (1)社会人口学特征:男性147名(94.2%),女性9名(5.8%);50岁以下15例(9.6%),50~59岁44例(28.2%),60~69岁83例(53.2%),70岁及以上14例(9.0%);吸烟10年以下21例(13.5%),10~19年30例(19.2%),20~29年29例(18.6%),30~39年50例(32.1%),40年及以上26例(16.7%);吸烟频繁,每天吸烟人数120例(76.9%)。(2)主题分析:吸烟原因主要为跟别人学、好奇、朋友带动等。戒烟动机:出现健康问题、疾病、家人劝说、经济压力、医生劝说等。复吸诱因:烟瘾、与吸烟者一起、他人递烟、聚会聚餐等。(3)主题热度时间趋势:主题“烟瘾”、“与吸烟者在一起”呈上升趋势;“聚会”呈现下降趋势、“递烟”经历波动后呈现下降趋势。结论 疾病健康问题是戒烟者最主要的戒烟动机,与其他吸烟者在一起是除烟瘾外的主要复吸诱因。其他复吸诱因包括他人递烟、聚会聚餐、早上第一支烟、压力、无聊等。 展开更多
关键词 高血压 戒烟动机 复吸诱因 词对主题模型
原文传递
基于主题视角的数字保存研究综述及发展趋势
4
作者 张乃帅 王继民 《大学图书馆学报》 北大核心 2025年第6期110-122,共13页
数字保存作为保障数字资源长期可访问性的系统性管理活动,其研究动态与技术演进对数字文明传承具有战略意义。文章突破传统文献计量范式,基于Web of Science和Scopus数据库构建国际研究数据集,基于CNKI数据库构建国内研究数据集,引入BER... 数字保存作为保障数字资源长期可访问性的系统性管理活动,其研究动态与技术演进对数字文明传承具有战略意义。文章突破传统文献计量范式,基于Web of Science和Scopus数据库构建国际研究数据集,基于CNKI数据库构建国内研究数据集,引入BERTopic动态主题建模技术,通过主题强度分析、时间序列演化图谱和跨域主题网络关联,对数字保存领域的研究主题、发展趋势及知识结构进行多维度解析。研究发现,国内研究与国际研究相比,在研究全面性、研究侧重点、研究趋势和主题特征等方面存在一定差异。基于此,文章从融入信息安全机制、突破学科壁垒、拥抱人工智能、保存沉浸式体验等方面提出发展建议,为优化数字保存研究生态、制定差异化发展战略提供数据驱动的决策支持。 展开更多
关键词 数字保存 长期保存 BERtopic 主题建模
在线阅读 下载PDF
基于在线消费者评论的新能源汽车评估与选择研究
5
作者 陆晓雪 徐海燕 +1 位作者 胡礼梅 江洋子 《运筹与管理》 北大核心 2025年第8期120-126,I0081,I0082,共9页
“双碳”背景下,新能源汽车受到广泛关注,而随着互联网和电子商务的发展,产品数量和服务不断增长,消费者难以依据海量的在线评论进行购买决策。挖掘在线文本评论中消费者的需求信息和情感偏好,有利于帮助消费者进行产品评估与选择。本... “双碳”背景下,新能源汽车受到广泛关注,而随着互联网和电子商务的发展,产品数量和服务不断增长,消费者难以依据海量的在线评论进行购买决策。挖掘在线文本评论中消费者的需求信息和情感偏好,有利于帮助消费者进行产品评估与选择。本文由此提出基于在线文本评论的评估模型。首先,采用LDA主题模型从在线文本评论中挖掘产品属性,建立评估指标体系。其次,使用情感分析转化文本中的情感偏好,获取概率语言评价矩阵。进而,将广义TODIM方法拓展到概率语言环境中,考虑属性关联性,构建刻画消费者损失厌恶行为特征的评价排序方法。最后,通过案例应用、灵敏度分析,进一步验证模型的有效性。 展开更多
关键词 在线评论 LDA主题模型 概率语言术语集 SHAPLEY值 广义TODIM方法
在线阅读 下载PDF
基于DTM-BiLSTM模型的主题预测方法
6
作者 赵立飞 高全力 +4 位作者 邵连合 金磊 冯琛 闫慧 雒彤彤 《计算机与数字工程》 2025年第9期2489-2496,共8页
主题模型被广泛的用于智能推荐、聚类分析、主题演变分析等各个领域,用以处理不同种类的文本数据,但是传统主题模型对于文本数据时间序列上的特性考虑不足,导致主题的预测缺乏各主题之间的时间方向上的联系。为此,论文提出了一种基于动... 主题模型被广泛的用于智能推荐、聚类分析、主题演变分析等各个领域,用以处理不同种类的文本数据,但是传统主题模型对于文本数据时间序列上的特性考虑不足,导致主题的预测缺乏各主题之间的时间方向上的联系。为此,论文提出了一种基于动态主题模型和双向长短期记忆神经网络的主题预测模型,使用动态主题模型对有时序性的文献摘要数据进行分类和降维,充分挖掘数据时间上的演化规律,将获得的主题时间上的概率权重输入到BiLSTM模型中进行预测未来主题演变的情况。相比于三种对照模型(DTM-LSTM、DTM-GRU和DTM-BiLSTM),动态主题模型融合了双向长短期记忆神经网络的预测模型,在预测评价指标上均有所提升,其预测结果拟合度为0.932 855,该算法在预测精度方面高于DTM-LSTM以及DTM-GRU模型。 展开更多
关键词 动态主题模型 双向长短期记忆神经网络 主题预测 自然语言处理 公共文化服务
在线阅读 下载PDF
基于LSTM的微博康养舆情监测系统研究
7
作者 任设东 戴坤甯 《科技资讯》 2025年第20期67-70,共4页
微博等网络平台已成为康养宣传的重要渠道,但同时也混杂着各种舆情信息。本文研究开发基于长短期记忆(Long Short-Term Memory,LSTM)网络的康养舆情监测系统,监管微博平台康养舆情信息。首先,通过数据抓取方法,在微博平台采集康养相关... 微博等网络平台已成为康养宣传的重要渠道,但同时也混杂着各种舆情信息。本文研究开发基于长短期记忆(Long Short-Term Memory,LSTM)网络的康养舆情监测系统,监管微博平台康养舆情信息。首先,通过数据抓取方法,在微博平台采集康养相关的文本数据,并对数据进行分词、停用词过滤与文本向量化处理;其次,将预处理后的数据样本用于训练LSTM,构建康养数据文本情感分析模型;最后,基于分析模型,利用前后端开发技术,开发微博康养舆情监测系统,实现舆情文章采集、内容分析、热词统计、词云展示等功能。实验表明,系统能够有效识别康养话题舆情动向,为微博康养舆情信息的治理提供可行的解决方案。 展开更多
关键词 微博 康养话题 长短期记忆网络 情感分析 舆情监测
在线阅读 下载PDF
党的二十大以来官方媒体视域下的青年形象——基于“共青团中央”微信公众平台的文本分析
8
作者 冯永欣 赵青矣 《当代青年研究》 2025年第4期102-116,共15页
党的二十大以来,青年工作成为全党的战略性工作,国家为新时代的青年形象赋予了全新的期待。研究聚焦联结国家和青年的官方新媒体“共青团中央”,通过对其微信公众平台自党的二十大以来的推文进行自然语言处理,提炼平台建构的青年形象。... 党的二十大以来,青年工作成为全党的战略性工作,国家为新时代的青年形象赋予了全新的期待。研究聚焦联结国家和青年的官方新媒体“共青团中央”,通过对其微信公众平台自党的二十大以来的推文进行自然语言处理,提炼平台建构的青年形象。研究结果显示,官方媒体书写的青年形象多元立体,展现“建设者”“奉献者”“传承者”“创新者”“发展者”并重的格局,又高度统一于“复兴一代”的总体概括。这种形象建构取材于现实中的青年榜样,既契合国家要求、彰显主流价值,又贴合青年生活实际,总体传递出积极向上的情感,有效塑造和引导了青年群体的价值判断和实践选择。 展开更多
关键词 青年形象 “共青团中央”微信公众平台 词对主题模型 复兴一代
在线阅读 下载PDF
面向多标签隐性知识的文本数据挖掘算法
9
作者 邓乔夫 李骁娅 郭校君 《沈阳工业大学学报》 北大核心 2025年第5期594-601,共8页
【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知... 【目的】随着社交软件用户群体的不断扩大,越来越多的平台采用多标签标注对文本信息进行分类。如何通过多标签文本数据挖掘来分析用户行为与心理,已成为当前研究的热点问题。本文基于深度主题特征提取模型,提出了一种面向多标签隐性知识的数据挖掘算法,以提升文本分类的准确性和数据挖掘的效率。【方法】针对多标签文本数据中隐性知识的显性化问题,基于SECI理论对文本信息中的隐性知识进行显性化转换,并利用循环神经网络的短时记忆能力提高隐性知识的转换效率。在此基础上,考虑到文本信息的复杂性,分别从局部特征和全局特征两个维度进行分析,并采用特征融合策略提高数据挖掘的准确性。由于文本信息前后文关联性较强,利用基于长短期记忆网络(LSTM)模型的门控机制,提取文本的上下文信息,以捕捉文本中的序列依赖关系;采用潜在狄利克雷分配(LDA)模型,对文本的主题结构进行建模,从而避免因人工标注标准差异导致的模型训练偏差;通过特征拼接的方式,并结合LDA主题模型和LSTM模型提取的局部及全局特征,以降低特征提取过程中信息丢失的风险;引入主题控制器,通过缩小推理范围,提高文本特征提取的有效性;构建基于高斯解码器的上下文主题层,计算词汇在特定主题下的条件概率矩阵,并利用高斯混合解码器优化文本主题建模,提高文本内容的扩充能力;使用Softmax函数计算各标签的概率,实现多标签文本分类。【结果】对比实验中,使用困惑度作为模型训练的评估指标。结果表明,本文模型的困惑度优于对照组(LDA主题模型与LSTM模型),验证了LDA与LSTM结合的特征拼接策略可有效发挥两种模型的优势。此外,与NVDM、LSTM、LDA和VAETM模型进行对比,以准确率和查全率为评估指标,本文模型在准确率和查全率方面分别提升了5.05%和2.75%,表明其在多标签文本分类任务中的有效性与优越性。【结论】对比实验结果表明,本文模型能够显著提升文本分类的性能,相比LDA主题模型和LSTM模型,在处理多标签文本时表现更优;能够高效挖掘多标签文本数据中的隐性知识,为文本分类、语义分析和信息检索等任务提供了一种高效、精准的解决方案。 展开更多
关键词 多标签文本 深度主题特征提取模型 隐性知识 循环神经网络 LSTM神经网络 LDA主题模型 特征拼接 高斯解码器
在线阅读 下载PDF
中文微博突发事件检测研究 被引量:24
10
作者 王勇 肖诗斌 +1 位作者 郭跇秀 吕学强 《现代图书情报技术》 CSSCI 北大核心 2013年第2期57-62,共6页
从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和TF-PDF算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤;提出一种"绝对聚类"算法,对描述突发事件的文... 从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和TF-PDF算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤;提出一种"绝对聚类"算法,对描述突发事件的文本进行聚类,并通过微博的回复数和转发数加权计算热度,检测各类事件中热度最大的作为突发事件。检测准确率为92.60%,召回率为85.51%,F值为0.89。实验结果表明,相比于传统的突发事件检测方法,该方法能够比较准确地检测到微博中的突发事件,有一定的应用价值。 展开更多
关键词 突发事件 突发词 文本过滤 绝对聚类
原文传递
面向知识体系构建的术语提取技术研究
11
作者 张岐坦 尹明辉 刘伟强 《计算机与网络》 2025年第2期142-148,共7页
术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语... 术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语提取方法,详细说明了面向知识体系构建的术语提取应用流程。对各种术语提取技术进行了总结与分析,说明了各自的优缺点和局限性,对术语提取技术的未来发展进行了展望和预测。 展开更多
关键词 术语提取 统计特征 词图模型 主题模型 深度学习 大语言模型 知识体系
在线阅读 下载PDF
基于离散粒子群优化的微博热点话题发现算法 被引量:9
12
作者 马慧芳 吉余岗 +1 位作者 李晓红 周汝南 《计算机工程》 CAS CSCD 北大核心 2016年第3期208-213,共6页
结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚... 结合词项关联关系和粒子群优化(PSO)算法的特点,提出一种基于离散PSO(DPSO)的微博热点话题发现算法。通过对词语互信息及内外关联词信息的挖掘,更新传统文本表示模型,利用DPSO算法从寻优角度发现微博热点话题及简化微博聚类过程,并将聚类质量评价指标作为适应度函数对聚类结果进行不断迭代优化,获得聚类结果的最优解。实验结果表明,该算法能够在大量微博中快速发现热点话题,具有较高的热点话题发现准确性及运行效率。 展开更多
关键词 微博 热点话题发现 词项关系 文本表示模型 粒子群优化
在线阅读 下载PDF
基于关键词元的话题内事件检测 被引量:15
13
作者 张阔 李涓子 +1 位作者 吴刚 王克宏 《计算机研究与发展》 EI CSCD 北大核心 2009年第2期245-252,共8页
各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内... 各种媒体每天有大量的新闻报道产生,需要一种自动化的分析方法将新闻以一种更加清晰的组织形式展示给用户.大多已有工作将新闻划分成平面的话题,然而一个话题并非仅仅是简单的新闻集合,而是由一系列相互关联的事件所组成的.由于话题内的事件之间往往非常相似,导致话题内的事件检测精确度较差.为了克服以上问题,提出了基于事件词元委员会的事件检测与关系发现方法.即首先挖掘每个事件的核心词元,随后利用事件的核心词元进行事件检测与关系发现.在Linguistic Data Consortium(LDC)的两个数据集上的实验结果显示,提出的事件检测与关系发现方法可以显著地改善已有方法的效果. 展开更多
关键词 事件检测 事件关系发现 关键词元 话题检测 新闻组织
在线阅读 下载PDF
一种高效的用于话题检测的关键词元聚类方法 被引量:1
14
作者 杨攀 桂小林 +1 位作者 田丰 王刚 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第10期24-28,共5页
针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精... 针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精度,从而减少所需的词元聚类次数.实验结果表明,将改进的方法应用到舆情监控的话题检测中,能在不影响检测精度的前提下有效地提高算法的运行效率. 展开更多
关键词 话题检测 关键词元 舆情监控
在线阅读 下载PDF
三维打印技术的潜在风险识别:跨学科主题词挖掘视角 被引量:8
15
作者 李牧南 王流云 《科研管理》 CSSCI CSCD 北大核心 2019年第1期89-104,共16页
在智能制造和工业互联网的体系架构中,三维打印(增材制造)是重要的核心技术之一。但是,当前大部分针对三维打印的相关研究更多聚焦于创新和市场潜力。针对三维打印技术普及和产业化可能带来的健康、环境和生态风险等问题,相关研究则较... 在智能制造和工业互联网的体系架构中,三维打印(增材制造)是重要的核心技术之一。但是,当前大部分针对三维打印的相关研究更多聚焦于创新和市场潜力。针对三维打印技术普及和产业化可能带来的健康、环境和生态风险等问题,相关研究则较为零散,而且分布在化学、材料、物理、生物和环境等不同专业和研究领域。这给相关的科技政策制定和预防式公共治理措施出台带来了一定的信息阻塞和决策障碍。此外,目前有关新兴技术潜在风险识别的理论和实证研究均较少,相关的量化分析尤甚,可以认为是当前科技评价和技术管理研究领域的盲点之一。针对当前有关新兴技术潜在风险识别与评估的相关科学问题,本文提出了一个基于朴素机器学习思想的跨学科主题词挖掘框架,并结合当前较为热点的三维打印技术进行了实证分析。理论和实证分析显示,本文提出的跨学科主题词挖掘框架对于某个具体新兴技术潜在风险的分析,具有一定的内容识别效果,这对于相关的公共治理决策和科技政策制定,或许具有一定的参考价值和积极意义。 展开更多
关键词 新兴技术 三维打印 增材制造 风险识别 主题词挖掘 机器学习
原文传递
中文领域本体学习中术语的自动抽取 被引量:14
16
作者 温春 王晓斌 石昭祥 《计算机应用研究》 CSCD 北大核心 2009年第7期2652-2655,共4页
提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时... 提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。 展开更多
关键词 领域术语抽取 领域主题一致度 领域本体学习 多字词候选术语 字符串分解
在线阅读 下载PDF
新兴技术内涵特征和识别方法研究进展 被引量:16
17
作者 杨思洛 江曼 《情报科学》 CSSCI 北大核心 2023年第5期181-190,共10页
【目的/意义】对国内外新兴技术概念和识别方法进行梳理,总结对比各方法的特点和研究中存在的不足,为未来新兴技术识别研究提供多维视角和方法参考。【方法/过程】通过新兴技术与前沿技术、颠覆性技术概念辨析,明确新兴技术的内涵与特征... 【目的/意义】对国内外新兴技术概念和识别方法进行梳理,总结对比各方法的特点和研究中存在的不足,为未来新兴技术识别研究提供多维视角和方法参考。【方法/过程】通过新兴技术与前沿技术、颠覆性技术概念辨析,明确新兴技术的内涵与特征;然后从数据源、识别路径、识别指标、有效性验证等四个层面梳理新兴技术识别方法的特点及优劣。【结果/结论】总结得出新兴技术识别的4方面数据源、2大识别路径、5类识别指标、4种有效性验证方法,未来可进一步探讨新兴技术形成机制、多源数据的融合,改进基于术语的新兴技术识别路径、更细粒度的自动化识别方法,加强识别指标与技术特征的关联解释,完善识别结果的有效性验证等。【创新/局限】全面系统对新兴技术识别方法进行归纳梳理,从主题和术语两类识别单元归纳新兴技术识别路径机理及方法模型,有利于为新兴技术识别提供不同维度的研究思路。 展开更多
关键词 新兴技术 内涵特征 识别方法 新兴主题 新兴术语
原文传递
汉语科技词系统在文献自动赋词标引中的应用研究 被引量:4
18
作者 闫莹莹 许德山 +1 位作者 张运良 李鹏 《数字图书馆论坛》 2013年第11期2-8,共7页
文章首先介绍了汉语科技词系统的体系结构和功能,其次设计了自动赋词标引研究的整体思路,完成了自动赋词标引的系统功能实现,包括标引知识库的格式转换、算法实现和系统实现,并收集语料进行测试。最后对自动赋词标引的结果进行了分... 文章首先介绍了汉语科技词系统的体系结构和功能,其次设计了自动赋词标引研究的整体思路,完成了自动赋词标引的系统功能实现,包括标引知识库的格式转换、算法实现和系统实现,并收集语料进行测试。最后对自动赋词标引的结果进行了分析,并且总结了该自动赋词标引研究的特点和不足,介绍了未来的工作设想。 展开更多
关键词 自动标引 赋词标引 汉语科技词系统 标引知识库 词系统应用 D2RQ
在线阅读 下载PDF
一种面向旅游评论的情感特征识别方法 被引量:2
19
作者 陈耀东 彭蝶飞 《计算机技术与发展》 2018年第11期107-110,114,共5页
情感分析的一大难点是如何获取主题相关的情感特征信息。首先给出了"有效"情感特征的定义,然后提出了一种基于语义角色标注的有效情感特征抽取方法。该方法先依据评论库的主题元数据得到候选主题特征项,并标注主题句,然后执... 情感分析的一大难点是如何获取主题相关的情感特征信息。首先给出了"有效"情感特征的定义,然后提出了一种基于语义角色标注的有效情感特征抽取方法。该方法先依据评论库的主题元数据得到候选主题特征项,并标注主题句,然后执行主题句的语义角色标注,基于情感特征所在的角色类型判断该特征语义是否指向主题项。该方法的特点在于过滤与指定主题无关的噪声特征。实验面向旅游景区游客评论在不同规模的标注集环境下对比了三种特征抽取方法,即基于词袋的方法、基于主题的方法和文中基于有效情感特征的方法,结果显示文中方法对于短文本的情感分类较词袋方法有3%的性能提升,而对于长文本的情感分类其性能较前面两种方法优势突显,总体达到了84.81%的准确率。 展开更多
关键词 情感分析 情感特征 主题项 语义角色标注 语义指向 游客评论
在线阅读 下载PDF
基于词组主题建模的文本语义压缩算法 被引量:4
20
作者 王李冬 张引 吕明琪 《西南交通大学学报》 EI CSCD 北大核心 2015年第4期755-763,共9页
为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling).该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该... 为了实现文本代表性语义词汇的抽取,提出一种基于词组主题建模的文本语义压缩算法SCPTM(semantic compression based on phrase topic modeling).该算法首先将代表性语义词汇抽取问题转化为最大化优化模型,并通过贪心搜索策略实现该模型的近似求解.然后,利用词组挖掘模型LDACOL实现词组主题建模,得到SCPTM算法的输入参数;同时,针对该模型中词组的主题分配不稳定的问题进行改进,使得取得的代表性语义词汇更加符合人们对语义的认知习惯.最后,将改进LDACOL模型与LDA模型、LDACOL模型以及TNG模型的主题挖掘性能进行实验比较,并利用SCPTM算法针对不同语料库进行语义压缩,根据聚类结果评价其有效性.实验结果表明,在多数情况下,改进LDACOL模型的主题抽取效果优于其他3种模型;通过SCPTM算法抽取代表性语义词汇能达到70%~100%的精度,相比PCA、MDS、ISOMAP等传统降维算法能获得更高的聚类效果. 展开更多
关键词 主题模型 代表性语义词汇 文本挖掘 语义压缩 SCPTM
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部