期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种基于TDT模型的基金项目科学研究前沿识别方法研究 被引量:5
1
作者 徐路路 王效岳 白如江 《情报理论与实践》 CSSCI 北大核心 2018年第8期72-78,共7页
[目的/意义]由于传统以论文分析数据源的科学研究前沿方法存在主题探测的时滞性及方法的局限性,需要更加准确识别出蕴含更多前瞻价值信息的基金项目数据中的研究前沿主题,细粒度识别科学研究前沿主题类型。[方法/过程]提出一种基于TDT... [目的/意义]由于传统以论文分析数据源的科学研究前沿方法存在主题探测的时滞性及方法的局限性,需要更加准确识别出蕴含更多前瞻价值信息的基金项目数据中的研究前沿主题,细粒度识别科学研究前沿主题类型。[方法/过程]提出一种基于TDT模型的基金项目科学研究前沿识别方法,借鉴TDT模型中多要素融合分析及归一化处理的思想,分析基金项目的资助强度、时间维度、主题维度等项目特征属性,构建基金项目科学研究前沿探测公式,识别出热门研究前沿主题、新兴前沿主题及未来前沿主题3种科学研究前沿主题,从而揭示前沿领域竞争态势。[结果/结论]通过以石墨烯领域数据进行实验,表明该方法能够更加快速准确地前瞻识别出科学研究前沿主题,弥补单一主题维度进行前沿识别的不足,更好地进行主题发展预测分析。 展开更多
关键词 tdt模型 基金项目 科学研究 研究前沿 探测分析
原文传递
基于增量主题模型的微博在线事件分析 被引量:5
2
作者 马慧芳 王博 《计算机工程》 CAS CSCD 2013年第3期191-196,共6页
为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,... 为更好地利用微博结构化社会网络方面的信息,提出一种基于增量主题模型的微博在线事件分析算法。通过设计增量过程,保留已有的训练信息,采用自适应非对称学习算法融入新微博内容与用户关系。实验结果表明,该算法可在短暂的时间内建模,并有效提高事件分析的性能。 展开更多
关键词 用户关系 话题检测与追踪 主题模型 自适应 增量概率 增量算法
在线阅读 下载PDF
话题发现与追踪技术研究 被引量:21
3
作者 张晓艳 王挺 《计算机科学与探索》 CSCD 2009年第4期347-357,共11页
话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价... 话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价方法以及发展历史;然后对其多个研究内容提出一个统一研究框架,并对该框架中的关键技术进行了详细分析;最后指出该领域中的关键问题及难点,并对未来研究做出展望。 展开更多
关键词 话题发现与追踪 统一研究框架 表示模型
在线阅读 下载PDF
基于关联规则和粗糙集的话题特征提取方法 被引量:2
4
作者 高飞 周学广 孙艳 《计算机工程》 CAS CSCD 2012年第10期63-66,共4页
针对话题分类文本训练集少、主题相似度大的特点,提出一种基于关联规则和粗糙集的话题特征提取方法。在向量空间模型的基础上,采用挖掘关联规则的方式生成规则集与文本主体,通过调节事务主体的最小支持度与最小置信度查找不同颗粒层次... 针对话题分类文本训练集少、主题相似度大的特点,提出一种基于关联规则和粗糙集的话题特征提取方法。在向量空间模型的基础上,采用挖掘关联规则的方式生成规则集与文本主体,通过调节事务主体的最小支持度与最小置信度查找不同颗粒层次的话题,利用粗糙集理论对词语特征与关联特征进行属性约简。实验结果表明,该方法能提取文本集中描述的评论主题,具有较高的话题分类准确率。 展开更多
关键词 关联规则 粗糙集 特征提取 话题检测与跟踪 向量空间模型 属性约简
在线阅读 下载PDF
微博突发话题检测方法研究 被引量:13
5
作者 邱云飞 程亮 《计算机工程》 CAS CSCD 2012年第9期288-290,共3页
话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义... 话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类。实验结果表明,该算法能获得较准确的突发话题检测结果。 展开更多
关键词 微博 突发话题 滑动窗口 语义相似度 空间向量模型 话题检测与跟踪
在线阅读 下载PDF
BERT-Single:半监督的话题检测与追踪方法 被引量:3
6
作者 侯博元 崔喆 谢欣冉 《计算机应用》 CSCD 北大核心 2022年第S01期21-27,共7页
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数... 针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数据训练预训练语言模型BERT,使BERT模型学习到任务特定的先验知识,生成能够适应话题检测与追踪任务且包含深层语义特征的文本向量;然后利用改进的Single-Pass聚类算法将预训练语言模型学习到的有标签样本信息泛化到无标签数据上,提升模型在话题检测与追踪任务上性能。在构建的数据集上进行实验,结果显示,相较于对比模型,BERT-Single模型精确率至少提升了3个百分点、召回率至少提升了1个百分点、F1值至少提升了3个百分点。BERT-Single模型对于解决话题检测与追踪问题具有较好效果,并能够很好地适应增量式聚类任务。 展开更多
关键词 聚类 半监督学习 话题检测与追踪 预训练语言模型 新闻话题
在线阅读 下载PDF
Hierarchical clustering based on single-pass for breaking topic detection and tracking 被引量:3
7
作者 Li Fenghuan Zhao Zongfei Wang Zhenyu 《High Technology Letters》 EI CAS 2018年第4期369-377,共9页
Single-pass is commonly used in topic detection and tracking( TDT) due to its simplicity,high efficiency and low cost. When dealing with large-scale data,time cost will increase sharply and clustering performance will... Single-pass is commonly used in topic detection and tracking( TDT) due to its simplicity,high efficiency and low cost. When dealing with large-scale data,time cost will increase sharply and clustering performance will be affected greatly. Aiming at this problem,hierarchical clustering algorithm based on single-pass is proposed,which is inspired by hierarchical and concurrent ideas to divide clustering process into three stages. News reports are classified into different categories firstly.Then there are twice single-pass clustering processes in the same category,and one agglomerative clustering among different categories. In addition,for semantic similarity in news reports,topic model is improved based on named entities. Experimental results show that the proposed method can effectively accelerate the process as well as improve the performance. 展开更多
关键词 TOPIC detection and tracking(tdt) single-pass HIERARCHICAL CLUSTERING TEXT CLUSTERING TOPIC modeling
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部