期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
网络舆情敏感信息二级特征匹配跟踪仿真
1
作者 黄博宇 徐政超 《计算机仿真》 2025年第4期391-395,共5页
传统网络舆情敏感信息跟踪方法只关注单个信息片段的匹配,对信息的理解不够全面和深入,难以对复杂语义和结构关系进行捕捉,导致信息跟踪准确度差。为此,引入二级特征匹配技术,引入BM25模型,融合多角度特征对文本进行二级特征匹配,实现... 传统网络舆情敏感信息跟踪方法只关注单个信息片段的匹配,对信息的理解不够全面和深入,难以对复杂语义和结构关系进行捕捉,导致信息跟踪准确度差。为此,引入二级特征匹配技术,引入BM25模型,融合多角度特征对文本进行二级特征匹配,实现信息的深度特征提取和精准匹配,从而提高了信息跟踪的准确性。首先,融合语义情感对网络舆情敏感信息进行特征选择,利用容差改进距离对网络舆情敏感信息进行一级特征匹配法,快速筛选出与敏感信息紧密相关的文本;其次,引入BM25模型,融合多角度特征对文本进行二级特征匹配,采用BERT词嵌入技术对舆情敏感信息二级特征匹配,捕捉敏感信息其中的复杂结构和语义关系,提高匹配精度;最后,将匹配结果作为输入节点,通过计算敏感信息节点的变体接近中心性及其时域变化率,实现对网络舆情敏感信息的实时跟踪。实验结果表明,所提方法显著提升了网络舆情敏感信息跟踪的准确性和效率。 展开更多
关键词 特征选择 文本匹配 超网络模型 敏感信息跟踪
在线阅读 下载PDF
文本特征和图结点混合增强的图卷积网络文本分类 被引量:2
2
作者 杨晓奇 刘伍颖 《新疆大学学报(自然科学版)(中英文)》 CAS 2024年第1期69-77,109,共10页
在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比... 在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比,该方法在4个文本分类数据集上的准确率评价指标均有不同程度的提升. 展开更多
关键词 bm25+ 文本特征增强 图结点增强 预训练模型 图卷积网络 文本分类
在线阅读 下载PDF
基于多元数据信息获取的关键技术研究 被引量:4
3
作者 李莉 刘淼 冯嘉辉 《长春理工大学学报(自然科学版)》 2020年第1期97-103,共7页
随着近年来互联网信息的爆炸式增长,通用网络爬虫成为人们获取信息的有效手段。但其查准率却无法保证。针对此问题,提出一种基于改进BM25算法和SVM算法的聚焦爬虫,用于解决通过网络爬虫的缺点。聚焦爬虫分为网页爬取模块、网页预处理模... 随着近年来互联网信息的爆炸式增长,通用网络爬虫成为人们获取信息的有效手段。但其查准率却无法保证。针对此问题,提出一种基于改进BM25算法和SVM算法的聚焦爬虫,用于解决通过网络爬虫的缺点。聚焦爬虫分为网页爬取模块、网页预处理模块和网页关联性评价模块三部分。网页爬取模块以URL种子集合为初始集合负责网页信息的爬取。网页预处理模块采用改进BM25算法提取网页信息的主题特征向量。网页关联性评价模块采用SVM算法对主题特征向量进行分类,获取和用户检索主题相关的网页信息。实验结果表明,本文的方法在网页抓取的查准率上都取得良好的效果。 展开更多
关键词 聚焦爬虫 bm25 SVM 向量空间模型
在线阅读 下载PDF
加密文档排序中保序加密算法的最优化选取 被引量:2
4
作者 张久岭 黄道超 沈时军 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期266-272,共7页
对需要存储在服务器端的用户文档进行加密是对用户隐私保护的根本方法。采用不同的保序加密算法对加密文档排序结果有着不同的影响,寻找排序结果最优的保序加密算法是亟待解决的问题。提出了基于鉴别信息的保序加密算法选择的标准,比较... 对需要存储在服务器端的用户文档进行加密是对用户隐私保护的根本方法。采用不同的保序加密算法对加密文档排序结果有着不同的影响,寻找排序结果最优的保序加密算法是亟待解决的问题。提出了基于鉴别信息的保序加密算法选择的标准,比较了2种保序加密算法下对加密文档排序的性能。在通过保序加密算法得到的密文分布接近明文分布的情况下,排序得到的结果更接近明文检索的情况。所提出的选择标准具有理论上的意义,同时也可以指导在相同安全条件下保序加密算法的选择,以达到最优的检索结果。 展开更多
关键词 保序加密 Okapi bm25模型 鉴别信息 加密信息检索 用户隐私保护
原文传递
基于交通知识的移动智能问答系统 被引量:1
5
作者 赵沛时 葛亮 张晓阳 《电子测试》 2016年第6X期25-28,共4页
交通知识与人的生命安全息息相关。针对如何方便快捷的获取交通知识,设计并实现了以即时通讯软件微信为人机交互媒介的移动智能自动问答系统。首先,对文本进行特征向量提取,并对同义词进行归一化,消除同义词对查询准确率的干扰;然后,综... 交通知识与人的生命安全息息相关。针对如何方便快捷的获取交通知识,设计并实现了以即时通讯软件微信为人机交互媒介的移动智能自动问答系统。首先,对文本进行特征向量提取,并对同义词进行归一化,消除同义词对查询准确率的干扰;然后,综合词频和词性信息计算文本关键特征的权值;最后采用BM25模型计算问题与知识库中文本信息的相似度,返回与问题最相似的答案。实验表明,本系统的移动性强,人机交互友好,查询准确度高。 展开更多
关键词 智能问答 微信 bm25 同义词归一化 文本相似度
在线阅读 下载PDF
基于Lucene的搜索排序算法研究与实现 被引量:2
6
作者 刘琼茹 《无线互联科技》 2017年第4期143-146,共4页
Lucene是Java实现全文搜索引擎的工具包,短小精悍,功能强大,近来被广泛使用。文章对其核心"索引-检索"进行了研究,搭建该平台并引入了中文分词,可完成对中文的搜索,以及实现"与"和"非"功能。在排序部分,... Lucene是Java实现全文搜索引擎的工具包,短小精悍,功能强大,近来被广泛使用。文章对其核心"索引-检索"进行了研究,搭建该平台并引入了中文分词,可完成对中文的搜索,以及实现"与"和"非"功能。在排序部分,分别用向量空间模型和BM25实现。在系统实现时,主要介绍了3种评测方法,对VSM和BM25模型排序算法进行了评测,并进行对比分析。 展开更多
关键词 搜索引擎 LUCENE 空间向量模型 bm25
在线阅读 下载PDF
基于交通知识的移动智能问答系统
7
作者 赵沛时 葛亮 张晓阳 《电子测试》 2016年第12期25-28,共4页
交通知识与人的生命安全息息相关。针对如何方便快捷的获取交通知识,设计并实现了以即时通讯软件微信为人机交互媒介的移动智能自动问答系统。首先,对文本进行特征向量提取,并对同义词进行归一化,消除同义词对查询准确率的干扰;然后,综... 交通知识与人的生命安全息息相关。针对如何方便快捷的获取交通知识,设计并实现了以即时通讯软件微信为人机交互媒介的移动智能自动问答系统。首先,对文本进行特征向量提取,并对同义词进行归一化,消除同义词对查询准确率的干扰;然后,综合词频和词性信息计算文本关键特征的权值;最后采用BM25模型计算问题与知识库中文本信息的相似度,返回与问题最相似的答案。实验表明,本系统的移动性强,人机交互友好,查询准确度高。 展开更多
关键词 智能问答 微信 bm25 同义词归一化 文本相似度
全文增补中
上一页 1 下一页 到第
使用帮助 返回顶部