期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于复杂网络关键节点识别的藏文文本分类技术研究
1
作者 王桂山 苏慧婧 罗成孝 《长江信息通信》 2025年第7期126-129,共4页
藏文作为一种特殊的语言,其文本分类技术的研究面临许多挑战。文章探讨了复杂网络关键节点识别算法的核心原理,并将其应用于藏文文本分类的特征提取与模型优化中。引入基于网络中心性与重叠社区识别的算法,构建了一个能够有效挖掘藏文... 藏文作为一种特殊的语言,其文本分类技术的研究面临许多挑战。文章探讨了复杂网络关键节点识别算法的核心原理,并将其应用于藏文文本分类的特征提取与模型优化中。引入基于网络中心性与重叠社区识别的算法,构建了一个能够有效挖掘藏文文本中重要信息并提升分类性能的模型[1]。实验结果表明,复杂网络的关键节点识别方法能够有效提高藏文文本分类的精度和鲁棒性。 展开更多
关键词 复杂网络 关键节点识别 藏文文本分类 网络中心性 社区划分
在线阅读 下载PDF
基于PE文件无容量限制的信息隐藏技术研究 被引量:8
2
作者 李钱 方勇 +1 位作者 谭登龙 张长山 《计算机应用研究》 CSCD 北大核心 2011年第7期2758-2760,共3页
分析了现有的基于PE文件信息隐藏技术及其不足,提出一种以扩充.text节达到无容量限制的信息隐藏方案。通过对嵌入的信息进行加密、完整性校验、代码伪装、混合原代码等预处理,再根据预处理后的信息大小扩充.text节,并调整随后的各个节... 分析了现有的基于PE文件信息隐藏技术及其不足,提出一种以扩充.text节达到无容量限制的信息隐藏方案。通过对嵌入的信息进行加密、完整性校验、代码伪装、混合原代码等预处理,再根据预处理后的信息大小扩充.text节,并调整随后的各个节以及输入表的位置,以及PE头的各个相应标志的值,保证嵌入信息后的PE文件仍然能正常执行。实验表明,该方案不仅能达到无容量限制的信息隐藏,而且具有一定的隐蔽性和鲁棒性。 展开更多
关键词 信息隐藏 PE文件 text 密码学 无容量限制
在线阅读 下载PDF
文本结构和时间应激对网页阅读绩效的影响 被引量:12
3
作者 张智君 韩淼 +1 位作者 朱祖祥 朱伟 《心理科学》 CSSCI CSCD 北大核心 2002年第4期422-424,共3页
探讨了文本结构和时间应激对网页阅读绩效的影响效应。采用 2× 3被试间设计 ,自变量为文本结构和阅读时间 ,因变量为找到相关信息的时间及途径的额外节点数。结果发现 ,主效应及交互作用的影响均十分显著。其中 ,当阅读时间为 10和... 探讨了文本结构和时间应激对网页阅读绩效的影响效应。采用 2× 3被试间设计 ,自变量为文本结构和阅读时间 ,因变量为找到相关信息的时间及途径的额外节点数。结果发现 ,主效应及交互作用的影响均十分显著。其中 ,当阅读时间为 10和 2 0min时 ,超文本阅读的绩效均显著低于线性文本 ,而在 30min时两者无显著差异 ;对超文本 ,三种阅读时间的效应存在显著差异 ,而对线性材料 ,阅读时间的效应无显著差异。结论 展开更多
关键词 网页阅读绩效 文本结构 时间应激 线性文本 超文本
在线阅读 下载PDF
基于图卷积网络的藏文新闻文本分类 被引量:7
4
作者 胥桂仙 张子欣 +2 位作者 于绍娜 董玉双 田媛 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第6期73-85,共13页
【目的】针对藏文预训练知识缺少的现状,利用藏文音节和文档的构造关系,提出基于图卷积网络的藏文新闻文本分类方法。【方法】基于音节-音节关系和音节-文档关系为藏文新闻语料库构建文本图,然后使用音节和文档的独热表示进行初始化,在... 【目的】针对藏文预训练知识缺少的现状,利用藏文音节和文档的构造关系,提出基于图卷积网络的藏文新闻文本分类方法。【方法】基于音节-音节关系和音节-文档关系为藏文新闻语料库构建文本图,然后使用音节和文档的独热表示进行初始化,在训练集文档类别标签的监督下,使用图卷积网络联合学习音节和文档的嵌入,最后将文本分类问题转化为节点分类问题。【结果】图卷积网络在藏文新闻正文文本分类任务上准确率达到70.44%,相比于基线模型高出8.96~20.66个百分点;在藏文新闻标题文本上准确率达到61.94%,比基线模型高出6.61~26.05个百分点。同时,图卷积网络相比引入预训练音节嵌入的SVM、CNN和少数民族语言预训练模型CINO在准确率上高出0.73~15.1个百分点,在正文上的准确率相比Word2Vec+LSTM方法高出15.65个百分点。【局限】仍依赖于有标注数据集,但藏文的有监督文本相对稀缺。【结论】图卷积网络在藏文新闻文本分类任务上具有有效性,能够解决藏文新闻文本信息杂乱的问题,有助于对各类别藏文新闻文本数据进行挖掘。 展开更多
关键词 图卷积网络 藏文新闻文本分类 文本图 节点分类
原文传递
一种基于统计的中文网页正文抽取方法 被引量:3
5
作者 钱爱兵 《情报学报》 CSSCI 北大核心 2009年第2期187-194,共8页
针对抽取中文网页正文的传统方法的不足,提出一种基于统计的中文网页正文抽取方法。该方法首先利用DOM树计算文本结点的文本密度,即文本长度与HTML源码长度之比,再利用贝叶斯判别准则计算密度区分阈值,最后根据文本密度与密度区分阈值... 针对抽取中文网页正文的传统方法的不足,提出一种基于统计的中文网页正文抽取方法。该方法首先利用DOM树计算文本结点的文本密度,即文本长度与HTML源码长度之比,再利用贝叶斯判别准则计算密度区分阈值,最后根据文本密度与密度区分阈值的比较结果抽取正文,即大于密度区分阈值的结点就判定为正文文本结点,小于或等于密度区分阈值的结点则判定为非正文文本结点,将所有判定为正文文本结点的文本连接起来即为要抽取的网页正文。通过使用中文新闻类网页对该方法的有效性进行验证,结果表明:该方法虽然简单,但是抽取准确率极高且易于实现。 展开更多
关键词 文本密度 文本结点 正文抽取 贝叶斯判别准则 DOM树
在线阅读 下载PDF
基于即时文语转换技术的IVR流程编辑器的设计 被引量:2
6
作者 姚仲敏 吴丹 +1 位作者 李丽 侯彬 《计算机工程与设计》 CSCD 北大核心 2010年第22期4916-4919,共4页
针对传统交互式语音应答(IVR)系统在开发期间需要录制大量的语音文件供程序调用,并都是基于某种特定业务,流程被固定化,用户无法随时根据需要进行更改等问题,在IVR流程树基本原理的基础上,设计了一种基于即时文语转换技术(TTS)的新型IV... 针对传统交互式语音应答(IVR)系统在开发期间需要录制大量的语音文件供程序调用,并都是基于某种特定业务,流程被固定化,用户无法随时根据需要进行更改等问题,在IVR流程树基本原理的基础上,设计了一种基于即时文语转换技术(TTS)的新型IVR流程编辑器。系统省略了传统语音文件的录制过程,使用即时文语转化技术实现数据的实时朗读,无须事先人工录音,节省了大量的人力及计算机空间。同时具有业务无关性和可定制的流程编辑,用户可根据自身需要,定义自己的指令流程节点、节点属性以及方法,随时定制、修改自己的IVR系统。 展开更多
关键词 交互式语音应答系统 流程树 文语转换技术 流程编辑器 节点
在线阅读 下载PDF
基于情感文本数据筛选的感知节点选择机制 被引量:1
7
作者 张晓滨 黄梦莹 《计算机系统应用》 2019年第1期269-274,共6页
通过分析移动群智感知的协作过程,即感知节点的携带-存储-转发过程,发现该过程忽略了对节点携带信息的内容筛选.而对于有目的的数据获取而言,这种先收集后筛选的方法导致在后续对数据的分析与筛选过程中会耗费更多的时间,同时获取的有... 通过分析移动群智感知的协作过程,即感知节点的携带-存储-转发过程,发现该过程忽略了对节点携带信息的内容筛选.而对于有目的的数据获取而言,这种先收集后筛选的方法导致在后续对数据的分析与筛选过程中会耗费更多的时间,同时获取的有效数据占比不高.考虑到这个因素,本文结合遗传算法设计了一种在移动群智感知环境下基于情感文本数据筛选的节点选择机制.该节点选择机制主要通过对节点携带数据类型的筛选来选择感知节点,从而获取感知环境下移动用户的情感文本数据.通过实验验证表明,使用此方法在数据处理的效率上最大提高了27.6%,在有效的数据占比上最大提高了21%,因此该方法能够有效的提高对整体数据处理的效率. 展开更多
关键词 移动群智感知 遗传算法 情感文本 数据筛选 节点选择机制
在线阅读 下载PDF
基于超级对象的通用题库生成和管理模型
8
作者 胡华 任午令 《计算机应用》 CSCD 1995年第5期33-35,共3页
本文论述了一个以超级对象为基础的通用计算机题库生成和管理的模型,给出了实现的一般方法。该模型可以广泛地应用于以测试为基础的各学科的计算机辅助教学应用中。
关键词 多媒体 超级对象 题库 计算机 数据库
在线阅读 下载PDF
基于网页聚类的正文信息提取方法 被引量:6
9
作者 王一洲 陈星 戴远飞 《小型微型计算机系统》 CSCD 北大核心 2018年第1期111-115,共5页
精准地抽取Web页面中正文内容,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用网页分割和密度统计的方法.但现有的方法在网页中正文内容字符数较少时可能失去作用.经实例分析发现,网站内部的网页大多都是由一套相同... 精准地抽取Web页面中正文内容,在许多Web挖掘研究领域有着重要的应用价值.目前针对该问题主要采用网页分割和密度统计的方法.但现有的方法在网页中正文内容字符数较少时可能失去作用.经实例分析发现,网站内部的网页大多都是由一套相同内容模板生成的.因此本文提出一种基于网页聚类的正文信息提取的方法,该方法主要有2个部分组成:第一,基于网页的结构特征对网页进行聚类;第二,面向相似网页集合的正文位置特征生成.采用该方法可以从多种类型的网页中抽取正文信息.我们针对5个网站进行了实验,实验结果表明该方法的可行性和有效性. 展开更多
关键词 网页聚类 正文内容块 节点密度
在线阅读 下载PDF
基于文本对象模型的自动化网页内容提取方法 被引量:3
10
作者 李桐宇 任锐 +1 位作者 蔡鸿明 姜丽红 《上海交通大学学报》 EI CAS CSCD 北大核心 2018年第10期1363-1369,共7页
网页内容提取在信息检索、文本分析以及网络资源数据处理等领域具有重要的工程与应用价值.针对网页中的大量无关内容及网页结构的异构性所造成的网页内容提取难题,提出一种基于文本对象模型(DOM)的自动化网页内容提取方法.首先,在节点... 网页内容提取在信息检索、文本分析以及网络资源数据处理等领域具有重要的工程与应用价值.针对网页中的大量无关内容及网页结构的异构性所造成的网页内容提取难题,提出一种基于文本对象模型(DOM)的自动化网页内容提取方法.首先,在节点过滤后,对网页的DOM模型进行压缩,便于后续分析处理;然后,提出基于文本-链接密度的内容提取方法来识别网页内容;最后,基于节点熵来识别并去除网页内容中的噪声链接.实验结果表明,相比于传统的网页内容提取方法,该方法的准确率和F1分数均有明显提升,而召回率仅有轻微下降. 展开更多
关键词 文本对象模型 网页内容提取 文本密度 节点熵
在线阅读 下载PDF
面向故障短文本的改进图节点嵌入与聚类方法
11
作者 邱竞雄 孙林夫 韩敏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期4256-4266,共11页
为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下... 为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下不同距离的词汇间关联;其次改进图节点结构特征获取方法,从而体现节点度值差异对嵌入的影响;通过融合节点的结构特征与关系特征,增强具有相似邻居节点的同类节点之间的相似性表现;在聚类阶段设计备选节点数参数以缓解截断距离的敏感性。该方法在公开数据集和真实业务数据上进行了参数分析和性能评估,结果表明该方法可获取精准有效的故障实体节点聚类结果。 展开更多
关键词 故障短文本 图节点嵌入 局部密度 图节点聚类
在线阅读 下载PDF
基于X3D矿井巷道显示方法
12
作者 马甲军 郑国禹 车向前 《自动化技术与应用》 2014年第3期25-28,共4页
Web3D联盟发布的X3D标准作为下一代面向互联网的三维图形描述规范,已经被ISO批准成为国际标准,越来越广泛地应用于教育、工业现场规划展示、虚拟现实等方面。介绍X3D中Extrusion节点在矿井巷道建模的实现方法,对于实现虚拟数字矿山的真... Web3D联盟发布的X3D标准作为下一代面向互联网的三维图形描述规范,已经被ISO批准成为国际标准,越来越广泛地应用于教育、工业现场规划展示、虚拟现实等方面。介绍X3D中Extrusion节点在矿井巷道建模的实现方法,对于实现虚拟数字矿山的真实感有重要的现实意义。 展开更多
关键词 虚拟矿山 巷道 Extrution节点 组节点 文本节点
在线阅读 下载PDF
基于Lucene的全文检索架构设计 被引量:4
13
作者 崔诗程 李千目 戈峰 《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第6期692-697,共6页
为在海量数据中快速定位所需信息,解决因数据结构化、半结构化差异造成的检索困难,该文提出了一种基于Lucene的全文检索架构。根据分布式并行计算的设计原理,将检索任务分发给每个子节点服务器并行完成检索工作,最终由根节点服务器汇总... 为在海量数据中快速定位所需信息,解决因数据结构化、半结构化差异造成的检索困难,该文提出了一种基于Lucene的全文检索架构。根据分布式并行计算的设计原理,将检索任务分发给每个子节点服务器并行完成检索工作,最终由根节点服务器汇总结果。子节点服务器也采用了并行化的设计理念。验证性实验显示该文基于Lucene的全文检索架构与传统全文检索架构相比检索耗时降低55%以上。 展开更多
关键词 全文检索 分布式并行计算 子节点服务器 根节点服务器
在线阅读 下载PDF
文本特征和图结点混合增强的图卷积网络文本分类 被引量:2
14
作者 杨晓奇 刘伍颖 《新疆大学学报(自然科学版)(中英文)》 CAS 2024年第1期69-77,109,共10页
在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比... 在BertGCN模型的基础上改进其结构,同时结合文本特征和图结点混合增强的方法,使用新的边权重计算算法BM25+构造图的边.使用R8、R52、Ohsumed和MR这4个常用的公开数据集来验证所提方法的有效性.结果表明:与BertGCN模型及其它基线模型相比,该方法在4个文本分类数据集上的准确率评价指标均有不同程度的提升. 展开更多
关键词 BM25+ 文本特征增强 图结点增强 预训练模型 图卷积网络 文本分类
在线阅读 下载PDF
网络游记文本中旅游行程链提取方法 被引量:4
15
作者 阮陵 葛军莲 +2 位作者 张翎 王黎淑 王晓宣 《地球信息科学学报》 EI CSCD 北大核心 2024年第2期477-487,共11页
网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本... 网络游记是旅游者在互联网上发布的自述性旅游过程记录,描述了旅游的前后过程和感受体验。从网络游记文本中提取旅游行程链,分析行程结构,能给游客的行程制定、线路设计提供重要的参考。传统的游记文本行程提取大多依赖于人工识别文本中的行程节点,再进行串联、合并处理,工作量较大。自动提取游记文本中的旅游行程链,能够提高数据处理和分析效率。本文基于自然语言处理技术,在深入分析游记网络文本的段落结构和表达特点的基础上,归纳了行程节点和节点次序关系的句法表达规则,构建了行程节点触发词表,进而提出了基于句法规则的旅游行程链提取方法,主要包含行程节点的识别、节点次序关系的识别和旅游行程链的生成,能实现网络游记文本的旅游行程重构。本文采集了蚂蜂窝平台17 226篇南京市网络游记文本数据,采用最长公共子序列算法,开展了本文方法的试验验证。通过对比分析,本文方法提取的旅游行程链和人工识别的真实行程链相似度达到86.14%,高于实体关系抽取领域的BERT-BiLSTM-CasRel深度学习模型的83.1%。相比现有关系提取类深度学习方法需要开展大量的数据标注,本文方法计算更加便捷,准确率相对较高,仅需构建区域旅游点名录,即可实现网络游记文本中行程信息的自动提取。 展开更多
关键词 网络游记 网络文本 旅游行程链 行程重构 行程提取 节点识别 规则匹配
原文传递
基于文本注意力机制优化的网络表示学习模型
16
作者 唐彦龙 冶忠林 +1 位作者 赵海兴 仁青卓么 《郑州大学学报(理学版)》 CAS 北大核心 2023年第6期41-47,共7页
在经典网络表示学习框架上进行改进,提出了基于文本注意力机制优化的网络表示学习模型。首先学习上下文节点的平均嵌入,然后利用上下文节点的平均嵌入引入注意力机制,目标节点的嵌入由注意力和文本嵌入共同决定。在文本特征上添加注意... 在经典网络表示学习框架上进行改进,提出了基于文本注意力机制优化的网络表示学习模型。首先学习上下文节点的平均嵌入,然后利用上下文节点的平均嵌入引入注意力机制,目标节点的嵌入由注意力和文本嵌入共同决定。在文本特征上添加注意力机制,旨在为文本特征中的词语学习不同的权重值,使得对模型有利的词语得到最大贡献,有效避免低频词、噪声词对模型的影响。在Citeseer(M10)、DBLP(V4)和SDBLP三个数据集上进行实验,结果表明,该模型的网络节点分类性能优于DeepWalk算法和同类别表示学习算法。在网络可视化分析中,所提算法有明显的聚类现象和聚类边界,获得了期望的结果。 展开更多
关键词 网络表示学习 注意力机制 随机游走 节点嵌入 文本特征
在线阅读 下载PDF
多节点动作时序的文本描述及软件实现
17
作者 顾颖佳 邹鲲 《机床与液压》 北大核心 2014年第4期69-74,共6页
制造业柔性化的趋势使得分布式控制系统得以迅速发展,多节点控制软件的重要性日益突出。提出了一种将动作时序与人机交互界面编程分离的方法:利用文本语言描述动作时序图,对其进行编辑、解释,生成独立于界面的后台动作执行程序。利用Lab... 制造业柔性化的趋势使得分布式控制系统得以迅速发展,多节点控制软件的重要性日益突出。提出了一种将动作时序与人机交互界面编程分离的方法:利用文本语言描述动作时序图,对其进行编辑、解释,生成独立于界面的后台动作执行程序。利用LabVIEW软件的VI Scripting功能,通过实例验证该编程方法是可行的。 展开更多
关键词 多节点动作时序 LABVIEW VI SCRIPTING 动作文本 动作解释
在线阅读 下载PDF
一种基于自适应关联熵的关键字提取算法 被引量:1
18
作者 罗有志 陈征明 +1 位作者 陈明 梅文涛 《计算机与现代化》 2020年第4期67-71,共5页
相较于传统的依托词汇频率大小进行关键字提取技术,TextRank算法能够考虑词汇节点之间的相似性信息,却仍忽略了词汇上下文信息以及文章的语义结构等。在节点图权重迭代的基础上,本文利用文本上下文词汇的关联规则信息,引入关联熵的概念... 相较于传统的依托词汇频率大小进行关键字提取技术,TextRank算法能够考虑词汇节点之间的相似性信息,却仍忽略了词汇上下文信息以及文章的语义结构等。在节点图权重迭代的基础上,本文利用文本上下文词汇的关联规则信息,引入关联熵的概念,自适应调整阻尼系数和滑动窗口大小,更贴近文本词汇的实际语义情况,能够较好地处理低词频和新词汇信息。实验表明,相较于TFIDF和TR等算法,本文算法在处理关键字提取时能够达到更准确的效果。 展开更多
关键词 提取 关联规则 textRank 节点
在线阅读 下载PDF
工程时标网络图的自动绘制
19
作者 江蓉 《安徽建筑》 2010年第1期104-104,125,共2页
工程时标网络图的绘制是制作投标标书中一项重要工作,使用人工方法很难在短时间内完成。文中介绍如何使用AutoLisp设计一套完整的程序,解决工程时标网络图的自动绘制工作。该程序不但能提高工作效率,而且使绘制的工程时标网络图更美观,... 工程时标网络图的绘制是制作投标标书中一项重要工作,使用人工方法很难在短时间内完成。文中介绍如何使用AutoLisp设计一套完整的程序,解决工程时标网络图的自动绘制工作。该程序不但能提高工作效率,而且使绘制的工程时标网络图更美观,规范。 展开更多
关键词 网络计划 工程时标网络图 节点 块属性 文字标注 线型 AUTOCAD AUTOLISP
在线阅读 下载PDF
基于区块链的实景三维地理信息数据加密控制系统设计
20
作者 范巍 黄蕾 赵晶 《计算机测量与控制》 2024年第3期169-175,共7页
为解决由公钥文本、私钥文本不匹配造成的信息数据错误加密问题,实现对实景三维地理信息数据的按需加密处理,设计了基于区块链的实景三维地理信息数据加密控制系统;设置CPU主机端调度模块、地理信息数据处理模块和混合加密模块作为主要... 为解决由公钥文本、私钥文本不匹配造成的信息数据错误加密问题,实现对实景三维地理信息数据的按需加密处理,设计了基于区块链的实景三维地理信息数据加密控制系统;设置CPU主机端调度模块、地理信息数据处理模块和混合加密模块作为主要元件,联合数字签名结构,完善矢量化计算单元的连接形式,完成对数据加密控制系统硬件的设计;按照区块链编码原则,确定关键区块角色的组成情况与公钥密码体制定义条件,并以此为基础,计算数据多项式结果;再根据Curl加密节点部署形式,求解隐藏加密向量的具体数值,实现对实景三维地理信息数据的加密处理;结合相关硬件应用结构,完成基于区块链的实景三维地理信息数据加密控制系统的设计;实验结果表明,设计系统的公钥文本、私钥文本之间的长度差不超过0.25 kB,能够较好解决由密钥文本不匹配造成的信息数据错误加密问题,符合按需加密处理实景三维地理信息数据的实际应用需求。 展开更多
关键词 区块链技术 实景三维 地理信息数据 加密控制系统 数字签名 数据多项式 Curl加密节点 公钥文本 私钥文本
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部