期刊文献+
共找到108篇文章
< 1 2 6 >
每页显示 20 50 100
语言网络研究进展 被引量:11
1
作者 韩普 王东波 +1 位作者 路高飞 苏新宁 《中文信息学报》 CSCD 北大核心 2014年第1期9-18,共10页
语言网络作为一个新的研究领域,其研究正在迅速崛起,目前已经吸引了不少领域的研究者们的关注。该文首先简要介绍了语言网络的特点、常用的统计特征以及相关的网络模型;其次,根据语言构成单位以及当前语言网络研究热点,将语言网络分为... 语言网络作为一个新的研究领域,其研究正在迅速崛起,目前已经吸引了不少领域的研究者们的关注。该文首先简要介绍了语言网络的特点、常用的统计特征以及相关的网络模型;其次,根据语言构成单位以及当前语言网络研究热点,将语言网络分为语音网络、共现网络、依存句法网络、概念语义网络,并详细介绍了各类语言网络研究的主要进展。最后总结了语言网络研究的现状并给出了展望。 展开更多
关键词 语言网络 小世界现象 无尺度分布
在线阅读 下载PDF
词性对中英文文本聚类的影响研究 被引量:11
2
作者 韩普 王东波 +1 位作者 刘艳云 苏新宁 《中文信息学报》 CSCD 北大核心 2013年第2期65-73,共9页
不同词性特征在文本聚类中有不同的贡献度。该文对四组有代表性的中英文数据集,利用三种聚类算法验证了四种主要词性及其组合对中英文文本聚类的影响。实验结果表明,在中文和英文两种语言中,名词均是表征文本内容的最重要词性,动词、形... 不同词性特征在文本聚类中有不同的贡献度。该文对四组有代表性的中英文数据集,利用三种聚类算法验证了四种主要词性及其组合对中英文文本聚类的影响。实验结果表明,在中文和英文两种语言中,名词均是表征文本内容的最重要词性,动词、形容词和副词均对文本聚类结果有帮助,仅选择名词作为特征聚类的结果与保留所有词性聚类的结果相近,但可大大降低文本的维度;选用名词为文本特征不能实现最好的聚类效果;相对其他词性组合和单一词性,采用名词、动词、形容词和副词的组合特征往往可以实现更好的聚类效果。在词性所占的比例以及单一词性聚类的结果上,同一词性在中英文文本聚类中呈现出较大差异。相对于英文,不同词性特征及其组合在中文文本聚类中呈现的差异更为稳定。 展开更多
关键词 词性标注 文本聚类 文本特征
在线阅读 下载PDF
云计算在国内外数字图书馆中的应用及进展 被引量:14
3
作者 韩普 沈思 路高飞 《现代情报》 CSSCI 2012年第5期67-70,共4页
云计算是当前信息技术的研究热点,其应用正逐渐普及,云计算的快速发展引起了图书馆界的关注。本文介绍了国内外云计算的应用现状,讨论了国内外图书馆利用云计算的情况,分析了云计算在图书馆应用中的阻碍并对其应用进行了展望。
关键词 云计算 数字图书馆 网格计算
在线阅读 下载PDF
跨学科性的理论与实践研究综述 被引量:14
4
作者 韩普 王东波 《情报学报》 CSSCI 北大核心 2014年第11期1222-1232,共11页
本文首先介绍了跨学科和跨学科性的相关概念并对国内外文献进行了科学计量分析,其次从个人/作者、期刊和学科领域等层面阐述了跨学科性的理论研究和实践进展。接着总结了跨学科性研究的数据来源和研究方法,最后归纳了跨学科性的研究... 本文首先介绍了跨学科和跨学科性的相关概念并对国内外文献进行了科学计量分析,其次从个人/作者、期刊和学科领域等层面阐述了跨学科性的理论研究和实践进展。接着总结了跨学科性研究的数据来源和研究方法,最后归纳了跨学科性的研究意义,并给出了研究展望。通过对跨学科性理论与实践的系统梳理,进一步明确了跨学科性的研究思路和研究框架,有助于为学者有针对性的开展跨学科研究提供参考。 展开更多
关键词 跨学科研究 跨学科性 交叉学科 学科分类
在线阅读 下载PDF
基于复杂网络的汉语相似词挖掘和相似度计算研究 被引量:5
5
作者 韩普 王东波 朱恒民 《情报学报》 CSSCI 北大核心 2015年第8期885-896,共12页
相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先,基于大规模语料库构建了汉语词汇共现网络,进而利用复杂网络结构中节点相似的思想来计算词汇的相似度。其次,基于分... 相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先,基于大规模语料库构建了汉语词汇共现网络,进而利用复杂网络结构中节点相似的思想来计算词汇的相似度。其次,基于分布假设、上下文语境理论和词汇网络结构的特点,本文提出了基于贡献度折扣的词汇相似度计算方法,该方法不仅考虑了网络边的权重信息,还将节点的全局度特征融合进来。通过节点相似度实验发现,本文提出的基于贡献度折扣的相似度算法要明显好于共同邻居法、Jaccard方法和Sahon方法。最后文章就实验结果及其结论做了详细分析。 展开更多
关键词 复杂网络 语料库 词汇相似度 语义相关度
在线阅读 下载PDF
HMM在自然语言处理领域中的应用研究 被引量:16
6
作者 韩普 姜杰 《计算机技术与发展》 2010年第2期245-248,252,共5页
隐马尔可夫模型(HMM)是一种强大的统计学机器学习技术,该模型已经成功地应用于连续语音识别、在线手写识别,在生物学信息中也得到了广泛的应用。由于该模型的强大的学习能力,在自然语言处理领域逐渐得到了应用。对隐马尔可夫模型在词性... 隐马尔可夫模型(HMM)是一种强大的统计学机器学习技术,该模型已经成功地应用于连续语音识别、在线手写识别,在生物学信息中也得到了广泛的应用。由于该模型的强大的学习能力,在自然语言处理领域逐渐得到了应用。对隐马尔可夫模型在词性标注、命名实体识别、信息抽取应用中的关键问题进行了分析,着重分析了在信息抽取时使用隐马尔可夫模型的重点和难点问题,期望让更多的研究人员进一步认识和了解HMM。最后分析了隐马尔可夫模型在应用中的不足之处和改进研究。 展开更多
关键词 隐马尔可夫模型 信息抽取 词性标注 命名实体
在线阅读 下载PDF
词汇相似度计算和相似词挖掘研究进展 被引量:7
7
作者 韩普 王东波 王子敏 《情报科学》 CSSCI 北大核心 2016年第9期161-165,共5页
作为语言的三大构成要素之一,词汇在人类的思维活动和思想交流中发挥着无可替代的作用。相似词是自然语言中一个普遍存在的现象,相似度计算是其它多个研究的中间步骤。本文阐述了相似度的概念以及相似词挖掘的相关理论基础;基于所使用... 作为语言的三大构成要素之一,词汇在人类的思维活动和思想交流中发挥着无可替代的作用。相似词是自然语言中一个普遍存在的现象,相似度计算是其它多个研究的中间步骤。本文阐述了相似度的概念以及相似词挖掘的相关理论基础;基于所使用的资源,将词汇相似度研究划分为基于语义词典、基于语料库和基于百科文档链接的方法,并分别进行了述评;介绍了词汇相似度的评价方法以及词汇相似研究的未来趋势。 展开更多
关键词 相似词 接近词 相似度计算
原文传递
基于文献计量学的国内突发事件研究分析 被引量:2
8
作者 韩普 朱光 +1 位作者 谢靖 钱爱兵 《情报杂志》 CSSCI 北大核心 2012年第4期48-53,共6页
近年来,突发事件研究引起了新闻传播学、公共管理学、心理学和信息管理等学科领域关注。本文运用文献计量法对2000-2010年的国内学术领域发表有关突发事件的学术论文进行了统计分析。分别从年发文量、主要期刊、主要学科、核心作者、研... 近年来,突发事件研究引起了新闻传播学、公共管理学、心理学和信息管理等学科领域关注。本文运用文献计量法对2000-2010年的国内学术领域发表有关突发事件的学术论文进行了统计分析。分别从年发文量、主要期刊、主要学科、核心作者、研究主题等多角度进行了统计分析,以期了解国内突发事件研究进展、研究方向等问题。为国内突发事件的相关研究提供参考。 展开更多
关键词 突发事件 文献计量 研究主题
在线阅读 下载PDF
Stemming和Lemmatization对英文文本聚类的影响研究 被引量:2
9
作者 韩普 王东波 路高飞 《情报理论与实践》 CSSCI 北大核心 2012年第7期109-113,共5页
词干化、词形还原是英文文本处理中的一个重要步骤。本文利用3种聚类算法对两个Stemming算法和一个Lemmatization算法进行较为全面的实验。结果表明,Stemming和Lemmatization都可以提高英文文本聚类的聚类效果和效率,但对聚类结果的影... 词干化、词形还原是英文文本处理中的一个重要步骤。本文利用3种聚类算法对两个Stemming算法和一个Lemmatization算法进行较为全面的实验。结果表明,Stemming和Lemmatization都可以提高英文文本聚类的聚类效果和效率,但对聚类结果的影响并不显著。相比于Snowball Stemmer和Stanford Lemmatizer,Porter Stemmer方法在Entropy和Pu-rity表现上更好,也更为稳定。 展开更多
关键词 词干化 词形还原 文本聚类 信息检索
原文传递
基于混合策略的英汉双语新闻聚类研究 被引量:2
10
作者 韩普 万接喜 王东波 《情报科学》 CSSCI 北大核心 2013年第1期118-122,共5页
英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类... 英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双语混合的方法进行了文本聚类比较研究,实验结果表明,基于英汉双语混合的文本聚类方法可以取得较好的聚类结果。 展开更多
关键词 双语聚类 多语聚类 混合策略方法
原文传递
基于重复模式的论坛信息抽取研究 被引量:4
11
作者 韩普 王泽 《南京师范大学学报(工程技术版)》 CAS 2010年第3期74-77,共4页
针对现有网络论坛信息抽取的不足,提出了一种基于重复模式发现算法的论坛信息抽取方法.该方法首先利用Sgm-lReader解析器将HTML文档转换为格式规范的XHTML文档,然后通过计算XHTML文档结构中DOM子树相似度,自动发现论坛页面结构的重复模... 针对现有网络论坛信息抽取的不足,提出了一种基于重复模式发现算法的论坛信息抽取方法.该方法首先利用Sgm-lReader解析器将HTML文档转换为格式规范的XHTML文档,然后通过计算XHTML文档结构中DOM子树相似度,自动发现论坛页面结构的重复模式.该方法通过自动定位重复模式进行论坛信息抽取,较好地解决了在论坛信息抽取过程中需要人工查找、定位重复模式或者通过人工分析论坛页面代码定制抽取规则的问题.试验结果表明,该方法具有较好的准确性、通用性和实用性. 展开更多
关键词 重复模式 论坛抽取 信息抽取
在线阅读 下载PDF
大模型推理任务调度系统设计与优化研究
12
作者 周祥生 肖萍 韩普 《信息通信技术》 2025年第3期37-44,共8页
随着大模型的广泛应用,大模型推理服务在高并发场景下面临资源分配复杂、响应延迟高等挑战。现有任务调度方法难以兼顾性能与公平性,导致资源浪费和用户体验欠佳。为此,文章提出一种面向AI大模型部署的高效请求调度系统。主要创新包括:... 随着大模型的广泛应用,大模型推理服务在高并发场景下面临资源分配复杂、响应延迟高等挑战。现有任务调度方法难以兼顾性能与公平性,导致资源浪费和用户体验欠佳。为此,文章提出一种面向AI大模型部署的高效请求调度系统。主要创新包括:综合优先级调度算法,结合任务难度、等待时间和用户优先级动态计算请求优先级;引入饥饿忍耐阈值,平衡公平性与效率,避免低优先级任务长期延迟;设计迭代级调度机制,通过逐轮调整请求顺序显著降低响应延迟。实验结果表明,该方法在吞吐量、资源利用率和响应时间等指标上优于现有方法,显著提升系统性能与稳定性。文章技术已在智能政务、智能制造等场景中展现广泛应用前景,为推动大模型在各行业普及提供有力支撑。 展开更多
关键词 大模型推理 高效调度 优先级排序 动态调度 响应延迟优化
在线阅读 下载PDF
基于利益相关者理论的高校网络教学资源建设和共享机制研究 被引量:2
13
作者 韩普 《计算机教育》 2016年第4期114-116,120,共4页
介绍管理学中利益相关者理论,给出高校网络教学资源利益相关者概念并分析利益相关者的利益诉求,提出高校网络教学资源建设和共享的机制。
关键词 利益相关者 网络教学资源 高等教育
在线阅读 下载PDF
文本中知识点的知识组织系统研究与架构
14
作者 韩普 王东波 谢靖 《图书与情报》 CSSCI 北大核心 2013年第6期13-18,共6页
受到超链接思想的启发,针对网页文本中不断出现的新知识点,文章从用户阅读的角度,提出了一个面向文本中知识点的知识组织系统架构。文章所提出的系统架构不仅可有效地解决用户在文本阅读中的知识"迷途"的问题,还可以根据知识... 受到超链接思想的启发,针对网页文本中不断出现的新知识点,文章从用户阅读的角度,提出了一个面向文本中知识点的知识组织系统架构。文章所提出的系统架构不仅可有效地解决用户在文本阅读中的知识"迷途"的问题,还可以根据知识点的使用信息,为用户提供更有价值的知识应用服务。 展开更多
关键词 知识组织 知识点 知识库
在线阅读 下载PDF
基于最大似然估计方法的齐普夫定律验证
15
作者 韩普 路高飞 王东波 《情报理论与实践》 CSSCI 北大核心 2012年第11期6-11,共6页
文章采用最大似然估计的方法对齐普夫分布曲线进行拟合。该方法对齐普夫定律的词谱分布,利用KS检验的方法得到在双对数坐标下拟合度最优的直线。与传统的最小二乘法相比,该方法拟合结果更为准确。为了验证该方法的有效性,通过3组中英文... 文章采用最大似然估计的方法对齐普夫分布曲线进行拟合。该方法对齐普夫定律的词谱分布,利用KS检验的方法得到在双对数坐标下拟合度最优的直线。与传统的最小二乘法相比,该方法拟合结果更为准确。为了验证该方法的有效性,通过3组中英文语料实验发现,英文较好地符合齐普夫定律,中文并不太符合。 展开更多
关键词 齐普夫定律 最大似然估计 词谱分布
原文传递
基于汉语树库的名词短语知识计量分析
16
作者 韩普 王东波 《情报科学》 CSSCI 北大核心 2013年第11期51-56,63,共7页
基于清华汉语树库,构建了多叉树结构的句法树。分别从名词短语的内部结构、内部词性序列、外部句法功能和左右边界特征几个方面,对清华汉语树库中的名词短语进行了知识计量统计分析。本文的研究可为名词短语的自动识别提供更全面的语言... 基于清华汉语树库,构建了多叉树结构的句法树。分别从名词短语的内部结构、内部词性序列、外部句法功能和左右边界特征几个方面,对清华汉语树库中的名词短语进行了知识计量统计分析。本文的研究可为名词短语的自动识别提供更全面的语言学知识和语言学规则,也为其它短语结构识别提供可借鉴的方法。最终为自然语言处理中的句法分析和语义分析提供数据支持。 展开更多
关键词 名词短语 知识计量 汉语树库
原文传递
基于多尺度注意力和图神经网络的多模态医学实体识别研究 被引量:2
17
作者 韩普 刘森嶺 陈文祺 《数据采集与处理》 北大核心 2025年第4期922-933,共12页
随着信息技术的快速发展,医疗健康领域中文文本、图像等多模态数据呈现出了爆发式增长。多模态医学实体识别(Multi-modal medical entity recognition,MMER)是多模态信息抽取的关键环节,近期受到了极大关注。针对多模态医学实体识别任... 随着信息技术的快速发展,医疗健康领域中文文本、图像等多模态数据呈现出了爆发式增长。多模态医学实体识别(Multi-modal medical entity recognition,MMER)是多模态信息抽取的关键环节,近期受到了极大关注。针对多模态医学实体识别任务中存在图像细节信息损失和文本语义理解不足问题,提出一种基于多尺度注意力和图神经网络(Multi-scale attention and dependency parsing graph convolution,MADPG)的MMER模型。该模型一方面基于ResNet引入多尺度注意力机制,协同提取不同空间尺度融合的视觉特征,减少医学图像重要细节信息丢失,进而增强图像特征表示,补充文本语义信息;另一方面利用依存句法结构构建图神经网络,捕捉医学文本中词汇间复杂语法依赖关系,以丰富文本语义表达,促进图像文本特征深层次融合。实验表明,本文提出的模型在多模态中文医学数据集上F_(1)值达到95.12%,相较于主流的单模态和多模态实体识别模型性能得到了明显提升。 展开更多
关键词 多模态医学实体识别 多尺度注意力 图卷积神经网络 多模态融合 语义特征
在线阅读 下载PDF
蒲公英甾醇粗提物抗炎作用研究 被引量:19
18
作者 刘婧陶 韩普 +2 位作者 刘利本 程瑶 张雪梅 《动物医学进展》 CSCD 北大核心 2012年第12期104-106,共3页
通过建立醋酸致小鼠毛细血管通透性增强模型,二甲苯致小鼠耳廓肿胀模型和角叉菜胶致大鼠足趾肿胀模型,研究蒲公英甾醇粗提物对炎症的抑制作用。设立模型组,蒲公英甾醇粗提物组和阳性组,蒲公英甾醇粗提物组分别给予蒲公英甾醇750、375、1... 通过建立醋酸致小鼠毛细血管通透性增强模型,二甲苯致小鼠耳廓肿胀模型和角叉菜胶致大鼠足趾肿胀模型,研究蒲公英甾醇粗提物对炎症的抑制作用。设立模型组,蒲公英甾醇粗提物组和阳性组,蒲公英甾醇粗提物组分别给予蒲公英甾醇750、375、187.5mg/kg,连续灌胃5d,观察蒲公英甾醇对小鼠毛细血管通透性、耳廓肿胀和大鼠足趾肿胀的抑制作用。结果显示,蒲公英甾醇对醋酸致小鼠毛细血管通透性增强,二甲苯致小鼠耳廓肿胀和角叉菜胶致大鼠足趾肿胀均有显著抑制作用。表明蒲公英甾醇具有明显的体内抗炎作用。 展开更多
关键词 蒲公英甾醇 通透性 肿胀 炎症
在线阅读 下载PDF
面向知识服务的知识组织工具:现状与未来 被引量:11
19
作者 谢靖 钱爱兵 +1 位作者 韩普 苏新宁 《现代图书情报技术》 CSSCI 北大核心 2013年第9期8-14,共7页
从知识服务角度出发,对知识组织工具进行探讨,将其划分为基础知识与知识架构类工具、知识关系建立类工具、知识处理及展现类工具。从这三个分类的角度,对现有的知识组织工具分别进行探讨。基础知识与知识架构类工具主要通过系统化知识... 从知识服务角度出发,对知识组织工具进行探讨,将其划分为基础知识与知识架构类工具、知识关系建立类工具、知识处理及展现类工具。从这三个分类的角度,对现有的知识组织工具分别进行探讨。基础知识与知识架构类工具主要通过系统化知识组织提供知识点推送服务,充当语义级的知识库角色;知识关系建立类工具则通过对知识点的关联建立提供深层次的知识关联服务,在此基础上通过与基础知识及知识架构类工具相结合,提供相应的知识推理服务;知识处理及展现类工具是知识抽取、关系建立、呈现等工作中所涉及的实用工具,这些工具以用户需求为中心完成对知识的重组。最后,对知识组织工具的未来进行展望,提出多维融合、网络化、分布式、个性化、动态化是其发展方向。 展开更多
关键词 知识组织 知识服务 知识组织工具
原文传递
基于增强异构图融合的多模态医学实体识别研究 被引量:1
20
作者 韩普 李雄 《现代情报》 北大核心 2025年第6期34-45,共12页
[目的/意义]为充分挖掘医学图像与文本间语义关联信息,本文利用增强异构图融合方法提升图像特征表示并进行模态信息交互实现特征融合,进而提升多模态医学实体识别效果。[方法/过程]首先利用RoBERTa和ResNet分别提取医学文本与图像特征,... [目的/意义]为充分挖掘医学图像与文本间语义关联信息,本文利用增强异构图融合方法提升图像特征表示并进行模态信息交互实现特征融合,进而提升多模态医学实体识别效果。[方法/过程]首先利用RoBERTa和ResNet分别提取医学文本与图像特征,接着通过视觉增强模块捕获图像关键信息并过滤无关噪声,然后构建基于图像与文本节点和对应边的异构图以获取模态间细粒度语义关联,并通过自注意力机制、跨模态门控机制和位置前馈网络实现医学多模态特征融合,最后在中文多模态医学数据集上验证实体识别效果。[结果/结论]所构建的RMGFM模型在中文多模态医学数据集上F1值达到88.99%,相比UMT、AGBAN和UMGF等多模态基线模型的F1值分别提高了5.52%、5.28%和5.08%。实验表明Ro-UMGF*+Manifold(RMGFM)模型能有效挖掘医学图像和文本间语义关联信息,在中文多模态医学实体识别任务中表现优异。 展开更多
关键词 异构图融合 视觉增强 多模态命名实体识别 语义融合 医疗健康
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部