期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
An improved algorithm for weighting keywords in web documents 被引量:1
1
作者 孙双 贺樑 +1 位作者 杨静 顾君忠 《Journal of Shanghai University(English Edition)》 CAS 2008年第3期235-239,共5页
In this paper, an improved algorithm, web-based keyword weight algorithm (WKWA), is presented to weight keywords in web documents. WKWA takes into account representation features of web documents and advantages of t... In this paper, an improved algorithm, web-based keyword weight algorithm (WKWA), is presented to weight keywords in web documents. WKWA takes into account representation features of web documents and advantages of the TF*IDF, TFC and ITC algorithms in order to make it more appropriate for web documents. Meanwhile, the presented algorithm is applied to improved vector space model (IVSM). A real system has been implemented for calculating semantic similarities of web documents. Four experiments have been carried out. They are keyword weight calculation, feature item selection, semantic similarity calculation, and WKWA time performance. The results demonstrate accuracy of keyword weight, and semantic similarity is improved. 展开更多
关键词 improved vector space model (IVSM) representation feature feature item keyword weight semantic similarity
在线阅读 下载PDF
基于改进PositionRank算法的高校教师自我评价关键词提取方法
2
作者 齐晓亮 陈海鹏 +1 位作者 石泽男 王守佳 《吉林大学学报(工学版)》 北大核心 2025年第8期2753-2760,共8页
针对教师自我评价存在评价过程主观性较强、工作效率低下以及精准度不高等问题,本文提出了基于改进PositionRank算法的高校教师自我评价关键词提取方法。首先,对教师自我评价数据进行采集和清洗,去除冗余与异常数据以提高数据质量;其次... 针对教师自我评价存在评价过程主观性较强、工作效率低下以及精准度不高等问题,本文提出了基于改进PositionRank算法的高校教师自我评价关键词提取方法。首先,对教师自我评价数据进行采集和清洗,去除冗余与异常数据以提高数据质量;其次,采用基于图的关键词抽取算法生成高质量标签数据;最后,通过改进后的PositionRank算法自适应学习词组间的注意力权重,实现关键词的精准提取。实验结果表明:该方法能高效识别教师评价中的关键内容,显著提高关键词提取的准确性,同时具备较强的评价一致性,有助于揭示教师的核心优势与改进方向,为完善高校教师评价体系提供了有力的技术支撑。 展开更多
关键词 高校教师自我评价 关键词提取 自适应学习 注意力权重
原文传递
考虑关键词权重的电子病历多模态信息按序提取方法研究
3
作者 孙杰 胡鸣 《国外电子测量技术》 2025年第10期127-132,共6页
在按序提取电子病历多模态信息时,使用单一模态信息表征,会导致关键词提取不全面,进而影响提取结果的准确性。因此,提出一种考虑关键词提取的电子病历多模态信息按序提取方法。分别应用Transformer和卷积神经网络(Convolutional Neural ... 在按序提取电子病历多模态信息时,使用单一模态信息表征,会导致关键词提取不全面,进而影响提取结果的准确性。因此,提出一种考虑关键词提取的电子病历多模态信息按序提取方法。分别应用Transformer和卷积神经网络(Convolutional Neural Network,CNN)提取电子病历的文本模态和图像模态信息的表征,进而构建电子病历信息的表征向量。对提取的表征信息进行融合,得到多模态信息表示模型,计算模型中多个特征的信息熵值,并选择信息熵值较高的特征作为关键词。在计算提取的关键词权重值后,引入门控循环单元(Gate Recurrent Unit,GRU)构建多模态信息的时序模型,以实现对电子病历多模态信息的按序提取。实验结果表明,方法能够准确提取出多模态信息,且提取结果的多模态信息对齐度为0.96,较参照组1和2分别提升了约26.3%和33.3%,证明其具有较为广泛的应用前景。 展开更多
关键词 关键词权重 电子病历 多模态信息 按序提取 卷积神经网络
原文传递
基于listwise算法的书目检索关键词权重排序研究
4
作者 王国隽 《陇东学院学报》 2025年第5期27-31,共5页
在庞大的文献数据库中进行检索时,可能会出现关键词表达不准确的情况,导致用户选择的关键词与文献内容不完全匹配,检索结果不够精准。为此,提出基于listwise算法的书目检索关键词权重排序方法。采用TF-IDF(term frequency-inverse docum... 在庞大的文献数据库中进行检索时,可能会出现关键词表达不准确的情况,导致用户选择的关键词与文献内容不完全匹配,检索结果不够精准。为此,提出基于listwise算法的书目检索关键词权重排序方法。采用TF-IDF(term frequency-inverse document frequency,词频-逆向文件频率)算法计算书目检索关键词权重,将在线学习方法与listwise算法相结合,通过最小化损失函数优化排序模型,在online-listwise算法中引入自适应学习率,实现书目检索关键词的精准排序。实验结果表明,该方法获取的关键词权值差异始终低于10%,可准确计算出不同关键词权重;不同书目数量下,该方法的MAP(Mean Average Precision,全类别平均正确率)均高于60%;不同检索关键词的排序结果与实际结果匹配数目基本都为15条,全部排序结果中仅存在4条书目偏差,排序结果稳定、精确,符合用户检索要求。 展开更多
关键词 listwise算法 书目检索 关键词权重排序 TF-IDF算法 损失函数
在线阅读 下载PDF
基于Bert语言模型的文本关键词提取
5
作者 黄键耿 祝亦楠 《长江信息通信》 2025年第4期134-136,共3页
在当前中文关键词提取领域,还未有效果十分完美的算法和模型,为了精准地挖掘出文本的热门关键词,文章通过Bert模型抽取语义向量进行划分聚类,再对各簇类应用关键词算法选出候选热词,最后引入自定义的“修正”贝叶斯平滑法和牛顿冷却定... 在当前中文关键词提取领域,还未有效果十分完美的算法和模型,为了精准地挖掘出文本的热门关键词,文章通过Bert模型抽取语义向量进行划分聚类,再对各簇类应用关键词算法选出候选热词,最后引入自定义的“修正”贝叶斯平滑法和牛顿冷却定律的加权词语热度计算形式,计算候选热词序列的词语热度,排序得到文本的热门关键词,为提取文本关键词提供了一种新的方法。 展开更多
关键词 Bert UMAP Kmeans 关键词提取 加权词语热度计算
在线阅读 下载PDF
国内外图书情报领域信息聚合的发展趋势分析 被引量:10
6
作者 曹树金 王连喜 王志红 《图书情报知识》 CSSCI 北大核心 2018年第4期79-90,共12页
信息聚合已经发展成为众多学科领域的研究热点,但是当前研究并未对其给出清晰、规范、统一的概念描述及内涵界定。文章首先从学科视角对计算机科学、经济管理学和图书情报学中关于信息聚合的概念、应用范围、实践手段等进行比较和分析,... 信息聚合已经发展成为众多学科领域的研究热点,但是当前研究并未对其给出清晰、规范、统一的概念描述及内涵界定。文章首先从学科视角对计算机科学、经济管理学和图书情报学中关于信息聚合的概念、应用范围、实践手段等进行比较和分析,明确图书情报领域信息聚合的基本内涵及其相近术语表达。然后,分别选取2007—2016年间SSCI和CSSCI中图书情报领域以信息聚合为主题的文献作为研究对象,在提出一种新的关键词权重计算和新兴主题识别方法的基础上,结合相对文献增长率和多维尺度分析方法对文献增长趋势、研究主题分布特点和新兴主题发展趋势等进行对比分析和可视化展示。研究表明,当前国内外图书情报领域信息聚合研究在应用领域发展路径、新兴主题变化趋势、重要研究主题分布以及所涉及的研究方法或技术等方面都具有相似的变化规律和发展趋势。最后,总结当前国内外图书情报领域信息聚合的研究特点,从学科、方法、主题等维度对该领域的未来发展趋势进行展望。 展开更多
关键词 信息聚合 关键词权重计算 新兴主题识别 图书情报领域
在线阅读 下载PDF
关键词自动提取方法的研究与改进 被引量:23
7
作者 黄磊 伍雁鹏 朱群峰 《计算机科学》 CSCD 北大核心 2014年第6期204-207,共4页
关键词提取技术是信息检索和文本分类领域的基础与关键技术之一。首先分析了TFIDF算法中存在的不足,即IDF(Inverse Document Frequency)权值中没有考虑特征词在类内以及类别间的分布情况。因此,原有的TFIDF方法会出现有些不能代表文档... 关键词提取技术是信息检索和文本分类领域的基础与关键技术之一。首先分析了TFIDF算法中存在的不足,即IDF(Inverse Document Frequency)权值中没有考虑特征词在类内以及类别间的分布情况。因此,原有的TFIDF方法会出现有些不能代表文档主题的低频词的IDF值很高,而有些能够代表文档主题的高频词的IDF值却很低的情况,这会导致关键词提取不准确。通过增加一个新的权值,即类内离散度DI(Distribution Information)来增加关键的特征词条的权重,提出了一种新的算法DI-TFIDF。实验中使用的是搜狗语料库,选择其中的体育、教育和军事3类文档各1000篇作为实验的语料库,分别用基于传统TFIDF方法和基于DI-TFIDF方法提取关键词。实验结果表明,所提出的DI-TFIDF方法提取关键词的准确度要高于传统的TFIDF算法。 展开更多
关键词 关键词提取 特征权重 TFIDF DI-TFIDF
在线阅读 下载PDF
减重步行训练对脑卒中后偏瘫步态康复的影响 被引量:30
8
作者 杨雅琴 张通 《中国康复医学杂志》 CAS CSCD 2004年第10期731-733,共3页
目的:观察减重步行训练(BWSTT)对脑卒中患者偏瘫步态的恢复作用。方法:51例脑卒中患者分入实验组(21例)和对照组(30例)。两组均进行常规运动疗法(PT),实验组加BWSTT。共6周,5次/周,1单元/天,30min/单元。训练前后各行1次评价。结果:... 目的:观察减重步行训练(BWSTT)对脑卒中患者偏瘫步态的恢复作用。方法:51例脑卒中患者分入实验组(21例)和对照组(30例)。两组均进行常规运动疗法(PT),实验组加BWSTT。共6周,5次/周,1单元/天,30min/单元。训练前后各行1次评价。结果:训练后实验组FAC评分、FMA下肢评分、步速、步长均明显提高(P<0.05),患侧单肢支撑期明显延长,双侧支撑期明显缩短(P<0.01),而对照组仅FMA下肢评分明显提高(P<0.001)。两组间对比,仅FMA下肢评分差异无显著性意义(P>0.05),其余各指标均为实验组改善更明显(P<0.05)。结论:BWSTT可提高偏瘫患者的步行能力、步速、步长,增加患侧单肢支撑期,减少双侧支撑期,改善步态对称性。 展开更多
关键词 减重步行训练 脑卒中 偏瘫 步态 康复
暂未订购
基于Web的自动答疑系统问题匹配算法研究与实现 被引量:11
9
作者 张同珍 申瑞民 《计算机工程与应用》 CSCD 北大核心 2003年第29期103-104,192,共3页
自动答疑系统是解决远程学习过程中大批量疑难问题的可行方案,在自动答疑系统中问题匹配是系统的核心。该文首先分析了问题匹配中的各种相关因素,提出了一个基于问题关键词、关键词权重、问题频度和典型语义词的问题匹配算法,并给出了... 自动答疑系统是解决远程学习过程中大批量疑难问题的可行方案,在自动答疑系统中问题匹配是系统的核心。该文首先分析了问题匹配中的各种相关因素,提出了一个基于问题关键词、关键词权重、问题频度和典型语义词的问题匹配算法,并给出了基于该算法的自动答疑系统的实现方案。 展开更多
关键词 自动答疑 问题匹配 关键词 关键词权重 问题频度 语义词
在线阅读 下载PDF
热点主题词提取方法研究 被引量:5
10
作者 程肖 陆蓓 谌志群 《现代图书情报技术》 CSSCI 北大核心 2010年第10期43-48,共6页
针对热点主题词的提取,在候选主题词的多级过滤中,尝试通过对大规模数据处理,分析其在时间标签基础上的统计规律来确定噪音词,提出联合方差的概念。基于多特征的融合提出热点主题词权重计算方法,构造出热点主题词判断公式HK,实现对热点... 针对热点主题词的提取,在候选主题词的多级过滤中,尝试通过对大规模数据处理,分析其在时间标签基础上的统计规律来确定噪音词,提出联合方差的概念。基于多特征的融合提出热点主题词权重计算方法,构造出热点主题词判断公式HK,实现对热点主题词的提取。实验结果表明,该方法对热点主题词的提取有一定的效果。 展开更多
关键词 网络舆情 中文分词 主题词 权重计算
原文传递
低分子肝素对急性胰腺炎患者预后的改善作用 被引量:17
11
作者 焦华波 乔治 +5 位作者 谭向龙 杜俊东 费阳 王大东 李基业 姚咏明 《中国危重病急救医学》 CAS CSCD 2004年第12期712-714,共3页
目的 观察低分子肝素抗凝治疗对急性胰腺炎患者预后的影响。方法 将41例急性胰腺炎患者随机分为抗凝治疗组(17例)和常规治疗对照组(24例)。抗凝治疗组给予低分子肝素钠40 mg或低分子肝素钙0.01 ml/kg皮下注射,12 h 1次;其他治疗同常规... 目的 观察低分子肝素抗凝治疗对急性胰腺炎患者预后的影响。方法 将41例急性胰腺炎患者随机分为抗凝治疗组(17例)和常规治疗对照组(24例)。抗凝治疗组给予低分子肝素钠40 mg或低分子肝素钙0.01 ml/kg皮下注射,12 h 1次;其他治疗同常规治疗对照组。观察两组患者的血清酶学及预后。结果低分子肝素抗凝治疗能明显改善急性胰腺炎患者的血象及动脉血氧分压变化,缩短住院时间,并能在一定程度上降低急性水肿型胰腺炎的重症化率,减少其二次手术率,降低病死率。低分子肝素抗凝治疗并没有加重急性胰腺炎的出血倾向或出血并发症。结论 低分子肝素抗凝治疗对急性胰腺炎是安全、有效的,能明显改善急性胰腺炎患者的预后。 展开更多
关键词 低分子肝素 抗凝治疗 胰腺炎 急性
暂未订购
扩散加权磁共振成像在急性脑梗死诊断中的价值 被引量:4
12
作者 刘军 张明 +4 位作者 鱼博浪 邵莹 刘庆禄 王泽忠 孙新建 《中国临床解剖学杂志》 CSCD 北大核心 2004年第5期495-498,共4页
目的:探讨扩散加权磁共振成像在急性脑梗死诊断中的价值。方法:采用Philips GyroscanIntera 1.5T磁共振系统,对19例临床诊断为急性脑梗死的患者行扩散加权磁共振成像(MRI-DWI),并与常规MRI结果比较,其中男11例,女8例,年龄35-70岁,平均年... 目的:探讨扩散加权磁共振成像在急性脑梗死诊断中的价值。方法:采用Philips GyroscanIntera 1.5T磁共振系统,对19例临床诊断为急性脑梗死的患者行扩散加权磁共振成像(MRI-DWI),并与常规MRI结果比较,其中男11例,女8例,年龄35-70岁,平均年龄52.5岁。结果:19例患者中,MRI-DWI在发病6 h以内提示急性脑梗死者17例,DWI和常规MRI的敏感性分别为100%和5.88%,其特异性均为100%,2例排除了脑梗死。结论:扩散加权磁共振成像对6 h以内发病的急性脑梗死的诊断明显高于常规MRI,并对脑梗死的临床治疗有指导意义。 展开更多
关键词 扩散加权 磁共振成像 急性脑梗死 诊断
暂未订购
基于文本挖掘的多用户投诉数据流聚类算法 被引量:10
13
作者 陈谦 徐兴梅 陈帅 《计算机仿真》 北大核心 2022年第5期423-426,498,共5页
传统数据聚类算法缺乏对文本信息的挖掘,造成聚类效果较差,因此提出一种基于文本挖掘的多用户投诉数据流聚类算法。依据文本挖掘技术原理,选择支持向量机作为文本聚类模型,在算法设计中,首先提取多用户投诉数据文本特征,根据关键字权值... 传统数据聚类算法缺乏对文本信息的挖掘,造成聚类效果较差,因此提出一种基于文本挖掘的多用户投诉数据流聚类算法。依据文本挖掘技术原理,选择支持向量机作为文本聚类模型,在算法设计中,首先提取多用户投诉数据文本特征,根据关键字权值和特征项总数,将高维度向量空间降维,删除无关紧要的特征项。使用综合度量法,计算Euclid距离、赫尔曼距离以及正弦相似度得到文本之间相似性,最后优化数据流聚类算法聚类流程,完成聚类算法的设计。设计实验测试所提聚类算法和传统算法的聚类性能,结果表明所提聚类算法的F1值较高,聚类性能优于传统算法。 展开更多
关键词 文本挖掘 数据流 聚类算法 支持向量机 关键字权值
在线阅读 下载PDF
基于VSM的权重改进文档相似度算法研究 被引量:9
14
作者 韩如冰 叶得学 《软件》 2012年第10期103-105,共3页
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用。文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法。基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文... 向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用。文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法。基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重。通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率。 展开更多
关键词 向量空间模型 关键词权重 查准率 查全率
在线阅读 下载PDF
基于TF统计和语法分析的关键词提取算法 被引量:12
15
作者 战学刚 吴强 《计算机应用与软件》 CSCD 北大核心 2014年第1期47-49,92,共4页
为了提高中文关键词提取的准确率和实用性,提出一种基于TF统计和语法分析相结合的中文关键词提取算法。该算法在对文本进行自动分词后,用TF统计和语法分析对每个词进行权重计算,然后根据计算结果提取文献的关键词。实验结果表明,该方法... 为了提高中文关键词提取的准确率和实用性,提出一种基于TF统计和语法分析相结合的中文关键词提取算法。该算法在对文本进行自动分词后,用TF统计和语法分析对每个词进行权重计算,然后根据计算结果提取文献的关键词。实验结果表明,该方法提高了关键词提取的精度。 展开更多
关键词 关键词提取 权重计算 语法分析 中文分词
在线阅读 下载PDF
基于元搜索引擎的多关键词检索技术 被引量:12
16
作者 陈伟雄 马少平 步建华 《计算机工程与应用》 CSCD 北大核心 2004年第24期83-87,93,共6页
文章根据主要中文搜索引擎Google和Baidu对多关键词的查询处理存在的缺陷,提出了“核心关键词”的概念和“分级权重”的计算方法;并进而提出了将基本搜索引擎搜索结果与网页内容分析合并相关度算法和元搜索引擎的准确度偏差评价公式。... 文章根据主要中文搜索引擎Google和Baidu对多关键词的查询处理存在的缺陷,提出了“核心关键词”的概念和“分级权重”的计算方法;并进而提出了将基本搜索引擎搜索结果与网页内容分析合并相关度算法和元搜索引擎的准确度偏差评价公式。研究表明,元搜索引擎不但消除了死链接和重复链接,而且准确度偏差与Google和Baidu相比,分别减少7.26%和12.47%,准确度得到了一定提高。 展开更多
关键词 元搜索引擎 核心关键词 分级权重
在线阅读 下载PDF
Web搜索结果多层聚类方法研究 被引量:1
17
作者 庞观松 蒋盛益 +2 位作者 张黎莎 区雄发 赖旭明 《情报学报》 CSSCI 北大核心 2011年第5期464-470,共7页
为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短... 为了便于用户浏览搜索引擎返回结果,本文提出了一种基于TFIDF新的文本相似度计算方法,并提出使用具有近似线性时间复杂度的增量聚类算法对文本进行多层聚类的策略。同时,提出了一种从多文本中提取关键词的策略:提取簇中的名词或名词短语作为候选关键词,综合考虑每个候选关键词的词频、出现位置、长度和文本长度设置加权函数来计算其权重,不需要人工干预以及语料库的协助,自动提取权重最大的候选关键词作为类别关键词。在收集的百度、ODP语料以及公开测试的实验结果表明本文提出方法的有效性。 展开更多
关键词 文本聚类 多层聚类 类别关键词提取 加权函数
在线阅读 下载PDF
川西北金矿的证据权模型及其预测应用 被引量:15
18
作者 张晓军 张均 +1 位作者 秦举礼 张建龙 《高校地质学报》 CAS CSCD 2000年第4期554-560,共7页
在深入理解川西北地区金矿成矿特征的基础上 ,建立了该区的地质、物探、化探、遥感和金矿床 (点 )数据库 ,优选了 10个致矿证据层。应用证据权模型对该区进行成矿分析 ,认为本区共有NW、NE、SN、EW四个方向上的金矿成矿区 ,同时分析了... 在深入理解川西北地区金矿成矿特征的基础上 ,建立了该区的地质、物探、化探、遥感和金矿床 (点 )数据库 ,优选了 10个致矿证据层。应用证据权模型对该区进行成矿分析 ,认为本区共有NW、NE、SN、EW四个方向上的金矿成矿区 ,同时分析了四个成矿区的分布特征和空间耦合关系。在此基础上 ,根据该区成矿概率分布进行了有利成矿远景区的预测 。 展开更多
关键词 证据权模型 证据层 成矿预测 金矿床 成矿特征
在线阅读 下载PDF
自适应定向加权中值滤波 被引量:11
19
作者 郭晓新 卢奕南 +2 位作者 许志闻 王云霄 庞云阶 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2005年第4期494-498,共5页
提出了自适应定向加权中值(ADWM)滤波的算法.ADWM滤波是结合定向滤波与加权中值滤波的思想而构造的滤波模型,是一种高度非线性的图像平滑和增强技术.运用移动窗口方差和基方差使ADWM滤波获得了自适应性.ADWM滤波器既有定向滤波器的特征... 提出了自适应定向加权中值(ADWM)滤波的算法.ADWM滤波是结合定向滤波与加权中值滤波的思想而构造的滤波模型,是一种高度非线性的图像平滑和增强技术.运用移动窗口方差和基方差使ADWM滤波获得了自适应性.ADWM滤波器既有定向滤波器的特征,也有中心加权中值滤波器的特征.定向滤波器可以有效保持边缘,而中心加权中值滤波器对减少随机噪声尤其有效,同时也能在一定程度上减少冲击噪声的数量,并根据子窗口内像素的最低方差自适应地调整中心像素的权值以保持图像的细节. 展开更多
关键词 ADWM滤波 定向滤波 滤波器 中值滤波 加权中值滤波
在线阅读 下载PDF
一种基于关键词的中文文档图像检索方法 被引量:5
20
作者 黄祥林 高芸 +1 位作者 杨丽芳 王鹏鹏 《中文信息学报》 CSCD 北大核心 2007年第4期61-64,72,共5页
本文提出了一种基于关键词的中文文档图像检索方法,能在不经OCR(Optical Character Recognition)识别的情况下,直接利用中文字符的图像特征进行关键词检索。首先将文档图像分割成单个中文字符图像,接着对字符图像进行汉字笔画的特征数... 本文提出了一种基于关键词的中文文档图像检索方法,能在不经OCR(Optical Character Recognition)识别的情况下,直接利用中文字符的图像特征进行关键词检索。首先将文档图像分割成单个中文字符图像,接着对字符图像进行汉字笔画的特征数据提取,然后在特征数据间进行基于WMHD(Weighted Modified Hausdorff Dis-tance)的相似性测量。该方法不受字号的影响,也有一定的抗字体能力,实验证明其具有较高的检索效果。 展开更多
关键词 计算机应用 中文信息处理 中文文档图像 关键词检索 加权的修正Hausdorff距离(WMHD)
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部