期刊文献+
共找到2,959篇文章
< 1 2 148 >
每页显示 20 50 100
基于Bootstrap-GA-ELM算法的清香型白酒发酵过程酒醅淀粉和水分含量区间预测模型
1
作者 张贵宇 向星睿 +3 位作者 张磊 王怡博 严俊 张云龙 《现代食品科技》 北大核心 2026年第3期211-222,共12页
针对清香型白酒发酵过程酒醅淀粉和水分含量信息难以获取的困境,且传统点预测模型仅提供单一预测值而难以量化结果的可靠度的问题,提出一种发酵过程酒醅淀粉和水分含量区间预测模型。首先,从黄水理化参数和酒醅温度等易测潜在解释变量中... 针对清香型白酒发酵过程酒醅淀粉和水分含量信息难以获取的困境,且传统点预测模型仅提供单一预测值而难以量化结果的可靠度的问题,提出一种发酵过程酒醅淀粉和水分含量区间预测模型。首先,从黄水理化参数和酒醅温度等易测潜在解释变量中,通过相关系数、最小角回归(LARS)综合分析确定酒醅淀粉和水分预测模型的输入参数。其次,通过遗传算法(GA)优化极限学习机(ELM)的隐层权值和阈值,建立精度较高的酒醅淀粉和水分点预测模型。最后,通过4种不同自助法(Bootstrap)对点预测结果、系统误差以及随机误差进行估计,以此构建不同置信度下的酒醅淀粉和水分含量预测区间。结果表明,在99%置信度下,基于Residual Bootstrap方法建立的区间预测模型效果最好,在酒醅淀粉和水分测试集上,点预测的判定系数(R^(2))和均方根误差(RMSE)分别为0.9989、0.1091,0.9203、0.8021,预测区间的区间覆盖率(PICP)和平均预测区间宽度(MPIW)分别为100%、0.7280%,100%、4.3399%。该研究可对清香型白酒发酵过程酒醅淀粉和水分含量进行可靠预测,为白酒生产指导和发酵过程透明化提供参考。 展开更多
关键词 酒醅 淀粉 水分 黄水 相关性 点预测 区间预测 bootstrap方法
在线阅读 下载PDF
General multi-steps variable-coefficient formulation for computing quasi-periodic solutions with multiple base frequencies
2
作者 Junqing Wu Ling Hong +1 位作者 Mingwu Li Jun Jiang 《Acta Mechanica Sinica》 2026年第1期260-275,共16页
Quasi-periodic solutions with multiple base frequencies exhibit the feature of 2π-periodicity with respect to each of the hyper-time variables.However,it remains a challenge work,due to the lack of effective solution... Quasi-periodic solutions with multiple base frequencies exhibit the feature of 2π-periodicity with respect to each of the hyper-time variables.However,it remains a challenge work,due to the lack of effective solution methods,to solve and track the quasi-periodic solutions with multiple base frequencies until now.In this work,a multi-steps variable-coefficient formulation is proposed,which provides a unified framework to enable either harmonic balance method or collocation method or finite difference method to solve quasi-periodic solutions with multiple base frequencies.For this purpose,a method of alternating U and S domain is also developed to efficiently evaluate the nonlinear force terms.Furthermore,a new robust phase condition is presented for all of the three methods to make them track the quasi-periodic solutions with prior unknown multiple base frequencies,while the stability of the quasi-periodic solutions is assessed by mean of Lyapunov exponents.The feasibility of the constructed methods under the above framework is verified by application to three nonlinear systems. 展开更多
关键词 multi-steps variable-coefficient formulation Phase condition Harmonic balance method Finite difference method Collocation method
原文传递
Interfacial Evolution and Accelerated Aging Mechanism for LiFePO_(4)/Graphite Pouch Batteries Under Multi-Step Indirect Activation
3
作者 Yun Liu Jinyang Dong +11 位作者 Jialong Zhou Yibiao Guan Yimin Wei Jiayu Zhao Jinding Liang Xixiu Shi Kang Yan Yun Lu Ning Li Yuefeng Su Feng Wu Lai Chen 《Nano-Micro Letters》 2026年第4期735-754,共20页
The dissolution of iron from the cathode and electrode/electrolyte interface(EEI)during long cycles significantly accelerates the aging process of LiFePO_(4)(LFP)/graphite batteries;there is a lack of systematic under... The dissolution of iron from the cathode and electrode/electrolyte interface(EEI)during long cycles significantly accelerates the aging process of LiFePO_(4)(LFP)/graphite batteries;there is a lack of systematic understanding of the spatial distribution of the EEI interface layer and the dissolve of Fe ions,especially in terms of the mechanism of the cathode-electrolyte interphase(CEI),solid electrolyte interphase(SEI),and iron dissolution.In this study,aged cells were subjected to continuous activation with constant current and multi-step segmented indirect activation(IA)and analyzed for capacity fade,impedance growth,and active Li^(+)mass loss at the EEI and nanoscale levels.The interaction between dissolved Fe^(2+)and the EEI in LFP/graphite pouch batteries was proposed and verified.The findings indicate that during IA process,the electric field facilitates the migration of solvated ions toward the electrodes,while simultaneously inhibiting the formation of organic species such as ROCO_(2)Li.The SEI primarily consists of a mixture of organic and inorganic small molecules,forming a continuous and uniform film on the electrode surface.This study demonstrates that IA favors the formation of a uniform EEI and offers constructive insights for advancing accelerated lifetime prediction strategies in lithium-ion batteries. 展开更多
关键词 Accelerated aging Electrode/electrolyte interface multi-step segmented indirect activation EEI film Dissolve of Fe ions
在线阅读 下载PDF
基于Bootstrap-DEA模型的陕西省三级综合医院技术效率实证研究
4
作者 张洁铭 陈鹏岗 《中国卫生信息管理杂志》 2026年第1期168-176,共9页
目的在公立医院高质量发展的政策背景下,探究陕西省三级综合医院技术效率并分析其影响因素,为完善政策和保障医院高质量发展提供决策参考。方法选取陕西省48所综合三级医院作为研究对象,运用Max DEA软件中的Bootstrap模块测算纠偏前后... 目的在公立医院高质量发展的政策背景下,探究陕西省三级综合医院技术效率并分析其影响因素,为完善政策和保障医院高质量发展提供决策参考。方法选取陕西省48所综合三级医院作为研究对象,运用Max DEA软件中的Bootstrap模块测算纠偏前后医院的相对效率值,选取的投入指标包括职工总数和实际开放床位数,产出指标包括年诊疗人次数、年出院人次数和病床使用率。运用Tobit模型分析技术效率的影响因素,选取有关医院高质量发展的医院运行管理指标,包括医院类型、城市类型、资源配置、工作负荷和工作效率,对医院的技术效率影响因素进行回归分析。结果陕西省48所综合三级医院间职工数和床位数差异较大,采用Bootstrap纠偏后,所有三级医院的技术效率得分均降低,纠偏前得分(均值0.767)高于纠偏后得分(均值0.643)。公立医院的纠偏后技术效率得分(均值0.654)高于民营医院的得分(均值0.566),但差异无统计学意义(P=0.327);位于省会城市的医院纠偏后技术效率得分(均值0.615)低于非省会城市的得分(均值0.666),但差异无统计学意义(P=0.180)。Tobit模型分析显示,资源配置维度的在职职工数与医院技术效率得分呈负相关,工作负荷与工作效率维度的总诊疗人次数、病床使用率和医院技术效率得分呈正相关。结论陕西省综合三级医院运行效率尚未达到最优,建议三级医院加强精细化管理,着重提高三级公立医院的总诊疗人次、加强医院床位管理、培育优秀临床人才。 展开更多
关键词 bootstrap-DEA模型 技术效率 陕西省 TOBIT模型 医院管理 医院信息挖掘
暂未订购
开放式地理实体关系抽取的Bootstrapping方法 被引量:30
5
作者 余丽 陆锋 刘希亮 《测绘学报》 EI CSCD 北大核心 2016年第5期616-622,共7页
从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词... 从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词,最终组织成结构化实例,并使用百度百科和Stanford CoreNLP开展了试验。研究结果表明,本文方法能自动挖掘自然语言的部分词法特征,无须领域专家知识和大规模标注语料,适用于未知关系类型的信息抽取任务;较之经典的Frequency、TFIDF和PPMI频率统计方法,精度和召回率分别提升约5%和23%。 展开更多
关键词 文本挖掘 地理实体 关系抽取 定量评价 bootstrapping
在线阅读 下载PDF
朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究 被引量:9
6
作者 段宇锋 朱雯晶 +1 位作者 陈巧 崔红 《现代图书情报技术》 CSSCI 北大核心 2014年第5期83-89,共7页
【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力。【结果】运用15 041... 【目的】降低中文物种描述文本语义标注的学习成本。【方法】设计基于Bootstrapping的弱监督学习方法,以少量数据为基础,迭代执行学习和标注过程。在迭代过程中,利用置信度最高的标注数据扩充知识库,提升标注能力。【结果】运用15 041条数据测试算法效率,F-value的平均值达到0.911 2。【局限】对过于稀疏的数据,标注效率相对较低。【结论】本研究设计的方法不仅有效降低系统学习对训练数据规模的要求,而且可提高标注效率。 展开更多
关键词 bootstrapping方法 朴素贝叶斯 物种描述文本 语义标注
原文传递
基于Bootstrapping支持向量机算法的森林干扰遥感监测 被引量:5
7
作者 李天宏 张洁 魏江月 《应用基础与工程科学学报》 EI CSCD 北大核心 2015年第2期308-317,共10页
森林干扰在全球和区域碳平衡、气候变化、植被生产力、蒸散发等多方面都有着重要的影响.遥感技术以其在动态监测中经济便捷的优势而成为大尺度森林干扰监测的主要手段.本文以大兴安岭为研究区域,利用2006年1km分辨率的MODIS反射率、LST... 森林干扰在全球和区域碳平衡、气候变化、植被生产力、蒸散发等多方面都有着重要的影响.遥感技术以其在动态监测中经济便捷的优势而成为大尺度森林干扰监测的主要手段.本文以大兴安岭为研究区域,利用2006年1km分辨率的MODIS反射率、LST和NDVI数据,有效提取归一化森林干扰变化信息.针对本研究扰动象元点与非扰动象元点存在较大差异的不平衡性问题,对比了SVM,one class SVM(OCSVM),和bootstrapping SVM分类器在不平衡分类中的效果,结果表明,bootstrapping SVM能够获得更稳定的模型和更高的精度,总体精度达99.14%,kappa系数为0.87,说明基于MODIS粗分辨率数据和bootstrapping SVM算法可以克服不平衡分类问题、有效提取森林干扰区域,可作为一种经济可行的对大区域甚至全球森林干扰监测的方法. 展开更多
关键词 森林干扰 MODIS bootstrapping SVM 不平衡分类
原文传递
基于BootStrapping的集成分类器的中文观点句识别方法 被引量:8
8
作者 吕云云 李旸 王素格 《中文信息学报》 CSCD 北大核心 2013年第5期84-92,共9页
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机... 领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。 展开更多
关键词 观点句识别 bootstrapping 集成分类器
在线阅读 下载PDF
使用基于模式的Bootstrapping方法抽取情感词 被引量:6
9
作者 王昌厚 王菲 《计算机工程与应用》 CSCD 2014年第1期127-129,共3页
情感评价词典在情感分析中具有非常重要的作用,在新词频发的网络环境中,识别新的情感评价词,完善现有的情感词典是非常有必要的。使用基于模式的Bootstrapping方法,在微博语料中抽取情感评价词。实验证明,在保持了较理想的精确率的情况... 情感评价词典在情感分析中具有非常重要的作用,在新词频发的网络环境中,识别新的情感评价词,完善现有的情感词典是非常有必要的。使用基于模式的Bootstrapping方法,在微博语料中抽取情感评价词。实验证明,在保持了较理想的精确率的情况下,上述方法抽取了数量可观的传统情感词典未收录的情感评价词。 展开更多
关键词 情感评价词 模式 bootstrapping方法
在线阅读 下载PDF
基于Bootstrapping的本体标注方法 被引量:3
10
作者 罗军 高琦 王翊 《计算机工程》 CAS CSCD 北大核心 2010年第23期85-87,共3页
实现语义Web目标的一个重要前提是利用本体词汇标注Web资源。为此,提出一种基于弱监督(Bootstrapping)的本体标注方法。对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档。采用Bootstrapping的方法进行信息标注抽取和本... 实现语义Web目标的一个重要前提是利用本体词汇标注Web资源。为此,提出一种基于弱监督(Bootstrapping)的本体标注方法。对给定的本体进行解析,生成规则文件,通过文本分类筛选出领域文档。采用Bootstrapping的方法进行信息标注抽取和本体推理,经过几次循环后,只利用少量的训练文本就能达到较好的标注效果。实验证明,该方法实体识别准确率高,标注效果好。 展开更多
关键词 弱监督 规则 本体 标注
在线阅读 下载PDF
临床路径管理病种历史费用测算方法:Bootstrapping的理论及其Excel实现 被引量:3
11
作者 隋宾艳 齐雪然 《中国卫生经济》 北大核心 2016年第1期24-27,共4页
临床路径管理成本和历史费用测算工作是我国医疗服务价格改革的基础。为解决各医院在病种历史费用测算过程中普遍面临的统计软件和方法学问题,作者在长期经济学评价成本测算方法学研究的基础上,选择英国卫生经济研究中心开发的基于Exce... 临床路径管理成本和历史费用测算工作是我国医疗服务价格改革的基础。为解决各医院在病种历史费用测算过程中普遍面临的统计软件和方法学问题,作者在长期经济学评价成本测算方法学研究的基础上,选择英国卫生经济研究中心开发的基于Excel软件的bootstrapping非参数估计方法成本测算工具,并结合实际应用经验对其进行汉化和必要的更新后在此做一介绍,以期最大限度地促进在医院层面自行开展病种费用测算,提高费用测算过程的透明度,为医院病种费用测算和医保部门定价博弈提供科学依据,同时为经济学评价研究提供决策分析模型的费用参数信息。 展开更多
关键词 bootstrap 非参数估计 偏态分布资料 临床路径管理 费用测算
原文传递
利用鞍点逼近与Bootstrapping方法估计统计量的分布 被引量:2
12
作者 李述山 王秀芬 《山东理工大学学报(自然科学版)》 CAS 2004年第5期44-48,共5页
统计量分布的确定是统计推断的一个关键工作,在总体分布已知的条件下,鞍点逼近在很多场合可以给出统计量分布的良好近似.在介绍鞍点逼近方法的基础上给出了一个结合鞍点逼近与Bootstrapping方法估计统计量分布的方法,解决了总体分布未... 统计量分布的确定是统计推断的一个关键工作,在总体分布已知的条件下,鞍点逼近在很多场合可以给出统计量分布的良好近似.在介绍鞍点逼近方法的基础上给出了一个结合鞍点逼近与Bootstrapping方法估计统计量分布的方法,解决了总体分布未知的条件下统计量近似分布的估计问题,并以样本均值的分布为例进行了讨论. 展开更多
关键词 鞍点逼近 统计量 逼近方法 样本均值 bootstrapping方法 分布估计
在线阅读 下载PDF
Bootstrapping创业资源获取的驱动机制研究:基于“关系”视角 被引量:2
13
作者 杨林波 朱兴婷 《宁波大学学报(人文科学版)》 2018年第3期93-99,共7页
Bootstrapping资源获取方式有助于创业者降低对外部环境的依赖,顺利开展创业活动。本研究基于关系理论,建立Bootstrapping资源获取驱动机制模型,通过深入的理论分析,发现创业者人力资本(学历教育、商业培训、工作经验、创业经历)可以通... Bootstrapping资源获取方式有助于创业者降低对外部环境的依赖,顺利开展创业活动。本研究基于关系理论,建立Bootstrapping资源获取驱动机制模型,通过深入的理论分析,发现创业者人力资本(学历教育、商业培训、工作经验、创业经历)可以通过增加"关系"中的情感成分(而非工具成分),加强对Bootstrapping资源获取策略的使用。而且创业者核心自我评价水平越高,人力资本对"关系"的增进作用就越强。 展开更多
关键词 bootstrapping资源获取 人力资本 “关系” 核心自我评价
在线阅读 下载PDF
一种基于Bootstrapping构建训练语料的方法
14
作者 尹继豪 樊孝忠 +1 位作者 刘士宁 于江德 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期394-397,共4页
提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理... 提出一种基于Bootstrapping算法构建训练语料的方法.该方法从自动标注的语料中随机选取部分语料,人工修正后生成种子集,用该种子集训练一个基于类的语言模型,然后使用该模型自动标注剩余的语料;再从剩余语料中选取部分语料进行以上处理,如此循环直到训练语料标注质量理想.实验结果表明,该方法在保证训练语料标注质量理想的情况下,能够大幅度地减少人工参与. 展开更多
关键词 bootstrapping 命名实体识别 训练语料 类语言模型
在线阅读 下载PDF
结合词向量和Bootstrapping的领域实体上下位关系获取与组织 被引量:6
15
作者 马晓军 郭剑毅 +3 位作者 线岩团 毛存礼 严馨 余正涛 《计算机科学》 CSCD 北大核心 2018年第1期67-72,共6页
实体上下位关系是构建领域知识图谱不可或缺的一种重要的语义关系,传统抽取上下位关系的方法大多不考虑关系的组织。提出一种结合词向量和Bootstrapping的方法来实现领域实体上下位关系的获取与组织。首先,选取旅游领域的种子语料集;然... 实体上下位关系是构建领域知识图谱不可或缺的一种重要的语义关系,传统抽取上下位关系的方法大多不考虑关系的组织。提出一种结合词向量和Bootstrapping的方法来实现领域实体上下位关系的获取与组织。首先,选取旅游领域的种子语料集;然后,采用基于词向量的相似度计算方法对种子集中包含的上下位关系模式进行聚类,筛选出置信度高的模式并对未标注语料进行上下位关系识别,得到候选关系实例,同时选择置信度高的关系实例加入到种子集中,进行下一轮的迭代,直到得到所有的关系实例;最后,根据领域实体上下位关系对的向量偏移并结合领域实体层级关系的特点,采用映射的学习方法进行领域实体层级关系组织。实验结果表明,与传统的方法相比,所提方法的F值提高了近10%。 展开更多
关键词 上下位关系 关系抽取 bootstrapping方法 词向量 映射学习 层级关系组织
在线阅读 下载PDF
基于最大熵与Bootstrapping的关联三元组识别方法
16
作者 赵乃刚 邓景顺 《山西大同大学学报(自然科学版)》 2012年第6期3-6,共4页
基于<产品特征,情感词>关联对的缺点,讨论了情感词与否定性副词搭配的必要性,提出了<Pfeature,Flag,Sword>关联三元组,能够更准确地表达文本中相关评论句对产品特征的情感倾向。采用两个步骤来提取关联三元组:首先,利用已... 基于<产品特征,情感词>关联对的缺点,讨论了情感词与否定性副词搭配的必要性,提出了<Pfeature,Flag,Sword>关联三元组,能够更准确地表达文本中相关评论句对产品特征的情感倾向。采用两个步骤来提取关联三元组:首先,利用已训练好的最大熵模型作为分类器,结合Bootstrapping方法完成了产品特征与情感词语关联对的抽取;其次,将情感词前的否定性副词抽取出来,合成关联三元组。 展开更多
关键词 最大熵 bootstrapping 关联三元组 情感倾向
在线阅读 下载PDF
基于BootStrapping的中文事件元素抽取系统设计与实现 被引量:4
17
作者 赵江江 秦兵 《智能计算机与应用》 2012年第1期16-17,20,共3页
采用基于BootStrapping的方法实现中文事件元素抽取系统。其中,将事件元素抽取定义为一个模式匹配问题。针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取。在... 采用基于BootStrapping的方法实现中文事件元素抽取系统。其中,将事件元素抽取定义为一个模式匹配问题。针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取。在模板构造过程中,提出了基于BestMatch的模板泛化算法[1]。对任意两个事件实例模板[2]进行匹配,计算其匹配代价并泛化,提高了模板的覆盖能力。所实现的系统在ACE 2005语料测试中取得了不错结果。 展开更多
关键词 事件元素抽取 bootstrapping 模式匹配
在线阅读 下载PDF
基于Meta-Bootstrapping的中医医案结构化研究 被引量:4
18
作者 张煜斌 陆建峰 +1 位作者 李文林 陈涤平 《微电子学与计算机》 CSCD 北大核心 2009年第10期111-114,共4页
采用了Meta-Bootstrapping算法提取术语,并设计了术语抽取中所需的模式结构.在对某名医206份医案的术语抽取实验中,方剂名,辨证信息和治则的术语抽取实验F1-测度值分别为72.9%,56.21%和76.64%.在抽取术语的基础上,完成了医案结构化的实验.
关键词 信息抽取 文本挖掘 数据结构化 Meta-bootstrapping算法 机器学习
在线阅读 下载PDF
一种基于Bootstrapping的本体学习方法 被引量:1
19
作者 张俊 高志强 +2 位作者 徐惠 蔡施彦 戴云徽 《南京师范大学学报(工程技术版)》 CAS 2008年第4期56-58,共3页
提出了一种基于自扩展的本体学习方法用于获取领域术语.该方法只需提供少量种子术语和一个未标注语料库作为输入,由种子术语开始学习抽取模式,再由学习到的模式发现新的术语,进一步由新发现的术语学习新的抽取模式,如此循环迭代.实验结... 提出了一种基于自扩展的本体学习方法用于获取领域术语.该方法只需提供少量种子术语和一个未标注语料库作为输入,由种子术语开始学习抽取模式,再由学习到的模式发现新的术语,进一步由新发现的术语学习新的抽取模式,如此循环迭代.实验结果表明,该算法能够产生较高质量的领域术语集合和抽取模式集合,这样的集合可用于相关领域的信息抽取. 展开更多
关键词 信息抽取 本体学习 自扩展
在线阅读 下载PDF
基于Bootstrapping的英文产品评论属性词抽取方法 被引量:1
20
作者 王辉 陈光 《山东大学学报(理学版)》 CAS CSCD 北大核心 2014年第12期23-29,共7页
针对英文产品方面属性词抽取,提出了一种基于Bootstrapping的抽取方法。该方法利用少数几个种子模板,通过增量迭代的过程发现新的属性词,在每一轮迭代中通过统计技术,结合情感词典的情感词分析,利用属性词与模板的亲密度关系得到属性词... 针对英文产品方面属性词抽取,提出了一种基于Bootstrapping的抽取方法。该方法利用少数几个种子模板,通过增量迭代的过程发现新的属性词,在每一轮迭代中通过统计技术,结合情感词典的情感词分析,利用属性词与模板的亲密度关系得到属性词被抽取出的概率得分,对候选属性词进行排序过滤。对于抽取后的特征词集利用Wordnet计算属性词间的相似度,根据得分进行聚类,得到产品不同方面的属性词类簇,同时过滤掉得分较低的类簇,进一步去掉噪声。此外还利用种子模板代替种子属性词以提高系统的可移植性。实验结果表明,利用该方法进行产品方面属性词抽取的准确率为0.799,召回率为0.779,调和平均值为0.789,具有较好的抽取性能。 展开更多
关键词 属性词抽取 自扩展 信息抽取 WORDNET
原文传递
上一页 1 2 148 下一页 到第
使用帮助 返回顶部