期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
中文Base NP识别:错误驱动的组合分类器方法 被引量:7
1
作者 徐昉 宗成庆 王霞 《中文信息学报》 CSCD 北大核心 2007年第1期115-119,共5页
本文采用一种新的错误驱动的组合分类器方法来实现中文Base NP识别。本文首先对中文和英文BaseNP识别技术现状进行了简要分析和概述,明确了中文Base NP识别的任务,然后,基于前人的工作提出了错误驱动的组合分类器方法,其基本思路是:通... 本文采用一种新的错误驱动的组合分类器方法来实现中文Base NP识别。本文首先对中文和英文BaseNP识别技术现状进行了简要分析和概述,明确了中文Base NP识别的任务,然后,基于前人的工作提出了错误驱动的组合分类器方法,其基本思路是:通过对比两种不同类型的分类器—基于转化的方法和条件随机场方法的分类结果,再利用支持向量机学习其中的错误规律,对两分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果。我们在宾州中文树库转化得到的Base NP语料集上进行了Base NP识别交叉验证实验,与单独使用基于转化的方法、条件随机场方法以及支持向量机方法相比较,错误驱动的组合分类器方法的实验结果都有所提高,最佳结果F值达到了89.72%,相对于文中Base NP识别的其他方法,最大提高幅度为2.35%。 展开更多
关键词 计算机应用 中文信息处理 错误驱动 中文base NP识别 组合分类器
在线阅读 下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:9
2
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
在线阅读 下载PDF
基于条件随机场模型的汉语功能块自动标注 被引量:7
3
作者 李国臣 王瑞波 李济洪 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期336-343,共8页
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不... 汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%. 展开更多
关键词 汉语基本块 汉语功能块 条件随机场模型 句法分析 序列标注
在线阅读 下载PDF
基于字的分布表征的汉语基本块识别 被引量:6
4
作者 李国臣 党帅兵 +1 位作者 王瑞波 李济洪 《中文信息学报》 CSCD 北大核心 2014年第6期18-25,55,共9页
汉语的基本块识别是汉语句法语义自动分析中的重要任务之一。传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理。虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动... 汉语的基本块识别是汉语句法语义自动分析中的重要任务之一。传统的方法大多数直接将汉语基本块识别任务转化成词层面的一个序列标注问题,采用CRF模型来处理。虽然,在许多评测中得到最好的结果,但基于词为标注单位,在实用中受限于自动分词系统以及汉语词特征的稀疏性。为此,该文给出了一种以字为标注单位,以字为原始输入层,来构建汉语的基本块识别的深层神经网络模型,并通过无监督方法,学习到字的C&W和word2vec两种分布表征,将其作为深层神经网络模型的字的表示层的初始输入参数来强化模型参数的训练。实验结果表明,使用五层神经网络模型,以[-3,3]窗口的字的word2vec分布表征,其准确率、召回率和F值分别达到80.74%,73.80%和77.12%,这比基于字的CRF高出约5%。这表明深层神经网络模型在汉语的基本块识别中是有作用的。 展开更多
关键词 汉语基本块 分布表征 深层神经网络 序列标注
在线阅读 下载PDF
引入混合特征的最大名词短语双向标注融合算法 被引量:4
5
作者 李业刚 黄河燕 鉴萍 《自动化学报》 EI CSCD 北大核心 2015年第7期1274-1282,共9页
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适... 最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适应性.实验证叨,釆用词和基本组块混合标注单元的标注方法对汉语最大名词短语的识别是有效的,并且其i E反向识别结果具有一定的互补性,在此基础上提出的基于"边界分歧"的双向序列标注融合算法恰能发掘双向识别的互补性,并达到较高的融合精度. 展开更多
关键词 最大名词短语 双向标注 基本组块 混合特征
在线阅读 下载PDF
汉语块分析评测任务设计 被引量:9
6
作者 周强 李玉梅 《中文信息学报》 CSCD 北大核心 2010年第1期123-128,共6页
该文主要介绍了目前中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法。然后给出了这三项目前的主要评测结果并对相关内容进行了... 该文主要介绍了目前中文信息学会句法分析评测CIPS-ParsEval-2009中的三项块分析评测任务:基本块分析、功能块分析和事件描述小句识别的设计理念、判定标准和相关资源构建方法。然后给出了这三项目前的主要评测结果并对相关内容进行了简要分析。最后通过相关统计数据分析和国内外相关研究评述,总结了这三项评测任务的主要特色。 展开更多
关键词 计算机应用 中文信息处理 基本块 功能块 事件描述小句 块标注库
在线阅读 下载PDF
英汉机器翻译系统ECT中的知识库 被引量:3
7
作者 吕学强 郭军 姚天顺 《小型微型计算机系统》 CSCD 北大核心 2004年第8期1482-1485,共4页
提出 E- Chunk概念 ,它是一种新的知识表示方式 .E- Chunk是无歧义翻译单元 ,形式上是一个无翻译歧义的单词或单词串 .它是基于语义定义的 ,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征 .本文详细介绍了英汉机器翻译系统... 提出 E- Chunk概念 ,它是一种新的知识表示方式 .E- Chunk是无歧义翻译单元 ,形式上是一个无翻译歧义的单词或单词串 .它是基于语义定义的 ,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征 .本文详细介绍了英汉机器翻译系统 ECT中的三类知识库 :电子词典、E- 展开更多
关键词 自然语言处理 机器翻译 知识库 E-chunk
在线阅读 下载PDF
基于卷积神经网络和关键词策略的实体关系抽取方法 被引量:15
8
作者 王林玉 王莉 郑婷一 《模式识别与人工智能》 EI CSCD 北大核心 2017年第5期465-472,共8页
针对传统的实体关系抽取方法在定义特征过程中费时且容易造成错误传播,及现有深度学习方法依靠单一词向量学习特征的不足,文中提出基于卷积神经网络和关键词策略的实体关系抽取方法.在原始词向量的基础上,通过基于句子级的关键词抽取算... 针对传统的实体关系抽取方法在定义特征过程中费时且容易造成错误传播,及现有深度学习方法依靠单一词向量学习特征的不足,文中提出基于卷积神经网络和关键词策略的实体关系抽取方法.在原始词向量的基础上,通过基于句子级的关键词抽取算法(TP-ISP)获得类别关键词特征.类别关键词的加入提高类别区分度,同时弥补网络自动学习特征的不足.在网络训练阶段,采用分段最大池化策略,减少传统最大池化策略的信息丢失.实验表明,文中方法有利于提升实体关系抽取结果. 展开更多
关键词 卷积神经网络(CNN) 关系抽取 关键词特征 分段最大池化策略
在线阅读 下载PDF
汉语基本块描述体系 被引量:25
9
作者 周强 《中文信息学报》 CSCD 北大核心 2007年第3期21-27,共7页
块分析是自然语言处理研究中的重要技术,其处理基础是设计一套合理有效的块描述体系。本文在吸收和总结前人研究成果和经验的基础上,提出了一套基于拓扑结构的汉语基本块描述体系。它通过引入词汇关联信息确定基本拓扑结构,形成了很好... 块分析是自然语言处理研究中的重要技术,其处理基础是设计一套合理有效的块描述体系。本文在吸收和总结前人研究成果和经验的基础上,提出了一套基于拓扑结构的汉语基本块描述体系。它通过引入词汇关联信息确定基本拓扑结构,形成了很好的基本块内聚性判定准则,建立了句法形式与语义内容的有机联系桥梁。这套描述体系大大简化了从现有的句法树库TCT中自动提取基本块标注语料库和相关词汇关联知识库的处理过程,为进一步进行汉语基本块自动分析和词汇关联知识获取互动进化研究打下了很好的基础。 展开更多
关键词 计算机应用 中文信息处理 基本块 部分分析 语料库标注 词汇知识获取
在线阅读 下载PDF
基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略 被引量:2
10
作者 梁颖红 赵铁军 +2 位作者 姚建民 于浩 徐冰 《计算机工程与应用》 CSCD 北大核心 2004年第35期1-3,121,共4页
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法... 基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分,边界统计作为主要部分能够正确识别出大部分基本名词短语,词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中,词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点,提高了精确率和召回率。采用此方法,基本名词短语识别的精确率达到96.22%,召回率97.59%,Fβ=196.90%,F值超出了目前报道的最好结果。 展开更多
关键词 基本名词短语识别 英语 混合策略 语块 边界统计 词性串规则校正
在线阅读 下载PDF
基于分层语块分析的统计翻译研究 被引量:7
11
作者 魏玮 杜金华 徐波 《中文信息学报》 CSCD 北大核心 2007年第5期87-90,117,共5页
本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统... 本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。 展开更多
关键词 人工智能 机器翻译 基于分层语块分析的统计翻译模型 条件随机场 CKY算法
在线阅读 下载PDF
句类、句型、句模、句式、表达格式与构式——兼说“构式-语块”分析法 被引量:25
12
作者 陆俭明 《汉语学习》 CSSCI 北大核心 2016年第1期3-11,共9页
根据研究的需要,对于句子可以进行不同的分类,相应地会有各种分类的名词术语。本文包括两部分内容,一是解读各种句子分类所给出的名词术语,并扼要说明评判各种不同句子分类的价值之依据;二是兼说"构式-语块"分析法,指出此分... 根据研究的需要,对于句子可以进行不同的分类,相应地会有各种分类的名词术语。本文包括两部分内容,一是解读各种句子分类所给出的名词术语,并扼要说明评判各种不同句子分类的价值之依据;二是兼说"构式-语块"分析法,指出此分析法是对传统的句法分析法的补充,提出此分析法只是要人们不要囿于传统的句法分析思路。 展开更多
关键词 句类 句型 句模 句式 表达格式 构式 “构式一语块”分析法
原文传递
基于语料库的本族语者和外语学习者英语语块差异性研究 被引量:2
13
作者 文辉 李勇 《宜春学院学报》 2009年第1期155-157,共3页
在语料库的基础上对句法结构差异、词汇结构差异和词丛三个方面分析了本族语者和英语学习者语块使用的差异性及其引因;其次简要探讨了语块学习的重要性。
关键词 语块 差异性 引因
在线阅读 下载PDF
基于语块理论的大学英语写作教学与研究 被引量:4
14
作者 姜华 《吉林化工学院学报》 CAS 2012年第10期74-76,共3页
语块,作为集词汇和语法的特征于一身的语言使用的重要单位受到越来越多的英语教师的重视。将语块理论与大学英语写作教学相结合,通过语块输入、语块讲解、语块记忆和语块输出,激发学生的写作热情,促进语篇连贯性,提高学生的写作水平和... 语块,作为集词汇和语法的特征于一身的语言使用的重要单位受到越来越多的英语教师的重视。将语块理论与大学英语写作教学相结合,通过语块输入、语块讲解、语块记忆和语块输出,激发学生的写作热情,促进语篇连贯性,提高学生的写作水平和综合语言素质。 展开更多
关键词 语块 语块教学法 大学英语写作
在线阅读 下载PDF
融合分词隐层特征的汉语基本块识别
15
作者 李国臣 刘展鹏 +1 位作者 王瑞波 李济洪 《中文信息学报》 CSCD 北大核心 2016年第2期12-17,共6页
该文以字为基本标注单位,构建了一种汉语基本块识别的神经网络学习模型。模型联合分词任务的神经网络学习模型与基本块识别任务模型,将分词任务模型中学习得到的隐层特征融入基本块识别的模型中,两模型相互交替优化学习模型参数,并实现... 该文以字为基本标注单位,构建了一种汉语基本块识别的神经网络学习模型。模型联合分词任务的神经网络学习模型与基本块识别任务模型,将分词任务模型中学习得到的隐层特征融入基本块识别的模型中,两模型相互交替优化学习模型参数,并实现了以整句似然函数(而非单字似然函数)作为优化目标的算法。实验结果表明:1)以整句似然函数为优化目标的基本块识别的F值比单字似然情形要高出1.33%,特别是在多字块识别中,其召回率比单字似然情形要高出4.68%;2)融合分词任务模型中的隐层特征的汉语基本块识别模型的结果比不做融合的模型要高出2.17%,说明融合分词隐层特征的交替联合学习方法是有效的。 展开更多
关键词 分布表征 汉语基本块识别 神经网络模型 隐层特征 整句似然函数
在线阅读 下载PDF
词块教学法在大学英语B级网考辅导教学中的应用 被引量:3
16
作者 杨永芳 《广西广播电视大学学报》 2012年第2期34-37,共4页
词块是语法、语义、语用和语境的统一体,词块教学法是对传统教学法的继承和发展,它辩证地体现了词汇和语法在语言习得过程中的地位作用,符合人类对语言的认知规律,是一种更加科学的语言观。文章以词块教学法为理论依据,阐述了如何将词... 词块是语法、语义、语用和语境的统一体,词块教学法是对传统教学法的继承和发展,它辩证地体现了词汇和语法在语言习得过程中的地位作用,符合人类对语言的认知规律,是一种更加科学的语言观。文章以词块教学法为理论依据,阐述了如何将词块教学应用于大学英语B级网考的备考辅导中,以期能提高学生备考的效率。 展开更多
关键词 词块 词块教学法 大学英语B级网考
在线阅读 下载PDF
基于词块教学法的词块练习设计 被引量:1
17
作者 韩存新 《长春大学学报》 2011年第1期108-110,共3页
词块教学法是符合人类认知规律的一种行之有效的教学方法,代表着一种新的教学理念。本文专注于基于词块教学法的词块练习设计。本文提出了10种练习设计方案,并且指出了各练习方案所适用的词块类别。
关键词 词块 教学法 词块练习设计
在线阅读 下载PDF
国内近十五年二语语块研究述评 被引量:3
18
作者 杨丽 王玲 熊可 《鸡西大学学报(综合版)》 2016年第9期84-87,共4页
通过定量方法考察1999-2013年国内二语语块研究的研究主题、研究方法,可以了解近十五年来二语语块研究的发展动态。结果发现:(1)近十五年来二语语块研究发展整体呈曲线上扬趋势,最近六年发展最快。(2)研究主题主要有:语块及相关理论、... 通过定量方法考察1999-2013年国内二语语块研究的研究主题、研究方法,可以了解近十五年来二语语块研究的发展动态。结果发现:(1)近十五年来二语语块研究发展整体呈曲线上扬趋势,最近六年发展最快。(2)研究主题主要有:语块及相关理论、研究概述、语块运用与二语水平关系、二语语块教学、语块使用、语块习得过程。(3)所采用的研究方法以实证研究为主。语料库语言学方法已成为二语语块研究的主流方法之一。(4)从发展趋势上看,二语语块的研究需要结合心理学、神经语言学、认知语言学等学科的研究成果进行多学科的深入研究。 展开更多
关键词 二语语块 实证研究 语料库语言学方法
在线阅读 下载PDF
项目教学法结合语块优化英语应用文写作教学 被引量:1
19
作者 苏文倩 赵燕 《四川教育学院学报》 2011年第5期84-86,共3页
英语应用文写作教学以培养学生实际运用语言的书面交际能力为目标,强调教学的实践性和针对性。项目教学法旨在培养学生的实际能力,是改进英语应用文写作教学的有效途径。语块理论认为语块的掌握有助于学习者语言产出的流利性、准确性和... 英语应用文写作教学以培养学生实际运用语言的书面交际能力为目标,强调教学的实践性和针对性。项目教学法旨在培养学生的实际能力,是改进英语应用文写作教学的有效途径。语块理论认为语块的掌握有助于学习者语言产出的流利性、准确性和语篇连贯性。探讨了如何将项目教学法与语块理论相结合应用于英语应用文写作课程中,以促进写作教学。 展开更多
关键词 英语应用文 写作 项目教学法 语块
在线阅读 下载PDF
网络环境下词汇学习策略与词汇能力的相关性研究 被引量:2
20
作者 石志亮 《疯狂英语(教师版)》 2008年第5期36-39,67,共5页
本文是一篇有关网络环境下词汇学习策略与词汇能力相关性的实证研究。通过问卷调查和词汇量、词汇深度测试,对网络环境下136名英语专业学生进行了为期一年的研究。皮尔逊相关分析结果表明:网络环境下词汇学习策略使用的广度和频度较高;... 本文是一篇有关网络环境下词汇学习策略与词汇能力相关性的实证研究。通过问卷调查和词汇量、词汇深度测试,对网络环境下136名英语专业学生进行了为期一年的研究。皮尔逊相关分析结果表明:网络环境下词汇学习策略使用的广度和频度较高;管理策略与词汇深度成绩呈现出很强的相关性;"死记硬背"与词汇深度成绩负相关;"词汇组块"策略运用偏低。文章指出,为提高网络环境下学生的词汇能力,英语教学应当加强"词汇组块"和"管理"策略的培训。 展开更多
关键词 词汇学习策略 词汇量 词汇深度 词汇组块 网络环境
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部