期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向书面言语鉴定的言语人副词使用习惯研究
1
作者 王虹 《中国司法鉴定》 2019年第5期39-47,共9页
目的探讨副词使用习惯特征在汉语书面言语鉴定中作为同一认定依据使用的可行性。方法采用实验研究和统计研究的方法,收集6位作家的24部作品,利用《案件书面言语量化辅助分析系统》统计每部作品的总词数、副词数、副词数占总词数的百分... 目的探讨副词使用习惯特征在汉语书面言语鉴定中作为同一认定依据使用的可行性。方法采用实验研究和统计研究的方法,收集6位作家的24部作品,利用《案件书面言语量化辅助分析系统》统计每部作品的总词数、副词数、副词数占总词数的百分比、单个副词数、单个副词数占总词数的百分比,以及同一人作品副词使用频率的平均值、标准差等数据进行研究。结果个人在是否使用副词上有偏好、个人在表示同类关系的副词中有选用上的偏好、不同人在表示同类关系的副词中有共同的选用偏好。结论副词使用习惯可以作为书面言语鉴定的辅助特征使用,但使用时要充分考虑到语料的形成过程、创作背景、个人经历等因素的影响。 展开更多
关键词 副词使用习惯 书面言语鉴定 长语料
在线阅读 下载PDF
Bi-LSTM和CRF结合的藏文分词方法研究 被引量:8
2
作者 格桑加措 阿卜杜热西提·热合曼 +3 位作者 尼玛扎西 面加 肖桐 朱靖波 《中央民族大学学报(自然科学版)》 2024年第3期40-46,共7页
本研究旨在探索基于双向长短时记忆网络(Bi-LSTM)和条件随机场(CRF)的藏语分词方法。研究评估了Bi-LSTM和Bi-LSTM结合CRF模型在藏文分词任务中的性能,针对未登录音节词进行了模型优化。研究还将分词系统应用到CCMT2023藏汉机器翻译任务... 本研究旨在探索基于双向长短时记忆网络(Bi-LSTM)和条件随机场(CRF)的藏语分词方法。研究评估了Bi-LSTM和Bi-LSTM结合CRF模型在藏文分词任务中的性能,针对未登录音节词进行了模型优化。研究还将分词系统应用到CCMT2023藏汉机器翻译任务中,并进行了评估。实验结果表明,本文提出的分词系统在藏语分词任务中具有良好的性能,并且在藏汉机器翻译任务上有效提升了性能。 展开更多
关键词 藏语分词 LSTM CRF 未登录音节字
在线阅读 下载PDF
神经机器翻译中数据泛化与短语生成方法研究 被引量:7
3
作者 李强 韩雅倩 +1 位作者 肖桐 朱靖波 《中文信息学报》 CSCD 北大核心 2018年第8期42-52,共11页
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于... 该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。 展开更多
关键词 自然语言处理 神经机器翻译 数据泛化 短语生成
在线阅读 下载PDF
Learning Noun Phrase Anaphoricity in Coreference Resolution via Label Propagation 被引量:1
4
作者 周国栋 孔芳 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第1期34-44,共11页
Knowledge of noun phrase anaphoricity might be profitably exploited in coreference resolution to bypass the resolution of non-anaphoric noun phrases. However, it is surprising to notice that recent attempts to incorpo... Knowledge of noun phrase anaphoricity might be profitably exploited in coreference resolution to bypass the resolution of non-anaphoric noun phrases. However, it is surprising to notice that recent attempts to incorporate automatically acquired anaphoricity information into coreferenee resolution systems have been far from expectation. This paper proposes a global learning method in determining the anaphoricity of noun phrases via a label propagation algorithm to improve learning-based coreference resolution. In order to eliminate the huge computational burden in the label propagation algorithm, we employ the weighted support vectors as the critical instances in the training texts. In addition, two kinds of kernels, i.e instances to represent all the anaphoricity-labeled NP , the feature-based RBF (Radial Basis Function) kernel and the convolution tree kernel with approximate matching, are explored to compute the anaphoricity similarity between two noun phrases. Experiments on the ACE2003 corpus demonstrate the great effectiveness of our method in anaphoricity determination of noun phrases and its application in learning-based coreference resolution. 展开更多
关键词 coreference resolution anaphoricity determination label propagation RBF kernel convolution tree kernel
原文传递
Kernel-Based Semantic Relation Detection and Classification via Enriched Parse Tree Structure 被引量:7
5
作者 周国栋 朱巧明 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第1期45-56,共12页
This paper proposes a tree kernel method of semantic relation detection and classification (RDC) between named entities. It resolves two critical problems in previous tree kernel methods of RDC. First, a new tree ke... This paper proposes a tree kernel method of semantic relation detection and classification (RDC) between named entities. It resolves two critical problems in previous tree kernel methods of RDC. First, a new tree kernel is presented to better capture the inherent structural information in a parse tree by enabling the standard convolution tree kernel with context-sensitiveness and approximate matching of sub-trees. Second, an enriched parse tree structure is proposed to well derive necessary structural information, e.g., proper latent annotations, from a parse tree. Evaluation on the ACE RDC corpora shows that both the new tree kernel and the enriched parse tree structure contribute significantly to RDC and our tree kernel method much outperforms the state-of-the-art ones. 展开更多
关键词 semantic relation detection and classification convolution tree kernel approximate matching context sensitiveness enriched parse tree structure
原文传递
Multi-Domain Sentiment Classification with Classifier Combination 被引量:5
6
作者 李寿山 黄居仁 宗成庆 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第1期25-33,共9页
State-of-the-arts studies on sentiment classification are typically domain-dependent and domain-restricted. In this paper, we aim to reduce domain dependency and improve overall performance simultaneously by proposing... State-of-the-arts studies on sentiment classification are typically domain-dependent and domain-restricted. In this paper, we aim to reduce domain dependency and improve overall performance simultaneously by proposing an efficient multi-domain sentiment classification algorithm. Our method employs the approach of multiple classifier combination. In this approach, we first train single domain classifiers separately with domain specific data, and then combine the classifiers for the final decision. Our experiments show that this approach performs much better than both single domain classification approach (using the training data individually) and mixed domain classification approach (simply combining all the training data). In particular, classifier combination with weighted sum rule obtains an average error reduction of 27.6% over single domain classification. 展开更多
关键词 sentiment classification multiple classifier system multi-domain learning
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部