期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
汉语自动分词词典机制的实验研究 被引量:119
1
作者 孙茂松 左正平 黄昌宁 《中文信息学报》 CSCD 北大核心 2000年第1期1-6,共6页
分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE 索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二... 分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE 索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二分的分词词典机制简洁、高效,较好地满足了实用型汉语自动分词系统的需要。 展开更多
关键词 中文信息处理 汉语自动分词 分词词典机制
在线阅读 下载PDF
基于语料库的中文姓名识别方法研究 被引量:43
2
作者 郑家恒 李鑫 谭红叶 《中文信息学报》 CSCD 北大核心 2000年第1期7-12,共6页
本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阈值。提出了在不作分词处理的原始文本中进行中文姓名识别的方法。经开放测试,召回率为95 .23 ... 本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阈值。提出了在不作分词处理的原始文本中进行中文姓名识别的方法。经开放测试,召回率为95 .23 % ;精确率为87 .31 % 。 展开更多
关键词 中文 姓名识别 姓氏使用频率 自动分词
在线阅读 下载PDF
电子词典研究现状与展望 被引量:13
3
作者 戴远君 徐海 《辞书研究》 北大核心 2014年第4期1-9,93,共9页
在互联网时代,出版业迎来了数字革命。在此背景下,首当其冲的是词典和工具书。词典继"语料库革命"后迎来了"数字化革命"的时代。文章综述国内外电子词典研究,发现现有的电子词典研究主要涉及类型研究、特性研究、... 在互联网时代,出版业迎来了数字革命。在此背景下,首当其冲的是词典和工具书。词典继"语料库革命"后迎来了"数字化革命"的时代。文章综述国内外电子词典研究,发现现有的电子词典研究主要涉及类型研究、特性研究、用户需求及使用研究、技术开发与实现研究和电子词典评价研究。在现有研究的基础上,文章对未来电子词典的研究方向和重点提出几点建议。 展开更多
关键词 电子词典 类型研究 用户需求 词典使用 技术开发 词典评价
在线阅读 下载PDF
Matlink英汉机器翻译试验系统中词典的存储结构及搜索算法 被引量:3
4
作者 吴保民 杜祝平 +1 位作者 张连海 王炳锡 《信息工程大学学报》 2001年第4期70-74,共5页
本文详细论述了我们开发的基于规则的Matlink英汉机器翻译试验系统中词典的内部存储结构和搜索算法 ,以一部综合英语词汇静态信息和动态信息于一体的英汉转换词典代替传统的基于多部词典的机器翻译方法。
关键词 机器翻译 机器词典 哈希表 Matlink英汉机器翻译试验系统 英语 汉语 存储结构 搜索算法
在线阅读 下载PDF
语料库资源共享的可行性研究 被引量:6
5
作者 许智坚 高登亮 《漳州师范学院学报(哲学社会科学版)》 2008年第2期101-105,共5页
语料库语言学研究的迅猛发展、计算机技术的发展和网络技术的普及、不同类型的语料库和语料库工具的开发为语料库资源共享提供了一个很好的平台。语料库已被广泛地应用于语言研究和外语教学。语料库建设横向合作、功能强大的语料库工具... 语料库语言学研究的迅猛发展、计算机技术的发展和网络技术的普及、不同类型的语料库和语料库工具的开发为语料库资源共享提供了一个很好的平台。语料库已被广泛地应用于语言研究和外语教学。语料库建设横向合作、功能强大的语料库工具软件的开发和丰富的文本库资源和网络资源的应用使得语料库资源共享成为可能。但目前,要全面地共享语料库资源还有一定的困难,语料库资源共享应解决好语料的来源的真实性、代表性以及各种语料所占和合理比例;语料分析工具的兼容性、易操作性和统一性;建立语料库资源共享平台以及普及语料库语言学知识等问题。 展开更多
关键词 语料库 语料库工具 资源共享 可行性 问题
在线阅读 下载PDF
日语词汇单一汉译词自动获取研究 被引量:2
6
作者 施建军 徐一平 《解放军外国语学院学报》 北大核心 2003年第5期65-68,共4页
利用日汉平行语料库自动获取汉语译词无论是在词典编撰,还是在自然语言处理领域都有着广泛的应用。以源词和译词之间的相互信息或Z值为依据,以译句对为评价范围,可有效地获取在只有单个译词情况下的汉语译词,并且采用这种方法可以得到... 利用日汉平行语料库自动获取汉语译词无论是在词典编撰,还是在自然语言处理领域都有着广泛的应用。以源词和译词之间的相互信息或Z值为依据,以译句对为评价范围,可有效地获取在只有单个译词情况下的汉语译词,并且采用这种方法可以得到较高的译词召回率和准确率。 展开更多
关键词 日语词汇 汉语译词 自动获取 召回率 准确率
在线阅读 下载PDF
基于文本挖掘的搭配词典自动架构探讨 被引量:2
7
作者 张辉 薛贵荣 《上海工程技术大学学报》 CAS 2004年第4期323-326,共4页
研究词语搭配的关系对于自然语言处理有很大的帮助。目前对计算机用的搭配词典是用人工方法实现的,它由人工进行维护,有更新慢、收藏的词少等缺点。为此,利用文本挖掘技术对大规模语料库进行分析,挖掘词语搭配的深层关系,在此基础上自... 研究词语搭配的关系对于自然语言处理有很大的帮助。目前对计算机用的搭配词典是用人工方法实现的,它由人工进行维护,有更新慢、收藏的词少等缺点。为此,利用文本挖掘技术对大规模语料库进行分析,挖掘词语搭配的深层关系,在此基础上自动建立词语搭配词典,实验结果显示该方法是有效的。 展开更多
关键词 文本挖掘 互信息 关联规则挖掘 搭配词典
在线阅读 下载PDF
俄语词汇知识的形式表达 被引量:1
8
作者 许汉成 傅兴尚 《外语学刊》 CSSCI 北大核心 2003年第1期84-89,共6页
用形式化的手段表达俄语词汇知识是建立俄汉电子词典的前提 ,作者吸收面向对象程序设计思想 ,将俄语词汇视为一种对象 ,用属性 -值偶对表达俄语词汇知识 ,这种研究角度和方法具有普遍意义 ,适用于对任何自然语言知识的模式化。
关键词 自然语言处理 自然语言模式化 电子词典 机器词典 俄语词汇学 俄语词典学
原文传递
若干实用机器翻译软件与网站评介 被引量:11
9
作者 毛颢 《中国科技翻译》 北大核心 2004年第4期24-25,32,共3页
基于科技翻译及教学实践经验 ,本文介绍并分析了笔者收集和整理的国际与国内若干实用机器翻译软件及在线机器翻译网站 。
关键词 机器翻译软件 翻译网站 科技英语 翻译技巧 科技文献 在线翻译资源
在线阅读 下载PDF
评Collins COBUILD English Dictionary光盘版 被引量:6
10
作者 源可乐 《广东外语外贸大学学报》 2003年第3期93-96,共4页
本文是对Collins COBUILD English Dictionary光盘版的评论。文章首先对词典的各个不同版本进行评介,然后指出光盘版比印刷本优胜之处。文章同时也把这光盘和其他词典的光盘进行比较,分别指出其优点和不足,最后提出一些建议。
关键词 光盘词典 COBUlLD 英国 全文检索 布尔逻辑检索 发音 跟读
在线阅读 下载PDF
电子词典的功能结构及系统设置 被引量:5
11
作者 章宜华 《广东外语外贸大学学报》 2003年第3期21-24,共4页
现在市场上的电子词典越来越多,信息量也越来越大;但国内早期的电子词典大多功能比较单一,查询方式不够灵活,查询显示比较呆板,影响了词典知识功能的发挥。而港台地区和西方国家同期的电子词典在功能设置方面则有不少优势。本文在对国... 现在市场上的电子词典越来越多,信息量也越来越大;但国内早期的电子词典大多功能比较单一,查询方式不够灵活,查询显示比较呆板,影响了词典知识功能的发挥。而港台地区和西方国家同期的电子词典在功能设置方面则有不少优势。本文在对国内外几十种词典进行分析研究的基础上,系统介绍了当今电子词典的一般功能结构及系统设置。 展开更多
关键词 电子词典 功能结构 系统设置 信息查询功能 媒体浏览功能 词汇发音功能 汉化功能 翻译功能 人机互动
在线阅读 下载PDF
关于建立网络化英汉语料库系统的设想 被引量:3
12
作者 孙辉 叶敢 《辞书研究》 CSSCI 1999年第2期81-86,共6页
关键词 语料库系统 网络化 全文检索技术 双语词典 SGML Interne 词典编纂 大型网络 WWW文档 文档转换
在线阅读 下载PDF
面向自然语言处理的现代汉语短语信息库 被引量:5
13
作者 孙宏林 段慧明 《术语标准化与信息技术》 1998年第2期26-31,共6页
传统的自然语言处理模式是“语法规则+词典”,但语言中许多词语组合不能或很难用语法规则加以描述。把这些组合作为整体收入词库中可以使语法得到简化,从而降低系统的复杂度。基于这种“大词库,小语法”的思想,本文论述了建立现代... 传统的自然语言处理模式是“语法规则+词典”,但语言中许多词语组合不能或很难用语法规则加以描述。把这些组合作为整体收入词库中可以使语法得到简化,从而降低系统的复杂度。基于这种“大词库,小语法”的思想,本文论述了建立现代汉语短语信息库的必要性,并对建库的方法、收录的原则和信息库进行了简要的介绍。 展开更多
关键词 自然语言处理 信息库 汉语短语 语料库 语法规则 固定短语 《现代汉语语法信息词典》 词语搭配 词汇化 计算语言学
在线阅读 下载PDF
基于义类信息的动宾搭配的考察与实验 被引量:3
14
作者 程月 《南京师范大学文学院学报》 2007年第4期182-185,共4页
本文基于《同义词词林》的义类信息,对动宾搭配短语进行了相关考察与实验。主要从100万字的清华汉语树库(TCT973)中抽取两种类型的动宾搭配词对,共计50611对次(tokens),考察高频双字动词所带宾语的义类分布情况,并基于义类信息对依存树... 本文基于《同义词词林》的义类信息,对动宾搭配短语进行了相关考察与实验。主要从100万字的清华汉语树库(TCT973)中抽取两种类型的动宾搭配词对,共计50611对次(tokens),考察高频双字动词所带宾语的义类分布情况,并基于义类信息对依存树库中的动词进行了动宾搭配识别实验,以"发展"为例讨论了义类信息的效用与不足。 展开更多
关键词 义类 同义词词林 动宾搭配
在线阅读 下载PDF
一部学术性与实用性俱佳的词典学力作——《计算词典学与新型词典》评介 被引量:2
15
作者 夏立新 《辞书研究》 2005年第1期148-156,共9页
《计算词典学与新型词典》是一部学术性和实用性紧密结合的词典学新作。该书系统地论述了计算词典学的性质、任务及其研究范围,建立了计算词典学的理论框架,还对国内外大量的光盘词典、芯片词典和网络词典进行了研究和分析,涉及它们的... 《计算词典学与新型词典》是一部学术性和实用性紧密结合的词典学新作。该书系统地论述了计算词典学的性质、任务及其研究范围,建立了计算词典学的理论框架,还对国内外大量的光盘词典、芯片词典和网络词典进行了研究和分析,涉及它们的界面结构、收词范围、释义方式及释义结构、例证特色等方面,并在此基础上提出了一套与印刷本词典既有联系又相互区别的电子词典编纂原则和方法。本文对该书的主要内容作简介和评述,旨在引起我国辞书界和广大读者的关注。 展开更多
关键词 计算词典学 实用性 学术性 评介 力作 紧密结合 理论框架 光盘词典 网络词典 界面结构 收词范围 释义方式 编纂原则 电子词典 国内外 例证 辞书
在线阅读 下载PDF
从“用户友善”角度评在线版《牛津英语词典》 被引量:1
16
作者 吴晓真 《辞书研究》 北大核心 2004年第5期112-120,共9页
大型英语词典因为体积大、携带不便、检索途径单一、缺乏互动、信息滞后等原因在“用户友善”方面有待改进。在线版《牛津英语词典》在这方面给了我们很好的启发 ,因为它具有易检性、“透明”性、个性化“互动”、及时更新性这四大特点。
关键词 在线版《牛津英语词典》 检索途径 “用户友善”程度 网络技术
在线阅读 下载PDF
基于语料库的维语名词研究理论框架 被引量:1
17
作者 阿依克孜.卡德尔 开沙尔.卡地尔 《长春大学学报》 2015年第3期40-43,共4页
现代维吾尔语信息处理研究工作开展以来,已取得了一定的成果,但从另一个角度来看,忽视了信息技术研究成果在语言研究及教学领域中的有效利用。因此,先构建维吾尔语名词语料库,并在此基础上对名词的形态、句法、语义及语用特点进行量化分... 现代维吾尔语信息处理研究工作开展以来,已取得了一定的成果,但从另一个角度来看,忽视了信息技术研究成果在语言研究及教学领域中的有效利用。因此,先构建维吾尔语名词语料库,并在此基础上对名词的形态、句法、语义及语用特点进行量化分析,可以实现现代信息技术与语言研究的有机结合。 展开更多
关键词 名词 语料库 维吾尔语
在线阅读 下载PDF
哈希表在计算语言学中的运用 被引量:1
18
作者 高文利 朱丽 《现代语文(下旬.语言研究)》 2009年第6期110-111,共2页
在汉语词典查询算法中,哈希表知道搜索捷径,然而数组只知道正式的路线,因而与标准的二分检索相比,哈希表的搜索速度比数组快多了。在算法中,如果能恰当地使用哈希表,就会极大地提高效率。
关键词 哈希表 数组 二分检索 语言统计
在线阅读 下载PDF
电子词典新理念 被引量:3
19
作者 曾方本 《中国民航飞行学院学报》 2004年第1期37-40,共4页
电子计算机给人类带来的影响是深远的,这种影响在词典领域的重要产物之一便是电子词典。目前所开发的电子词典类别主要有袖珍电子词典、自动词典、光盘只读词典与在线词典。电子词典给我们带来许多有关词典学的新理念,它们对传统的词典... 电子计算机给人类带来的影响是深远的,这种影响在词典领域的重要产物之一便是电子词典。目前所开发的电子词典类别主要有袖珍电子词典、自动词典、光盘只读词典与在线词典。电子词典给我们带来许多有关词典学的新理念,它们对传统的词典观形成很大冲击,从而促使我们对词典学的许多问题重新去思考。 展开更多
关键词 电子词典 电子计算机 印刷词典 语料库 在线词典
在线阅读 下载PDF
日语中汉字词汇翻译中的陷阱 被引量:2
20
作者 张秀强 《日语知识》 2007年第11期41-42,共2页
每个日语学习者都会知道,日语中汉字词汇与汉语的含义未必相同。但尽管如此,在翻译日语中汉字词汇的时候,人们还是容易下意识地按照汉语的字面意思去思考日语的意思,想当然地采取“拿来主义”,把日语词汇直接当成汉语来使用,由此... 每个日语学习者都会知道,日语中汉字词汇与汉语的含义未必相同。但尽管如此,在翻译日语中汉字词汇的时候,人们还是容易下意识地按照汉语的字面意思去思考日语的意思,想当然地采取“拿来主义”,把日语词汇直接当成汉语来使用,由此而出错的例子屡见不鲜。于是看似简单的汉字词汇,在中国人的翻译实践中却成了陷阱。本文拟通过几个典型的错误译例进行简单介绍。 展开更多
关键词 日语词汇 汉字词汇 词汇翻译 “拿来主义” 字面意思 翻译实践 学习者 汉语
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部