期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
Event detection and evolution in multi-lingual social streams 被引量:4
1
作者 Yaopeng Liu Hao Peng +2 位作者 Jianxin Li Yangqiu Song Xiong Li 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第5期213-227,共15页
Real-life events are emerging and evolving in social and news streams.Recent methods have succeeded in capturing designed features of monolingual events,but lack of interpretability and multi-lingual considerations.To... Real-life events are emerging and evolving in social and news streams.Recent methods have succeeded in capturing designed features of monolingual events,but lack of interpretability and multi-lingual considerations.To this end,we propose a multi-lingual event mining model,namely MLEM,to automatically detect events and generate evolution graph in multilingual hybrid-length text streams including English,Chinese,French,German,Russian and Japanese.Specially,we merge the same entities and similar phrases and present multiple similarity measures by incremental word2vec model.We propose an 8-tuple to describe event for correlation analysis and evolution graph generation.We evaluate the MLEM model using a massive human-generated dataset containing real world events.Experimental results show that our new model MLEM outperforms the baseline method both in efficiency and effectiveness. 展开更多
关键词 event detection event evolution stream processing multi-lingual anomaly detection
原文传递
基于多语义空间的机器译文质量估计
2
作者 陈康 刘尧舜 +2 位作者 李茂西 王倩 吴水秀 《中文信息学报》 北大核心 2025年第5期72-81,共10页
在不需要人工参考译文对照的情况下,仅利用源语言句子对机器译文的质量进行评估是机器译文质量估计任务的目标。当前的机器译文质量估计方法仅在单个语义空间内比较源语言句子和机器译文,难以全面捕捉不同语言的语义特征,导致译文质量... 在不需要人工参考译文对照的情况下,仅利用源语言句子对机器译文的质量进行评估是机器译文质量估计任务的目标。当前的机器译文质量估计方法仅在单个语义空间内比较源语言句子和机器译文,难以全面捕捉不同语言的语义特征,导致译文质量估计的准确性和可靠性不足。针对这个问题,该文提出基于多语义空间的机器译文质量估计方法,通过融合源语言、目标语言和跨语言语义空间质量特征,更准确地评估机器译文的质量。该文方法借助大语言模型和相应提示对源语言句子进行翻译生成伪参考译文,对机器译文进行翻译生成回译;利用跨语言预训练模型X-MOD表征源语言句子和回译提取在源语言语义空间的机器译文质量特征、利用X-MOD表征源语言句子和机器译文提取在跨语言语义空间的机器译文质量特征、利用X-MOD表征机器译文和伪参考译文提取在目标语言语义空间的机器译文质量特征;通过多头自注意力机制和前馈神经网络融合多语义空间特征构建端到端的机器译文质量估计神经网络模型。在WMT′23句子级别机器译文质量估计任务基准数据集上的实验结果表明,该文方法性能超过了当前先进的机器译文质量估计方法TransQuest和UniTE,并超过了参与评测的最优系统。 展开更多
关键词 机器译文质量估计 跨语言预训练模型 多语义空间特征 伪参考译文 回译
在线阅读 下载PDF
基于多类型词信息引导的汉越跨语言摘要生成方法
3
作者 贾伟强 张勇丙 高盛祥 《计算机应用与软件》 北大核心 2025年第7期161-166,260,共7页
任务大多依赖于机器翻译,而越南语这类低资源语种翻译效果不佳,汉越跨语言摘要面临着数据稀缺下双语语义对齐困难的问题。针对该问题,提出一种基于多类型词信息引导的汉越跨语言摘要生成方法。利用显式的关键词信息引导对源文本重要信... 任务大多依赖于机器翻译,而越南语这类低资源语种翻译效果不佳,汉越跨语言摘要面临着数据稀缺下双语语义对齐困难的问题。针对该问题,提出一种基于多类型词信息引导的汉越跨语言摘要生成方法。利用显式的关键词信息引导对源文本重要信息的编码;利用外部汉越双语概率词典中的词对齐信息,引导编解码器对关键信息的双语对齐;基于指针-生成网络,将两类词信息应用于越南语摘要的生成任务。在构建的汉越跨语言摘要数据集上的实验结果表明,该模型可以有效提升跨语言摘要生成的质量。 展开更多
关键词 多类型词信息 外部知识 词对齐 关键词引导 跨语言摘要
在线阅读 下载PDF
片马茶山人和谐的多语生活——语言和谐调查研究的理论方法个案剖析 被引量:9
4
作者 戴庆厦 余金枝 +2 位作者 余成林 林新宇 范丽君 《云南师范大学学报(哲学社会科学版)》 CSSCI 2009年第6期5-15,共11页
本文根据田野调查的语料分析了片马茶山人和谐多语的语言生活。指出茶山人的多语生活具有全民性、稳定性、和谐性的特点;并分析了和谐的多语生活对茶山人发展、繁荣的重要作用。
关键词 片马茶山人 和谐 多语生活
在线阅读 下载PDF
国际化复语型人才的内涵与培养模式探索 被引量:59
5
作者 王雪梅 徐璐 《外语与外语教学》 CSSCI 北大核心 2011年第1期9-12,共4页
本论文在回顾国际化复语型人才相关研究的基础上,指出国际化背景下的外语人才可以分为学术型、专业型、职业型等。国际化复语型人才为专业型外语人才,其内涵可从国际化和复语型两个层面阐释。针对这一人才培养目标,作者提出"3M+3C+3... 本论文在回顾国际化复语型人才相关研究的基础上,指出国际化背景下的外语人才可以分为学术型、专业型、职业型等。国际化复语型人才为专业型外语人才,其内涵可从国际化和复语型两个层面阐释。针对这一人才培养目标,作者提出"3M+3C+3I"立体化人才培养模式。其中3M即"内容跨学科、课程模块化、信息多维度",3C即培养过程注重"建构、合作、交流",3I即教学管理和评估"互动、公正、国际化"。该模式适应全球化背景对创新型外语人才的需求,具有跨学科性、国际化、实践性。但对生源、教学资源、教学环境等要求较高。在具体实施过程中需要协调管理,切实监控人才培养质量。 展开更多
关键词 国际化复语型人才 内涵 “3M+3C+3I”培养模式
原文传递
多文种环境下汉字内码识别算法的研究 被引量:16
6
作者 李培峰 朱巧明 钱培德 《中文信息学报》 CSCD 北大核心 2004年第2期73-79,共7页
汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中... 汉字内码向ISO/IEC 10 6 46过渡是实现计算机用文字编码统一的必然趋势 ,但目前在一段时间内仍将存在多种汉字内码并存的情况 ,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题 ,并提供了多种汉字内码识别算法 ,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上 ,本文对不同的识别算法进行分析和评估。在对目标样本的测试中 ,以上算法的识别率最高可以达到 99 9%以上。 展开更多
关键词 计算机应用 中文信息处理 多文种环境 汉字内码 识别算法
在线阅读 下载PDF
数据库管理系统多民族语言支持研究 被引量:4
7
作者 程伟 林河水 +1 位作者 吴健 孙玉芳 《中文信息学报》 CSCD 北大核心 2006年第2期94-100,共7页
目前流行的各种大型数据库系统都缺乏对民族语言如藏、蒙、维文的支持。如何实现民文信息在数据库中存储、查询和检索等处理及支持各种基于民文的数据库应用,是一个重要问题。本文提出了一个数据库管理系统多民族语言支持框架,支持多民... 目前流行的各种大型数据库系统都缺乏对民族语言如藏、蒙、维文的支持。如何实现民文信息在数据库中存储、查询和检索等处理及支持各种基于民文的数据库应用,是一个重要问题。本文提出了一个数据库管理系统多民族语言支持框架,支持多民族语言、数据库客户端工具和应用编程接口;并在此框架下提出了一种符合ISO/IEC 14651语义的藏文排序方法,从而实现了PostgreSQL数据库对藏文信息处理的全面支持。并在Linux平台的PostgreSQL数据库系统上加以实现。 展开更多
关键词 计算机应用 中文信息处理 数据库管理系统 民族语言支持 藏文 字典序
在线阅读 下载PDF
多语旅游环境建构与旅游资源价值提升 被引量:16
8
作者 田海龙 沈长智 《天津商业大学学报》 2008年第1期43-47,共5页
语言不仅可以描述旅游资源,而且可以建构旅游资源,提升旅游资源的价值。构建多语旅游环境更是对提高旅游资源的价值具有特殊意义。从天津旅游资源的实际出发,运用话语建构理论的研究成果,在国际化都市文化旅游环境发展战略的指导下,讨... 语言不仅可以描述旅游资源,而且可以建构旅游资源,提升旅游资源的价值。构建多语旅游环境更是对提高旅游资源的价值具有特殊意义。从天津旅游资源的实际出发,运用话语建构理论的研究成果,在国际化都市文化旅游环境发展战略的指导下,讨论构建天津多语旅游环境的战略与措施,以期构建体系完善、功能齐全、特色突出的多语旅游环境,提升天津旅游资源价值。 展开更多
关键词 天津旅游资源 多语旅游环境 话语建构 价值提升 战略与措施
在线阅读 下载PDF
多语种网络文本快速新词抽取 被引量:2
9
作者 刘冰洋 刘倩 +2 位作者 张瑾 刘欣然 程学旗 《中文信息学报》 CSCD 北大核心 2014年第2期78-84,共7页
从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改... 从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改进的统计方法在双后缀树上以线性时间统计重复串与邻接类别,并计算字符串的整体度,同时通过剪枝大幅度减少计算量,在中、英文语料上较好地实现了新词的抽取及排序。 展开更多
关键词 新词 邻接类别 字符串整体度 后缀树 多语言
在线阅读 下载PDF
应用型复语人才培养模式探析 被引量:9
10
作者 刘晓康 李彦 +2 位作者 曹京华 程毓 蒋秀丽 《大理学院学报(综合版)》 CAS 2013年第2期70-73,共4页
为深化外语教育改革,加速国际化视野下教育质量工程建设,改变英语专业同质化、人才规格单一化现象,复语人才培养是改革趋势之一。结合高校实情,明晰复语教学的相关概念、复语人才类型以及了解应用型复语人才培养的特点是此项改革的要点... 为深化外语教育改革,加速国际化视野下教育质量工程建设,改变英语专业同质化、人才规格单一化现象,复语人才培养是改革趋势之一。结合高校实情,明晰复语教学的相关概念、复语人才类型以及了解应用型复语人才培养的特点是此项改革的要点,复语语种选择是决策的关键。 展开更多
关键词 英语专业 复语 应用型人才 人才培养模式
在线阅读 下载PDF
马来西亚:多语言多文化背景下官方语言的推行与华语的拼争 被引量:33
11
作者 郭熙 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2005年第3期87-94,共8页
多语言多文化背景下官方语言的推广和弱势族群母语的传承和维护是一对矛盾。马来西亚的经验表明官方语言推广中语言地位规划优先于本体规划,地位规划的实现是一个缓慢的过程。处于弱势的族群的拼争可以延缓其母语走向衰落,但其生命力取... 多语言多文化背景下官方语言的推广和弱势族群母语的传承和维护是一对矛盾。马来西亚的经验表明官方语言推广中语言地位规划优先于本体规划,地位规划的实现是一个缓慢的过程。处于弱势的族群的拼争可以延缓其母语走向衰落,但其生命力取决于多个方面。华语在马来西亚的前景不容乐观,它给学界提出了许多值得进一步思考的课题。 展开更多
关键词 多语言 语言规划 母语维护
在线阅读 下载PDF
大语言模型与多语言智能的研究进展与启示 被引量:22
12
作者 徐月梅 胡玲 +2 位作者 赵佳艺 杜宛泽 王文清 《计算机应用》 CSCD 北大核心 2023年第S02期1-8,共8页
针对大语言模型(LLM)在高资源语言上表现优异而在低资源语言上表现欠佳的现状,深入分析LLM在多语言场景下的研究现状、技术与局限。首先,从2018年至今以Multi-BERT(multi-lingual Bidirectional Encoder Representations from Transform... 针对大语言模型(LLM)在高资源语言上表现优异而在低资源语言上表现欠佳的现状,深入分析LLM在多语言场景下的研究现状、技术与局限。首先,从2018年至今以Multi-BERT(multi-lingual Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)和ChatGPT(Chat Generative Pre-trained Transformer)等语言模型为代表,综述LLM的发展脉络;然后,具体分析了大语言模型在多语言智能上的探索,总结现有LLM在多语言智能的研究局限及其改进方向;最后,探讨LLM未来的多语言智能应用场景。分析指出现有LLM受限于多语言训练语料不均衡,存在语言文化的伦理偏见、语言模型的风格趋同化、多语言能力评估基准缺乏以及多语言场景下的模型幻象输出等问题,未来可采用同一语系家族语言的联合训练、多语言适配器技术、跨语言迁移学习技术、提示语工程技术、基于人工智能反馈的强化学习技术等策略实现多语言智能的LLM。 展开更多
关键词 大语言模型 多语言智能 跨语言模型 通用人工智能 迁移学习
在线阅读 下载PDF
多语言复杂文本布局引擎分析及应用 被引量:1
13
作者 林民 萨日娜 嘎日迪 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2008年第1期67-70,共4页
分析了微软多语言复杂文本布局引擎Uniscribe的主要工作机制,说明了Uniscribe主要接口函数的功能及用法.基于Uniscribe接口实现了支持Unicode编码和OpenType字体的蒙古文竖向文本编辑器,解决了其中的一些技术难题.
关键词 多语言 复杂文本 布局引擎 OPENTYPE Uniscribe
在线阅读 下载PDF
民族交往交流交融的典型例证——中国古代合璧文字文献刍论 被引量:16
14
作者 史金波 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2022年第3期5-23,共19页
中国作为统一的多民族国家,在存世的大量文献中,有很多两种或两种以上民族文字书写、镌刻在一起的文献,形成颇具特色的合璧文字文献。本文从大量存世和出土的文献,包括碑刻、印章、钱币、符牌、书籍、社会文书、题记等中搜集合璧文字文... 中国作为统一的多民族国家,在存世的大量文献中,有很多两种或两种以上民族文字书写、镌刻在一起的文献,形成颇具特色的合璧文字文献。本文从大量存世和出土的文献,包括碑刻、印章、钱币、符牌、书籍、社会文书、题记等中搜集合璧文字文献,按朝代顺序系统梳理论述。同时,进一步探讨合璧文献的成因,认为这些文献源于中国历史上民族之间的密切关系,有的宣示中央和地方政权的关系,有的记录有关重大历史事件,有的显示社会生活、培养双语人才、科举考试和传播宗教的实际需要。并且分析了合璧文献有历时长、文种多、数量大、以汉文为主体、呈渐增趋势等特点。论证了合璧文献在历史学、民族学、文字学、语言学和文化交流方面的重要学术价值,形成中华民族文化的一道亮丽的彩线,折射出中华民族多元一体的内在联系,体现出其多学科、多方面的学术价值和文物价值,是中华民族优秀传统文化有特色的瑰宝,值得特别珍视。 展开更多
关键词 文字 合璧文献 汉文 民族文字 交往交流交融
原文传递
角色反演算法在问答系统中的应用 被引量:1
15
作者 党琰 张冬茉 李芳 《计算机工程与应用》 CSCD 北大核心 2004年第36期213-217,共5页
该文介绍了如何将角色反演算法的思想用在多信息源多语种问答系统中来构建句法分析器。常用的句法分析算法由于受到语法规模大小的限制,一般都不能有效地应用到实际的自然语言处理当中。角色反演算法思想是将Chart算法的高空间效率和广... 该文介绍了如何将角色反演算法的思想用在多信息源多语种问答系统中来构建句法分析器。常用的句法分析算法由于受到语法规模大小的限制,一般都不能有效地应用到实际的自然语言处理当中。角色反演算法思想是将Chart算法的高空间效率和广义LR算法的高时间效率有效地结合起来,从而大大提高了综合的分析效率。基于多信息源多语种的问答系统,拥有大规模语法(上万条语法规则),通过引入角色反演算法思想,可以分别在问句分析模块和答句生成模块中有效地完成问句和文本答案候选文档的句法分析。 展开更多
关键词 角色反演算法 句法分析 多信息源 多语种 问答系统
在线阅读 下载PDF
少数民族多语人才资源开发与三种语言教育体系构建 被引量:28
16
作者 张贞爱 《延边大学学报(社会科学版)》 2007年第6期71-74,共4页
全球经济一体化和多元文化并存的时代特征比以往任何时期都彰显着多语能力的优势。这为少数民族双语双文化建构特征的优势发展搭建了新的平台。可见,多语能力是新时期少数民族人才资源的优势所在,少数民族需要重新认识自身语言文化建构... 全球经济一体化和多元文化并存的时代特征比以往任何时期都彰显着多语能力的优势。这为少数民族双语双文化建构特征的优势发展搭建了新的平台。可见,多语能力是新时期少数民族人才资源的优势所在,少数民族需要重新认识自身语言文化建构的本质属性。研究表明,少数民族语言、汉语、外语三种语言之间存在着语言和语言认知层面上的内在联系。因此,构建适合少数民族思维特征的三种语言教育体系,可以为少数民族多语人才资源开发探索出行之有效的途径。 展开更多
关键词 少数民族 三种语言教育体系 多语能力 认知潜能
在线阅读 下载PDF
以机器翻译技术为核心的多语信息处理研究 被引量:2
17
作者 赵铁军 曹海龙 《中文信息学报》 CSCD 北大核心 2011年第6期81-89,110,共10页
该文介绍了哈尔滨工业大学教育部—微软语言语音重点实验室在多语信息处理方面的研究进展和成果。首先综述了国内外的研究现状,然后重点介绍在统计机器翻译、机器翻译应用、机器翻译评价、跨语言信息检索等方面的研究工作。
关键词 机器翻译 多语信息处理 自然语言处理
在线阅读 下载PDF
信息时代的翻译工具 被引量:14
18
作者 冯志伟 《北华大学学报(社会科学版)》 2007年第6期68-75,共8页
我们正处于一个多语言网络的信息时代,如何有效地使用现代化手段来突破人们之间的语言障碍,成为了全人类面临的共同问题。翻译是克服语言障碍的有利手段。信息时代的翻译工具有:机器翻译系统、因特网上的语言翻译资源、CD-ROM上的语言... 我们正处于一个多语言网络的信息时代,如何有效地使用现代化手段来突破人们之间的语言障碍,成为了全人类面临的共同问题。翻译是克服语言障碍的有利手段。信息时代的翻译工具有:机器翻译系统、因特网上的语言翻译资源、CD-ROM上的语言翻译资源、计算机辅助术语管理系统、双语对应语料库、翻译记忆软件和本土化软件工具、机助翻译系统。掌握了信息时代的这些翻译工具,就可以大大地提高翻译的效率,满足信息时代对翻译的迫切需要。 展开更多
关键词 多语言问题 信息时代 机器翻译 资源 工具
在线阅读 下载PDF
多语竞争复杂agent网络语言竞争与演化分析 被引量:1
19
作者 张寿明 于群修 毕贵红 《系统仿真学报》 CAS CSCD 北大核心 2017年第3期463-478,486,共17页
利用基于社会圈子理论的agent微观建模技术来构建语言竞争社会网络。构建的网络不仅拓扑结构参数更接近实际社会网络,而且网络中的个体可以移动、死亡和新生,具有动态特性。以三语竞争为例,提出一种将网络中的个体间三语竞争分解为3个... 利用基于社会圈子理论的agent微观建模技术来构建语言竞争社会网络。构建的网络不仅拓扑结构参数更接近实际社会网络,而且网络中的个体可以移动、死亡和新生,具有动态特性。以三语竞争为例,提出一种将网络中的个体间三语竞争分解为3个两种语言竞争问题的原理,给出了一种基于双语竞争原理的通用多语竞争复杂agent网络仿真建模方法。给出了网络上的节点agent的学习和遗忘模型。利用建立的模型研究了在不同社会环境中个体的语言竞争演化路径。研究表明给出的模型正确模拟了三语竞争问题。 展开更多
关键词 微观建模 多语竞争 社会圈子 复杂网络 AGENT
原文传递
多语际语音迁移实例研究及启示 被引量:6
20
作者 裴光钢 《山东外语教学》 北大核心 2010年第4期46-49,共4页
本文采用定性研究的方式,以西班牙语专业大学生为研究对象,对其在母语和第一外语英语影响下的西班牙语学习过程中出现的语言迁移现象;运用语言对比法研究汉、英、西三种语言的语音规律和特点;使用Audio Recorder Deluxe软件采样展... 本文采用定性研究的方式,以西班牙语专业大学生为研究对象,对其在母语和第一外语英语影响下的西班牙语学习过程中出现的语言迁移现象;运用语言对比法研究汉、英、西三种语言的语音规律和特点;使用Audio Recorder Deluxe软件采样展开研究。重点对多语际语音教学实践中的几个方面加以研究分析:(1)多语际语音学习中各语音之间的语言迁移作用的关系;(2)多语际语音教学中语言迁移现象的特点和规律;(3)多语际语言迁移的作用的影响及对语音教学的启示。分析母语和英语语音基础对学习者学习第二外语所产生的作用和影响,可以为三语习得及外语教学提供有价值的借鉴和经验。 展开更多
关键词 多语际 母语 语音 语言迁移
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部