期刊文献+
共找到1,513篇文章
< 1 2 76 >
每页显示 20 50 100
基于混合分词与动态平滑的藏文N-gram语言模型优化及性能分析
1
作者 曼拉才让 安见才让 仁欠扎西 《信息技术与信息化》 2026年第2期54-58,共5页
藏语自然语言处理的发展是推动藏语言信息化进程的核心支撑。针对藏语屈折性与黏着性复合形态特征,文章提出一种融合藏语特性优化混合分词策略与“黏着性因子α”动态平滑技术的语言模型构建方案。基于SRILM工具与Python并行计算技术,完... 藏语自然语言处理的发展是推动藏语言信息化进程的核心支撑。针对藏语屈折性与黏着性复合形态特征,文章提出一种融合藏语特性优化混合分词策略与“黏着性因子α”动态平滑技术的语言模型构建方案。基于SRILM工具与Python并行计算技术,完成1~7元N-gram模型的高效训练与系统评估,重点分析不同N值对模型性能的影响。实验结果显示,综合模型困惑度(PPL)与文本生成质量,当N值处于3~6范围时模型表现较优,其中N=4时效果最佳。该系统在分词灵活性、平滑技术适配性及计算效率上实现显著提升,不仅为藏语这一低资源、形态复杂语言的N-gram模型优化及基础参数确立提供了有效路径,也为后续更复杂藏语神经网络模型的研究奠定了坚实基准。 展开更多
关键词 藏语NLP N-GRAM模型 混合分词 低资源语言 黏着性因子
在线阅读 下载PDF
藏语卓尼话动词的相对时范畴研究
2
作者 班地草 祁坤钰 《语言与文化研究》 2026年第2期43-46,共4页
本文以藏语卓尼话的动词系统为研究对象,系统考察其独特的时体范畴体系。第一,分析卓尼话的相对时范畴,揭示其通过动词词根屈折变化和辅助成分表达事件时间与参照点关系的内在机制。第二,探讨卓尼话动词的时体关系,阐明相对时与体范畴... 本文以藏语卓尼话的动词系统为研究对象,系统考察其独特的时体范畴体系。第一,分析卓尼话的相对时范畴,揭示其通过动词词根屈折变化和辅助成分表达事件时间与参照点关系的内在机制。第二,探讨卓尼话动词的时体关系,阐明相对时与体范畴在句法层面既相互独立又相互作用的复杂关系。研究发现,卓尼话的时体系统呈现出以体范畴为主干、相对时为补充的显著特征,体标记在表达时间关系时具有重要的参照功能,这为理解安多方言乃至整个藏语时体系统的类型特点提供了新的视角。 展开更多
关键词 卓尼话 动词 时范畴 体范畴
原文传递
嘉绒语组植物词汇的历史比较初探——以白湾嘉绒语与斯跃武绰斯甲语为例
3
作者 章舒娅 赖云帆 杨从卫 《民族语文》 北大核心 2026年第1期79-90,共12页
本研究将语言学方法运用于嘉绒语民族植物学研究。依托实地采集的第一手材料,系统辨识植物词汇中的同源词、漫游词与借词等来源类型,为重构嘉绒藏族生产生活环境提供多维证据。其中,同源词揭示原始语使用者所处的自然环境、农业水平、... 本研究将语言学方法运用于嘉绒语民族植物学研究。依托实地采集的第一手材料,系统辨识植物词汇中的同源词、漫游词与借词等来源类型,为重构嘉绒藏族生产生活环境提供多维证据。其中,同源词揭示原始语使用者所处的自然环境、农业水平、以及对野生植物的利用情况;漫游词反映区域流行植物的分布与传播;汉语和藏语借词则体现文化接触与交流的历史。并以植物词汇研究为例,强调历史语言学在重构藏羌彝走廊区域文化历史中的关键作用。 展开更多
关键词 嘉绒语组 民族植物学 历史语言学 同源词 漫游词
原文传递
木雅语的话语占位词
4
作者 黄阳 《民族语文》 北大核心 2026年第1期68-78,共11页
当说话人暂时想不起来如何表达,或找不到一个合适的词来表述时,会使用占位词进行自我修补。借助占位词,说话人可为流畅的话语表达赢得时间、构建篇章互动话轮。木雅语使用指示词?ɐ^(55)tsɨ^(33)“这”、wɐ^(55)tsɨ^(33)“那”和?ɐ^(55)k... 当说话人暂时想不起来如何表达,或找不到一个合适的词来表述时,会使用占位词进行自我修补。借助占位词,说话人可为流畅的话语表达赢得时间、构建篇章互动话轮。木雅语使用指示词?ɐ^(55)tsɨ^(33)“这”、wɐ^(55)tsɨ^(33)“那”和?ɐ^(55)khɐ^(33)“这里”、wɐ^(55)khɐ^(33)“那里”充当占位词。占位词?ɐ^(33)tsɨ^(55)、wɐ^(33)tsɨ^(55)除了能指代名词性成分,还能指代动词性成分;不同语境中的占位词还能添加格标记、体标记或连词等语法标记。占位词在语篇中有进一步演变成犹豫标记的趋势,话语标记的演变属于典型的征派过程,是句子语法单位向话语语法单位发展的重要体现。本文通过对木雅语占位词和犹豫标记形态句法特征、韵律特征和语义语用特征的细致描写,强调语篇分析在川西濒危民族语言研究中的重要性。 展开更多
关键词 木雅语 占位词 话语标记 征派过程
原文传递
从铅字到屏幕:藏汉新闻翻译的媒介变迁
5
作者 桑丁永芷 《河北画报》 2026年第2期144-146,共3页
本文主要探讨了藏汉新闻翻译从过去的铅字印刷时代,发展到如今的屏幕数字时代所经历的变化。随着传播媒介的转变,翻译的内容、风格、传播方式和译者角色都发生了很大变化。屏幕时代虽然带来了传播更快、形式更多样的优势,但也带来了一... 本文主要探讨了藏汉新闻翻译从过去的铅字印刷时代,发展到如今的屏幕数字时代所经历的变化。随着传播媒介的转变,翻译的内容、风格、传播方式和译者角色都发生了很大变化。屏幕时代虽然带来了传播更快、形式更多样的优势,但也带来了一些新问题,如翻译质量难以保证、文化差异更难处理等。文章最后也提出了一些应对策略,希望能为藏汉新闻翻译的未来发展提供一些参考。 展开更多
关键词 藏汉新闻翻译 媒介变迁 屏幕时代 翻译问题 应对策略
在线阅读 下载PDF
西藏语言文字事业的繁荣发展
6
作者 尹蔚彬 侬群华 《中国藏学》 北大核心 2025年第4期76-89,213,214,共16页
我国一直重视少数民族语言文字事业的繁荣发展,文章回溯新中国成立以来,特别是西藏自治区成立后,涉藏语言文字事业的发展历程。文章从国家法律政策保障、民族语言文字管理机构、教学机构、出版和翻译机构的设立、国家级语言文字项目立... 我国一直重视少数民族语言文字事业的繁荣发展,文章回溯新中国成立以来,特别是西藏自治区成立后,涉藏语言文字事业的发展历程。文章从国家法律政策保障、民族语言文字管理机构、教学机构、出版和翻译机构的设立、国家级语言文字项目立项等方面,论述西藏语言文字事业的繁荣发展突出表现在自治区政策法规的出台施行,藏语文工作指导委员会的设立,藏语文的规范化、标准化和信息化建设,以及藏文古籍的整理保护、研究和开发利用等领域取得了突出成就,说明在党和政府重视和支持下,西藏语言文字事业实现了跨越式发展。当前,推广普及国家通用语言文字,是社会经济发展的必然需求,大力推广普及国家通用语言文字与科学保护少数民族语言文字二者并行不悖。 展开更多
关键词 西藏 语言文字事业 繁荣 发展
原文传递
传世经典与汉藏交流:新近发现的《法显传》藏译本研究
7
作者 看本加 夸新木加 《西藏研究》 北大核心 2025年第1期16-27,155,156,共14页
《法显传》藏译本由蒙古族高僧洛桑达央以汉文《历游天竺记》为蓝本,并参考蒙古文、外文等多种文本,于1918年翻译而成。藏译本由序言、正文、跋文三部分组成,正文有40章,并有52条注释。通过比对汉藏文本发现,藏译本忠实原文,表达通顺,... 《法显传》藏译本由蒙古族高僧洛桑达央以汉文《历游天竺记》为蓝本,并参考蒙古文、外文等多种文本,于1918年翻译而成。藏译本由序言、正文、跋文三部分组成,正文有40章,并有52条注释。通过比对汉藏文本发现,藏译本忠实原文,表达通顺,极具风格,质量上乘,但也存在对部分原文理解不够、缺译、增译等问题。此藏译本也是继《大唐西域记》之后又一中华优秀传统文化典籍的藏译,对汉藏佛教文化交流、铸牢中华民族共同体意识等具有重要的学术价值和现实意义。 展开更多
关键词 《法显传》 洛桑达央 《大唐西域记》 汉藏文化交流
在线阅读 下载PDF
文献、语言与文化:托马斯的藏学研究体系及其影响
8
作者 色达拉措 《河北画报》 2026年第1期165-167,共3页
弗雷德里克·威廉·托马斯(Frederick William Thomas),是英国著名的藏学家之一,也是系统整理并出版敦煌古藏文文献的重要学者。他的《敦煌西域古藏文社会历史文献》与《东北藏古代民间文学》两部著作,代表了当时国际敦煌古藏... 弗雷德里克·威廉·托马斯(Frederick William Thomas),是英国著名的藏学家之一,也是系统整理并出版敦煌古藏文文献的重要学者。他的《敦煌西域古藏文社会历史文献》与《东北藏古代民间文学》两部著作,代表了当时国际敦煌古藏文研究的最高水平,被誉为“倾其一生才智贡献给学术界的力作”,兼具第一手史料价值与开拓性研究意义。作为英国藏学界的杰出代表,其研究不仅填补了藏学领域的诸多空白,更开创了敦煌藏文文献系统研究之先河。他融合文献学、语言学、历史学与人类学等多学科方法,为藏学研究提供了全新的范式与方法论基础,至今仍深刻影响着该学科的发展。本文采用文献研究法,从托马斯的人生经历、学术成果及其对藏学的主要贡献3方面入手,探讨其如何通过文献、语言与文化的多维视角,构建起独具特色的藏学研究体系,并持续影响后世。 展开更多
关键词 藏学家 敦煌藏文文献 文献整理 跨学科研究
在线阅读 下载PDF
论藏语传统文法中“随欲名”及“随立名”分类法的语言学价值
9
作者 邓戈 根棍 《西藏大学学报(藏文版)》 2025年第2期155-173,195,196,共21页
文章对藏语传统语言学的词汇分类法(随欲名与随立名)与现代语言学中的词汇分类法(基本词汇与一般词汇)进行了比较研究,并提出了两种分类法的出发点与目标任务的差异。随欲名与随立名的分类主要依据命名或构词是否具有理据性,是否约定俗... 文章对藏语传统语言学的词汇分类法(随欲名与随立名)与现代语言学中的词汇分类法(基本词汇与一般词汇)进行了比较研究,并提出了两种分类法的出发点与目标任务的差异。随欲名与随立名的分类主要依据命名或构词是否具有理据性,是否约定俗成性与有据可依性的差别,旨在探讨名与实的辩证关系,内容偏向于语言哲学范畴;而基本词汇及一般词汇的分类依据是词在语汇中的作用及地位,是基于词的基础性、能产性和全民性等特点,探讨基本词汇对于一般词汇发展的作用,以及一定条件下一般词汇与基本词汇的角色转换规律,其内容侧重于社会语言学范畴。根据两种分类法的逻辑,可以确定两种分类法既不可相互替代,也不能彼此涵盖,各自具有不同的功能和作用。因此,在语言教学与研究中,应兼收并蓄,不可偏废其一。在两种词汇分类法进行比较分析的基础上,文章还论述了随欲名的约定俗成性,以及随立名的理据剖析法对名实关系的哲学辩证具有科学的理论价值。认为,随立名的命名法与理据分类直接构成辞藻学的主体理论,随欲名及随立名的二级分类,即词的专指与借指、单义与多义等分类法不仅能深化语义学研究,也能够拓展词源学的研究路径。因此,随欲名与随立名分类法,在现代语言学及词汇学的内涵发展方面具有一定的理论价值和现实意义。 展开更多
关键词 随欲名 随立名 语义学 词源学 语言学价值
在线阅读 下载PDF
新时期藏语文研究综述
10
作者 格桑益西 边巴多吉 曲杰 《西藏大学学报(藏文版)》 2025年第4期81-101,207,共22页
新时代以来,西藏自治区学界牵头主持并承担了多项语言学领域的哲学社会科学研究项目,项目层级涵盖国家级、省部级社科规划项目,形成了多层次、体系化的研究布局。文章以藏语言研究相关的国家社科基金项目和西藏自治区哲学社会科学项目... 新时代以来,西藏自治区学界牵头主持并承担了多项语言学领域的哲学社会科学研究项目,项目层级涵盖国家级、省部级社科规划项目,形成了多层次、体系化的研究布局。文章以藏语言研究相关的国家社科基金项目和西藏自治区哲学社会科学项目及其相关成果为研究对象,对新时代西藏自治区藏语言研究相关成果进行了整理研究。同时,在此过程中,主要考虑与社会科学基金项目相关的专著、编著和译著,以及在《西藏大学学报》藏文版和《西藏研究》藏文版上公开发表,且有对应项目支持的学术论文。党的十八大以来,西藏自治区语言学界科研实力持续提升,共主持承担26项国家社会科学基金项目、20项西藏自治区哲学社会科学项目。科研团队围绕各项目核心研究内容展开系统攻关,产出了包括学术专著、期刊论文、研究报告在内的丰硕成果,形成了“项目驱动一成果转化”的良性科研生态。就其研究内容来看,上述成果几乎覆盖藏语言文字研究领域的核心课题,形成了传统与现代兼顾的研究格局,既有对藏族传统语言学、藏语历史语言学等基础领域的深耕,也有契合时代发展需求的西藏社会用字用文研究,以及西藏各族群众语言习得与应用等现实问题的探析,实现了基础研究与应用研究的有机结合。从研究方法的运用来看,相关研究既承袭了藏族传统语言学的研究范式和方法,又利用比较语言学、历史语言学、社会语言学等现代语言学研究方法,同时借鉴了文学领域的分析视角,形成了传统与现代方法互补的研究路径。尤其是,西藏大学国家级重点学科“藏语言文学”的教师团队,立足藏语言文字学科建设的核心需求与发展规划,系统开展学术编撰工作,先后编写并出版了多部兼具理论价值与实践意义的相关专著,为学科体系的完善提供了重要支撑。 展开更多
关键词 社会科学基金项目 语言学 项目驱动 成果转化 学科建设
在线阅读 下载PDF
基于特征融合结合注意力机制的藏文文本分类模型 被引量:1
11
作者 冯宇舒 艾金勇 李爽 《科技创新与应用》 2025年第10期61-65,共5页
由于藏语与汉语、英语在语法结构和词汇特点上的差异,传统的文本分类方法在藏文上的应用面临挑战。为此,该文提出一种基于多特征融合与注意力机制的藏文文本分类模型,该模型结合CINO、TextCNN和BiLSTM模型的优势。实验结果表明,该文提... 由于藏语与汉语、英语在语法结构和词汇特点上的差异,传统的文本分类方法在藏文上的应用面临挑战。为此,该文提出一种基于多特征融合与注意力机制的藏文文本分类模型,该模型结合CINO、TextCNN和BiLSTM模型的优势。实验结果表明,该文提出的模型在公开数据集TNCC上的F1值为73.09%,在自建数据集TiTCD上的F1值为80.97%。因此,该模型能够较好地捕捉到藏文文本语义,在藏文文本分类任务上性能有所提升。 展开更多
关键词 藏文文本分类 预训练语言模型 多特征融合 注意力机制 文本分类方法
在线阅读 下载PDF
多模态技术在藏语安多方言生理语音研究中的应用进展 被引量:1
12
作者 久西草 更太加 +1 位作者 金弟 魏建国 《青海科技》 2025年第4期180-188,共9页
藏语安多方言作为藏语重要方言之一,具有复杂的发音系统和独特的声调特征,其语音生成过程涉及多个发音器官的协同运动。传统语音学研究多以声学信号为核心,难以充分揭示发音机制的动态生理基础。借助超声成像、声门电图(EGG)等多模态生... 藏语安多方言作为藏语重要方言之一,具有复杂的发音系统和独特的声调特征,其语音生成过程涉及多个发音器官的协同运动。传统语音学研究多以声学信号为核心,难以充分揭示发音机制的动态生理基础。借助超声成像、声门电图(EGG)等多模态生理信号采集技术,可以从不同维度获取发音生理信息,实现对语言产生机制的更全面理解。文章综述了藏语安多方言多模态生理语音的研究进展,涵盖相关多模态生理数据采集技术、信号处理方法和该领域研究成果,旨在系统梳理藏语安多方言多模态生理语音的研究现状与挑战,并探讨其关键技术与方法的研究进展,以明确未来发展方向,为相关领域的学术研究和实际应用提供资料参考。 展开更多
关键词 藏语安多方言 多模态 生理信号 超声成像 声门电图
在线阅读 下载PDF
关于新出古藏文吐蕃兵书残卷的几个问题——新出古藏文兵书研究之一
13
作者 陆离 《西藏大学学报(社会科学版)》 北大核心 2025年第1期67-74,共8页
从近年新出古藏文兵律文书中关于大茹本(ru dpondchenpho)、将领(dmag phond,将军)、茹本(ru dpond)、大将领(dmag phondchenpho,大将军)、沃本(vog phond)、宁宗(snying tshoms)等职官、部落的记载来看,与吐蕃时期相关制度不符,该件军... 从近年新出古藏文兵律文书中关于大茹本(ru dpondchenpho)、将领(dmag phond,将军)、茹本(ru dpond)、大将领(dmag phondchenpho,大将军)、沃本(vog phond)、宁宗(snying tshoms)等职官、部落的记载来看,与吐蕃时期相关制度不符,该件军事文书不应该是吐蕃时期的兵书。这件文书应该是宋代古格王朝时期的军事文书,其时间在10-11世纪,年代与敦煌出土藏文文书比较接近,故有相同的古藏文文书特征。至于文书另一面书写有汉文佛经《四分律》内容,这与当时古格等地与中原内地仍然存在宗教文化交流有关。文书记载了古格王朝的相关军事制度,反映了古格王朝对吐蕃时期有关军政制度的继承与发展。 展开更多
关键词 兵律文书 吐蕃 古格王朝 文化交流
在线阅读 下载PDF
拉萨路街名的语言文化特征
14
作者 李永斌 《中国藏学》 北大核心 2025年第3期175-181,219,共8页
拉萨路街名是独特的语言符号,也是展现城市文化底蕴的窗口。文章在标识采集、机构与社区走访的基础上,利用翔实的统计数据,分析了拉萨路街名的音节数量、词汇选择、结构特点等语言特征,并从宗教寺庙、地貌地域、教育愿望、自然风光、机... 拉萨路街名是独特的语言符号,也是展现城市文化底蕴的窗口。文章在标识采集、机构与社区走访的基础上,利用翔实的统计数据,分析了拉萨路街名的音节数量、词汇选择、结构特点等语言特征,并从宗教寺庙、地貌地域、教育愿望、自然风光、机构政治、商业贸易等角度讨论了其蕴含的时代、地域等特色文化,探讨了拉萨路街名的悠久历史、本土特征、多元文化和重要的交际、情感、传承等功能。文章从传统文化与时尚文化、历史痕迹和民俗民风、个性与特色等角度,讨论并提出拉萨路街名语言符号与结构的统一性和规范性、专名的音译和意译、通名的使用和扩展、方位词与数字词的使用与调整、内涵分布与调整、系统化和科学化整理等相关发展策略。 展开更多
关键词 拉萨路街名 语言特征 文化内涵 发展策略
原文传递
《柱间史》与敦煌古藏文《罗摩衍那》的互文关系初探
15
作者 泽拥 《西藏大学学报(社会科学版)》 北大核心 2025年第1期75-85,共11页
西藏割据时期的重要文献《柱间史》历来备受关注,关于其叙事的研究尚有突破的空间。文章主要从互文的视角,尝试解析《柱间史》与敦煌古藏文《罗摩衍那》之间的叙事关系。文章在对比敦煌古藏文《罗摩衍那》《殊胜赞<广释>》和《萨... 西藏割据时期的重要文献《柱间史》历来备受关注,关于其叙事的研究尚有突破的空间。文章主要从互文的视角,尝试解析《柱间史》与敦煌古藏文《罗摩衍那》之间的叙事关系。文章在对比敦煌古藏文《罗摩衍那》《殊胜赞<广释>》和《萨迦格言及注释》几个包含罗摩衍那故事的文献之后,选定古藏文《罗摩衍那》作为与《柱间史》进行互文研究的文本,进而在“英雄与美人”的叙事框架下提出,两个作品在地域特征的描述、猴子与女人及“镜子”与“箭射”的情节设置和松赞干布与罗摩、文成公主与悉多、赤尊公主与布尔巴拉几组人物塑造之间可能存在一种映射关系。这一关系在引入《韦协》《嘛呢全集》《娘氏教法源流》及《弟吴宗教源流》同《柱间史》进行横向对照后,显得更为明晰。对《柱间史》与敦煌古藏文《罗摩衍那》之间潜在的互文关系的揭示,有助于我们进一步认识和挖掘《柱间史》背后深广复杂的历史文化背景。 展开更多
关键词 《柱间史》 敦煌古藏文《罗摩衍那》 互文关系
在线阅读 下载PDF
从古藏语看唐五代西北方音中全清、次清声母字的例外对音
16
作者 陈荣泽 脱慧洁 《西藏民族大学学报(哲学社会科学版)》 2025年第2期138-144,共7页
在以敦煌汉藏对音为代表的唐五代西北方音中,多数全清、次清声母字分别与藏语中的清不送气、送气音形成较为整齐的对应关系。但其中的227个字存在不符合对音规律的例外对音。通过数据统计分析发现,这些例外对音极具规律性:以清音混入同... 在以敦煌汉藏对音为代表的唐五代西北方音中,多数全清、次清声母字分别与藏语中的清不送气、送气音形成较为整齐的对应关系。但其中的227个字存在不符合对音规律的例外对音。通过数据统计分析发现,这些例外对音极具规律性:以清音混入同部位的浊音为主,送气音与不送气音交替次之。这与古藏语的语音特点极为吻合,不是译者的一时疏忽,也不是唐五代西北方音的体现,应是古藏语语音特点的一种反映。 展开更多
关键词 唐五代西北方音 全清 次清 例外对音 古藏语
在线阅读 下载PDF
“请上来”与“派下去”:新中国电影藏语译制事业的创建与发展
17
作者 柳谦 金海娜 《当代电影》 北大核心 2025年第12期40-47,共8页
新中国成立以来,译制少数民族语电影一直是党和政府开展民族工作和电影事业的有机组成部分,却未能得到学术界应有的重视。本文通过考察“请上来”的桑热嘉措电影译制小组和“派下去”的文化部电影宣传工作小组,揭示了藏语电影译制事业... 新中国成立以来,译制少数民族语电影一直是党和政府开展民族工作和电影事业的有机组成部分,却未能得到学术界应有的重视。本文通过考察“请上来”的桑热嘉措电影译制小组和“派下去”的文化部电影宣传工作小组,揭示了藏语电影译制事业的创建与发展是多民族交流合作、互助协作的历史实然。本文试图从少数民族群众观影的特殊性出发,重新诠释我国少数民族电影的历史图景,并为相关研究的拓展做出贡献。 展开更多
关键词 译制藏语电影 少数民族观众 民族交流协作 少数民族电影 历史主线
原文传递
TCST-UT:卫藏方言藏汉语音翻译数据集
18
作者 黎鑫 刘佳洛 +3 位作者 多杰朋毛 看卓措 戚肖克 赵小兵 《中国科学数据(中英文网络版)》 2025年第3期523-534,共12页
在大模型时代,多语种语言资源建设具有极为关键的意义。然而,目前公开的藏汉语音翻译数据集资源极为匮乏,这严重制约了藏语在多语种语言资源建设中的发展。为此,本研究充分参考国际语音翻译数据集规范,采用半自动标注方式构建了大规模... 在大模型时代,多语种语言资源建设具有极为关键的意义。然而,目前公开的藏汉语音翻译数据集资源极为匮乏,这严重制约了藏语在多语种语言资源建设中的发展。为此,本研究充分参考国际语音翻译数据集规范,采用半自动标注方式构建了大规模卫藏方言藏汉语音翻译数据集。首先,基于公开的卫藏方言藏语自动语音识别数据集(M2ASR),利用Gemini-1.5-pro大模型将语音对应的藏语转录文本翻译成汉语。随后,专家对翻译结果进行严格审核与校正,最终整理成高质量的卫藏方言藏汉语音翻译数据集。本数据集包含58,767条藏语语音-藏语文本-汉语文本三元组,音频数据来自147个不同说话人,总时长为72.08小时,藏汉文本对数据文件大小为22 MB。本数据集不仅为藏汉语音翻译研究提供了基础数据,同时也为其他低资源语言的语音翻译数据集构建提供了一定的经验。 展开更多
关键词 藏汉语音翻译 数据集 半自动标注 低资源语言
在线阅读 下载PDF
基于改进隐马尔可夫模型的藏文分词研究
19
作者 贡保加 安见才让 《信息技术与信息化》 2025年第3期64-67,共4页
藏文分词是藏语信息处理领域的基础课题,分词是将原始文本数据切分成词的一种技术。分词技术可以应用到自然语言处理领域的许多下游任务中,诸如机器翻译、语义标注、文本分类、自然语言推理等,分词是自然语言处理中极为关键的环节。文... 藏文分词是藏语信息处理领域的基础课题,分词是将原始文本数据切分成词的一种技术。分词技术可以应用到自然语言处理领域的许多下游任务中,诸如机器翻译、语义标注、文本分类、自然语言推理等,分词是自然语言处理中极为关键的环节。文章基于隐马尔可夫模型对藏文分词进行研究,首先通过语料库训练模型,获取相应的位置信息和概率,其次在传统隐马尔可夫模型的基础上采集了音节与音节之间的特征信息,结合已有的词的位置信息进行测试。测试结果表明,最终准确率在86.05%,相较于传统的隐马尔可夫模型提高了2.3%。 展开更多
关键词 藏文分词 隐马尔可夫模型 分词算法 未登录词
在线阅读 下载PDF
基于Citespace视角下藏语安多方言的研究综述
20
作者 任佳 郭蕾 羊敏华 《现代语言学》 2025年第6期891-899,共9页
With the help of Citespace bibliometric software, this paper uses CNKI database as the source of literature to visually analyze the literature on Tibetan Amdo dialect research in China from 2014 to 2024. The three sta... With the help of Citespace bibliometric software, this paper uses CNKI database as the source of literature to visually analyze the literature on Tibetan Amdo dialect research in China from 2014 to 2024. The three statistical elements of “theme, keywords, and references” were used to carry out quantitative analysis from multiple perspectives, such as the number of published papers and the co-occurrence of keywords, and the data results were summarized and analyzed. By sorting out the research hotspots and evolutionary contexts, this paper puts forward the future development trend of Amdodo dialect research in China, so as to provide a reference for the systematization of Tibetan dialect research. 展开更多
关键词 安多方言 计量分析 CITESPACE
在线阅读 下载PDF
上一页 1 2 76 下一页 到第
使用帮助 返回顶部