书面藏语排序的数学模型及算法被引量：25

The Sorting Mathematical Model and Algorithm of Written Tibetan Language

下载PDF

导出

摘要针对中国国家标准及ISO藏文编码字符集提出书面藏语字词的排序涉及藏字结构序、构造级和字符序概念 ,是不同于中文、英文序性而性质独特的一种排序 .文章详尽分析了藏字字形、结构形态、传统字符顺序以及藏字字长和层高等特征 ,构建出藏语排序的数学模型 .然后依据模型要求为每类藏文符号进行数字赋值 ,通过算法逐步确定字符位置并识别字符 ,最后按照抽取字符的对应数值组合排序 ,完成了藏语字词的排序 .该模型现已在Win dows平台上实现 . According to GB16959-1997 and ISO/IEC 10646-1:1993 of coded character set for Tibetan information processing, there is an engineering need for applying the set to all kinds of software and databases, in which sorting is an important technology. As Tibetan sorting involves construction order, classes of constitution and character sequence in the dictionary order, A Written Tibetan word has an inconceivably complex structure with multi-hierarchies. The paper makes an exhaustive analysis to the structures of words, the order of construction categories, and the sequence of characters in each structural position, as well as the length of words and the hierarchies of vertical composition stacks, and then establishes a sorting mathematical model. On the basis of the analysis, the paper assigns distinctive values to all existing characters with numerals in a word, then step by step identifies each character in the words with special algorithm and match it with character-numeral lists. At last, the paper combines all the values extracted from characters of words and compares different combination to make an ordered arrangement for any words in Tibetan language. This processing strategy has been accomplished in Windows 2000/NT Operating System.

作者江荻康才晙

机构地区中国社会科学院民族学与人类学研究所计算语言学重点实验室北京理工大学自动控制系

出处《计算机学报》 EI CSCD 北大核心 2004年第4期524-529,共6页 Chinese Journal of Computers

基金国家自然科学基金 ( 60 173 0 2 4)资助

关键词藏字结构序构造级字符序计算机排序数学模型 written Tibetan construction order classes of constitution character sequence sorting by computer

分类号 TP317.2 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1National Standard of PRC. Information Technology, Tibeyan Coded Character Sets for Information Interchange, Basic Set(GB 16959-1997). Beijing: Standards Press of China, 1998(in Chinese)(中华人民共和国国家标准. 信息技术、信息交换用藏文编码字符集、基本集(GB16959-1997). 北京:中国标准出版社,1998)
2ISO/IEC 10646-1:1993:Information Technology-Universal Multiple-Octet Coded Character(UCS)
3江荻,周季文.论藏文的序性及排序方法[J].中文信息学报,2000,14(1):56-64. 被引量：34

二级参考文献3

1[1]中国国家标准.信息技术信息交换用藏文编码字符集基本集(GB6959).北京:中国标准出版社,1997
2[2]张怡荪.藏汉大词典.北京:民族出版社,1985
3[3]周季文.藏文拼音教材.北京:民族出版社,1983

共引文献33

1尹蔚彬,戚路堯.周季文藏学研究探析[J].西藏民族大学学报（哲学社会科学版）,2023,44(6):27-32.
2林河水,程伟,曹晖,李文波,吴健,孙玉芳.一种符合ISO14651语义的藏文排序实现方法[J].中文信息学报,2004,18(5):36-41. 被引量：19
3谢谦,吴健,孙玉芳.X Window核心系统的民文支持[J].中文信息学报,2005,19(4):97-104. 被引量：6
4芮建武,吴健,孙玉芳.基于ISO/IEC10646标准的藏文操作系统若干问题研究[J].中文信息学报,2005,19(5):59-66. 被引量：10
5程伟,林河水,吴健,孙玉芳.数据库管理系统多民族语言支持研究[J].中文信息学报,2006,20(2):94-100. 被引量：4
6贾彦民,吴健,欧珠,孙玉芳.藏文支持在OpenOffice.org办公套件中的实现[J].中文信息学报,2006,20(3):49-54.
7张兴亮,芮建武,谢谦,程伟,吴健.藏文编码字符集的扩充集在Linux上的实现[J].中文信息学报,2007,21(2):122-128. 被引量：5
8洪锦玲,贾彦民,朱峰,吴健.藏文基本字符集的支持在OpenOffice.org中的实现方法[J].信息技术与标准化,2007(8):50-54. 被引量：2
9欧珠.在通用字符集中藏文编码模式的研究与应用[J].中文信息学报,2008,22(4):105-108. 被引量：2
10黄鹤鸣,契嘎.德熙嘉措.基于DUCET的藏文排序方法[J].中文信息学报,2008,22(4):109-113. 被引量：11

同被引文献163

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3张连生.藏文号码代字及其计算机排索[J].语言研究,1983,3(2):35-40. 被引量：3
4王沂暖.为藏文字典的编排顺序试提一个新方案[J].西北民族大学学报（哲学社会科学版）,1981(3):53-57. 被引量：3
5索南尖措.藏语动词的黏着性及屈折性变化研究[J].西藏大学学报（社会科学版）,2013,28(4):70-75. 被引量：2
6德吉梅朵.面向藏语语料库建设的数量词的分类研究[J].剑南文学（经典教苑）（下）,2013(1):228-229. 被引量：1
7才华.藏文组字部件的自动识别与字排序研究[J].西藏大学学报（社会科学版）,2014,29(5):81-86. 被引量：2
8王华,丁晓青.一种多字体印刷藏文字符的归一化方法[J].计算机应用研究,2004,21(6):41-43. 被引量：10
9王华,丁晓青.一种多字体印刷藏文字符识别方法[J].计算机工程,2004,30(13):18-20. 被引量：10
10林河水,程伟,曹晖,李文波,吴健,孙玉芳.一种符合ISO14651语义的藏文排序实现方法[J].中文信息学报,2004,18(5):36-41. 被引量：19

引证文献25

1才华.藏文组字部件的自动识别与字排序研究[J].西藏大学学报（社会科学版）,2014,29(5):81-86. 被引量：2
2程伟,林河水,吴健,孙玉芳.数据库管理系统多民族语言支持研究[J].中文信息学报,2006,20(2):94-100. 被引量：4
3江荻.藏文的拉丁字母转写方法——兼论藏文语料的计算机转写处理[J].民族语文,2006(1):45-53. 被引量：12
4洪锦玲,贾彦民,朱峰,吴健.藏文基本字符集的支持在OpenOffice.org中的实现方法[J].信息技术与标准化,2007(8):50-54. 被引量：2
5黄鹤鸣,契嘎.德熙嘉措.基于DUCET的藏文排序方法[J].中文信息学报,2008,22(4):109-113. 被引量：11
6高定国,欧珠.藏文编码字符集的优化研究[J].中文信息学报,2008,22(4):119-122. 被引量：2
7黄鹤鸣,契嘎.德熙嘉措.对DUCET中部分藏文字母排序码的商榷[J].计算机工程与应用,2008,44(29):241-244. 被引量：3
8陈小莹,李永宏,陈晨,陈琪,于洪志.基于大字符集编码的藏梵文的混合排序[J].西北民族大学学报（自然科学版）,2009,30(1):51-55. 被引量：1
9黄鹤鸣,达飞鹏.基于排序的现代藏文音节判定[J].计算机应用,2009,29(7):2003-2005. 被引量：13
10高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：17

二级引证文献82

1华林,陈燕,刘凌慧子.藏族记忆构建视域下藏族档案数字资源跨业界整合研究[J].西藏民族大学学报（哲学社会科学版）,2021,42(2):52-60. 被引量：11
2才智杰,才让卓玛,孙茂松.一种多基元联合训练的藏文词向量表示方法[J].中文信息学报,2020,34(5):44-49. 被引量：4
3多拉.藏语语义理解中功能性虚词研究[J].西藏大学学报（社会科学版）,2011,26(4):106-112. 被引量：4
4郭占龙,王文云,谭永清.WWW后台藏文信息库的应用实现[J].青海师范大学学报（自然科学版）,2006,22(4):38-40. 被引量：4
5张兴亮,芮建武,谢谦,程伟,吴健.藏文编码字符集的扩充集在Linux上的实现[J].中文信息学报,2007,21(2):122-128. 被引量：5
6洪锦玲,贾彦民,朱峰,吴健.藏文基本字符集的支持在OpenOffice.org中的实现方法[J].信息技术与标准化,2007(8):50-54. 被引量：2
7李永宏,杨阳蕊,柳春,于洪志.基于字词处理的藏文文本分析系统[J].语文学刊（高等教育版）,2009(1):82-84.
8黄鹤鸣,达飞鹏.基于排序的现代藏文音节判定[J].计算机应用,2009,29(7):2003-2005. 被引量：13
9王海洪,戴玉刚.消除重复藏文网页的完整解决方案[J].科技信息,2009(4):21-21.
10武光利,于洪志,柳春.藏文同元码与基本集相互转换的规则与实现[J].计算机工程与应用,2009,45(29):134-136. 被引量：1

1任同一.计算机排序[J].成飞情报,1990,0(3):28-32.
2江荻,周季文.论藏文的序性及排序方法[J].中文信息学报,2000,14(1):56-64. 被引量：34
3杨志贵.一种新颖的计算机排序分类合并法[J].电脑学习,1991(4):32-34.
4徐雪霞.体操比赛计算机排序自动化系统[J].武汉体育学院学报,2002,36(2):143-144. 被引量：1
5王子来,王兰成.论平面模型的计算机排样技术[J].计算机应用与软件,1992,9(6):42-46.
6李浚圣,周力,徐继镶.工件加工最优排序算法研究——相对优势递推法[J].计算机应用与软件,2005,22(1):109-111.
7李春艳,王俊梅.数据窗口数据通用组合排序组件的设计[J].红河学院学报,2009,7(5):48-52.
8CC—Link2015年首场技术应用研讨会在深圳成功举行[J].仪器仪表标准化与计量,2015,0(2).
9CC-Link 2015年首场技术应用研讨会在深圳成功举行[J].中国仪器仪表,2015(3).
10阿呆.口袋里的PDF切割机[J].电脑迷,2009(18):72-72.

计算机学报

2004年第4期

浏览历史

内容加载中请稍等...

书面藏语排序的数学模型及算法被引量：25

参考文献3

二级参考文献3

共引文献33

同被引文献163

引证文献25

二级引证文献82

相关作者

相关机构

相关主题

浏览历史

书面藏语排序的数学模型及算法 被引量：25

参考文献3

二级参考文献3

共引文献33

同被引文献163

引证文献25

二级引证文献82

相关作者

相关机构

相关主题

浏览历史

书面藏语排序的数学模型及算法被引量：25