期刊文献+
共找到846篇文章
< 1 2 43 >
每页显示 20 50 100
汉语后缀与英语Suffix对比研究
1
作者 郑国锋 《华东理工大学学报(社会科学版)》 2002年第1期103-108,共6页
本文旨在通过对汉英语词缀与Suffix的对比,澄清关于这两种语言成分的一些认识。文章首先界定了汉语后缀与英语Suffix的各自特征,继而从语法的刚性与柔性、语义型语言与形态型语言的特点、语言的发展历史等方面出发,进行了多侧面的论证... 本文旨在通过对汉英语词缀与Suffix的对比,澄清关于这两种语言成分的一些认识。文章首先界定了汉语后缀与英语Suffix的各自特征,继而从语法的刚性与柔性、语义型语言与形态型语言的特点、语言的发展历史等方面出发,进行了多侧面的论证。文章认为汉语后缀与英语Suffix有着本质区别。 展开更多
关键词 后缀 suffix
在线阅读 下载PDF
A Chinese Web Page Clustering Algorithm Based on the Suffix Tree 被引量:4
2
作者 YANGJian-wu 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期817-822,共6页
In this paper, an improved algorithm, named STC-I, is proposed for Chinese Web page clustering based on Chinese language characteristics, which adopts a new unit choice principle and a novel suffix tree construction p... In this paper, an improved algorithm, named STC-I, is proposed for Chinese Web page clustering based on Chinese language characteristics, which adopts a new unit choice principle and a novel suffix tree construction policy. The experimental results show that the new algorithm keeps advantages of STC, and is better than STC in precision and speed when they are used to cluster Chinese Web page. Key words clustering - suffix tree - Web mining CLC number TP 311 Foundation item: Supported by the National Information Industry Development Foundation of ChinaBiography: YANG Jian-wu (1973-), male, Ph. D, research direction: information retrieval and text mining. 展开更多
关键词 CLUSTERING suffix tree Web mining
在线阅读 下载PDF
On-line linear time construction of sequential binary suffix trees
3
作者 Lai Huoyao Liu Gongshen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第5期1104-1110,共7页
Suffix trees are the key data structure for text string matching, and are used in wide application areas such as bioinformatics and data compression. Ukkonen algorithm is deeply investigated and a new algorithm, which... Suffix trees are the key data structure for text string matching, and are used in wide application areas such as bioinformatics and data compression. Ukkonen algorithm is deeply investigated and a new algorithm, which decreases the number of memory operations in construction and keeps the result tree sequential, is proposed. The experiment result shows that both the construction and the matching procedure are more efficient than Ukkonen algorithm. 展开更多
关键词 suffix tree SEQUENTIAL linear time construction.
在线阅读 下载PDF
SUFFIX TREE文件生成器
4
作者 Aleksejs Udris 刘岩 《电脑知识与技术》 2016年第5期77-79,共3页
后缀树是一个功能强大的数据结构,可以用于计算机科学执行字符串后处理操作。使用树结构的一个挑战是,随着树的生长、树的结构变得难以想象。该文的项目就是针对后缀树的这一问题,通过使用三维空间来改善树的呈现效果。项目的目的将允... 后缀树是一个功能强大的数据结构,可以用于计算机科学执行字符串后处理操作。使用树结构的一个挑战是,随着树的生长、树的结构变得难以想象。该文的项目就是针对后缀树的这一问题,通过使用三维空间来改善树的呈现效果。项目的目的将允许用户在没有重叠显示的情况下,大幅增加从屏幕上获得的数据量。这个项目将着眼于渲染定向图,如在双曲空间的后缀树。 展开更多
关键词 后缀树 双曲空间 定向图 数据结构 suffix TREE 计算机科学 生物学数据 可视化工具 结构体积 测试操作
在线阅读 下载PDF
Fault Tolerant Suffix Trees
5
作者 Iftikhar Ahmad Syed Zulfiqar Ali Shah +5 位作者 Ambreen Shahnaz Sadeeq Jan Salma Noor Wajeeha Khalil Fazal Qudus Khan Muhammad Iftikhar Khan 《Computers, Materials & Continua》 SCIE EI 2021年第1期157-164,共8页
Classical algorithms and data structures assume that the underlying memory is reliable,and the data remain safe during or after processing.However,the assumption is perilous as several studies have shown that large an... Classical algorithms and data structures assume that the underlying memory is reliable,and the data remain safe during or after processing.However,the assumption is perilous as several studies have shown that large and inexpensive memories are vulnerable to bit flips.Thus,the correctness of output of a classical algorithm can be threatened by a few memory faults.Fault tolerant data structures and resilient algorithms are developed to tolerate a limited number of faults and provide a correct output based on the uncorrupted part of the data.Suffix tree is one of the important data structures that has widespread applications including substring search,super string problem and data compression.The fault tolerant version of the suffix tree presented in the literature uses complex techniques of encodable and decodable error-correcting codes,blocked data structures and fault-resistant tries.In this work,we use the natural approach of data replication to develop a fault tolerant suffix tree based on the faulty memory random access machine model.The proposed data structure stores copies of the indices to sustain memory faults injected by an adversary.We develop a resilient version of the Ukkonen’s algorithm for constructing the fault tolerant suffix tree and derive an upper bound on the number of corrupt suffixes. 展开更多
关键词 Resilient data structures fault tolerant data structures suffix tree
在线阅读 下载PDF
The Law of the Iterated Logarithm for the Sums of φ-Mixing Sequences with Duple Suffixes
6
作者 杨善朝 《Chinese Quarterly Journal of Mathematics》 CSCD 1992年第4期68-71,共4页
Hu Shuhe gets a sufficient condition on the law of the iterated logarithm for the sums of φ-mixing sequences with duple suffixes. This paper greatly improves his condition.
关键词 φ-Mixing Sequences Sum of Double suffix Sequences Law of Iterated Logarithm
在线阅读 下载PDF
An Analysis of the Relation Between Phase,Situation and Aspect Suffix“LE”in Chinese
7
作者 LIN Ru 《Journal of Literature and Art Studies》 2021年第4期226-231,共6页
In the research on the Chinese temporal system,Chen(1988)proposed the ternary structure of Chinese temporal system.Based on the ternary structure of the Chinese temporal system,many researches have focused on discussi... In the research on the Chinese temporal system,Chen(1988)proposed the ternary structure of Chinese temporal system.Based on the ternary structure of the Chinese temporal system,many researches have focused on discussing Chinese aspect system.Compared with the research on aspect,there are fewer studies on Chinese verbal situations,such as Ma(1981),Deng(1985),Dai(1997),etc.,which are all based on Vendler’s(1967)four categories of verbal situations.And compared with verbal situation,there are fewer studies on phase.Most researchers believe that phase and verbal situations are the same concept.However,this article believes that in the study of Chinese temporal system,we should first distinguish between phase and verbal situations,and then compare with aspect.Based on the distinction between phase and verbal situations,this article combines the situation and verbal aspect suffix“LE”,which is also an aspect marker,and tries to sum up the relationship between the situation and“LE”. 展开更多
关键词 PHASE SITUATION ASPECT verbal aspect suffix“LE”
在线阅读 下载PDF
Using Suffixes in Chinese and English
8
作者 潘昕玮 《海外英语》 2021年第16期295-296,共2页
In the higher vocational college,most students encounter great difficulties in dealing with English suffixes.This paper analyses the differences between English and Chinese morphology,especially suffixes that denote t... In the higher vocational college,most students encounter great difficulties in dealing with English suffixes.This paper analyses the differences between English and Chinese morphology,especially suffixes that denote tenses,numbers and comparisons and offer recommendations for English as a second language(ESL)classroom. 展开更多
关键词 MORPHOLOGY suffixes ENGLISH vocational college
在线阅读 下载PDF
辽宁岫岩方言子尾的语音形式及子尾词的分类研究
9
作者 原新梅 董庆怡 《辽宁师范大学学报(社会科学版)》 2025年第2期114-121,共8页
汉语方言中子尾语音形式丰富,子尾词的分类也有不同。辽宁岫岩方言中子尾的语音形式特殊且单一,为[tə^(0)]。子尾的构词形式根据音节特征分为“单音节+子”“双音节+子”“多音节+子”三种。岫岩方言的子尾词大部分为名词性子尾词,通过... 汉语方言中子尾语音形式丰富,子尾词的分类也有不同。辽宁岫岩方言中子尾的语音形式特殊且单一,为[tə^(0)]。子尾的构词形式根据音节特征分为“单音节+子”“双音节+子”“多音节+子”三种。岫岩方言的子尾词大部分为名词性子尾词,通过语义分类可以发现,其具有标示类属、名词化、具体化、口语化、不对称性、多义性、指“小”义、色彩义的语义特征。通过对辽宁岫岩方言子尾和子尾词的语音形式、构词形式及语义分类的描写和分析,为辽宁方言研究及子尾和子尾词研究提供一定参考。 展开更多
关键词 胶辽官话 岫岩方言 子尾语音形式 子尾词 分类研究
在线阅读 下载PDF
甘谷方言“儿”尾的发音及语法功能考察
10
作者 王可峰 《天水师范学院学报》 2025年第4期57-64,共8页
甘谷方言属西北方言秦陇片,其“儿”尾现象在发音上与普通话及多数北方方言的“儿化韵”有显著不同,呈现独立成音节的特性,形成了“儿而不化”的独特语音现象,属于拼合型韵尾。“儿”音在甘谷方言中可作实语素或虚语素,作虚语素时出现... 甘谷方言属西北方言秦陇片,其“儿”尾现象在发音上与普通话及多数北方方言的“儿化韵”有显著不同,呈现独立成音节的特性,形成了“儿而不化”的独特语音现象,属于拼合型韵尾。“儿”音在甘谷方言中可作实语素或虚语素,作虚语素时出现在词尾,自成音节,发音有[zι]、[ε]、[kə]三类,其声调往往受前一音节调值或地域、方言使用者年龄大小等因素影响,灵活可变,但始终保持清晰的语音边界。“儿”尾词构式丰富,三音节构词与重叠音节构词占比突出,句法功能多样,韵律节奏舒缓,语气亲切,是甘谷方言的典型特征。 展开更多
关键词 甘谷方言 “儿”尾 语音 语法功能
在线阅读 下载PDF
发现和学习不可复位动态系统的预测状态表示的一种新算法 被引量:2
11
作者 刘云龙 李人厚 《电子学报》 EI CAS CSCD 北大核心 2009年第1期126-131,共6页
提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,... 提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,解决了在不可复位动态系统中,经历下检验发生的概率难以获取问题,进而发现和学习不可复位动态系统的预测状态表示.实验结果表明,本文算法获得的系统的预测状态表示在预测精度上明显优于suffix-history算法,验证了所提算法的有效性. 展开更多
关键词 预测状态表示 不可复位动态系统 LANDMARK suffix—history算法
在线阅读 下载PDF
陕西汉中方言后缀“家伙”表意外用法的来源与演变——兼论现代汉语感叹词“好家伙”的来源
12
作者 郭鑫 《陕西理工大学学报(社会科学版)》 2025年第6期102-108,共7页
陕西汉中方言中“家伙”的表意外用法源于感叹句语境中发生的重新分析,语义焦点发生转移,使“家伙”一词失去了实词义演化为后缀。“形容词/能愿动词短语/心理动词短语+家伙”结构源于对“程度副词+性质形容词+家伙”结构的回溯推理。... 陕西汉中方言中“家伙”的表意外用法源于感叹句语境中发生的重新分析,语义焦点发生转移,使“家伙”一词失去了实词义演化为后缀。“形容词/能愿动词短语/心理动词短语+家伙”结构源于对“程度副词+性质形容词+家伙”结构的回溯推理。“程度副词+性质形容词+家伙”结构与现代汉语感叹词“好家伙”之间也存在演变关系,现代汉语中“好家伙”一词正是源于“好+形容词+家伙”的结构省缩。发生省缩的动因是在“好+形容词+家伙”感叹结构中,评注性副词“好”和词缀“家伙”作为结构中的常量能够稳定地表达感叹(意外)的语用义,这一特征为“好家伙”词汇化的产生提供了可能。 展开更多
关键词 汉中方言 后缀“家伙” “好家伙” 结构省缩
在线阅读 下载PDF
湖南汝城话后缀[t■i^(21)]语音修辞考察
13
作者 曹运波 《梧州学院学报》 2025年第3期19-24,共6页
该文立足于邢福义先生的“小三角”理论,以语表形式为主要研究对象,充分分析语里意义和语用价值,深入考察汝城话稳定性极强的后缀[t■i^(21)]的语音修辞功能。汝城话后缀[t■i^(21)]通常成词为“何[t■i^(21)]”“贡[t■i^(21)]”分别... 该文立足于邢福义先生的“小三角”理论,以语表形式为主要研究对象,充分分析语里意义和语用价值,深入考察汝城话稳定性极强的后缀[t■i^(21)]的语音修辞功能。汝城话后缀[t■i^(21)]通常成词为“何[t■i^(21)]”“贡[t■i^(21)]”分别表示“为什么”“怎么样”和“这样”“本来”的含义,通常用作形容词或副词,表达一种不耐烦的情绪,具有显著的节奏感、强化了语音象似性、轻重音的起伏美感等语音修辞功能,展现了典型的地域文化特征。 展开更多
关键词 汝城话 “小三角”理论 后缀[t■i^(21)] 语音修辞
在线阅读 下载PDF
再论藏文再后加字-S的功能
14
作者 斯曲次仁 《青海民族大学学报(藏文版)》 2025年第3期131-143,共13页
藏文的两部奠基之作《三十颂》与《音势论》中均未涉及藏文再后加字的理论,这一缺失导致历代学者对其进行注释与注疏时,争议不断,众说纷纭。该文对历代学者关于再后加字的观点加以汇总,认为古藏语中复韵尾是发音的,若不发音藏文无需如... 藏文的两部奠基之作《三十颂》与《音势论》中均未涉及藏文再后加字的理论,这一缺失导致历代学者对其进行注释与注疏时,争议不断,众说纷纭。该文对历代学者关于再后加字的观点加以汇总,认为古藏语中复韵尾是发音的,若不发音藏文无需如此拼写形式。但目前的文献资料来看,藏文再后加字理论及提出用法最早可以追溯到公元11世纪俄·洛丹希饶所著的《常用正在集要》。后来在此基础上进行了继承与拓展,不断进行了完善。藏语复尾脱落的情形方面,公元9世纪时,卫藏方言中复韵尾“-d”于口语读音里开始弱化并脱落,至第二次厘定时被简化。复韵尾“-d”脱落的同时,“-s”的读音也出现了弱化和不稳定的态势,这可以通过《唐蕃会盟碑》《常用正在集要》等可靠的文献加以验证。然而近些年来,不少学者依据元代史料里藏语人名和地名中复尾-s的音译情况,推测卫藏方言复韵尾脱落时间偏晚。但该文作者认为,元代史料里人名和地名中复尾-s的音译并非是依据当时卫藏方言口语翻译而来,而是依据《文字读法启蒙》所呈现的书面语拼读模式来对音翻译。现代藏语的三大方言体系里,复尾“-s”基本已消失,但是在书面语范畴内仍然发挥着极为重要的作用。它在区分词类与时态变化层面能够起到有效的分辨作用,在彰显程度词和敬语词义方面具备独特的表意功能,在遵循同位后缀组合等规则方面也展现出了极为显著的语法功能特性。 展开更多
关键词 再后加字-s 语音脱落 语法功能
在线阅读 下载PDF
SuffIndex——一种基于后缀树的XML索引结构 被引量:7
15
作者 包小源 宋再生 +2 位作者 唐世渭 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1793-1801,共9页
针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 S... 针对形如∥element1/element2 /… /elementm 的查询 ,提出了一种基于后缀树 (suffixtree)的XML索引结构SuffIndex SuffIndex的构造通过只对OEM数据树遍历一次以及在SuffIndex中引入后缀链 (Sufflink)的方法 ,从而达到较低的构造代价 SuffIndex中所有结点利用Hash表保存到其所有子结点的指针 ,最终使查询∥element1/element2 /… /elementm 的处理代价为O(m) 展开更多
关键词 后缀树 XML 索引
在线阅读 下载PDF
一种基于后缀数组的无词典分词方法 被引量:14
16
作者 张长利 赫枫龄 左万利 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2004年第4期548-553,共6页
提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要... 提出一种基于后缀数组的无词典分词算法.该算法通过后缀数组和利用散列表获得汉字的结合模式,通过置信度筛选词.实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词.适用于对词条频度敏感、对计算速度要求高的中文信息处理. 展开更多
关键词 无词典分词 数组 文档 散列表 计算速度 算法 中文信息处理 法能 频度 实验
在线阅读 下载PDF
一种改进的基于广义后缀树的文本聚类算法 被引量:7
17
作者 杜红斌 夏克文 +1 位作者 刘南平 吴涛 《信息与控制》 CSCD 北大核心 2009年第3期331-336,共6页
分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,... 分析了基本STC算法存在的三个缺点,即不能有效处理包含文本数目差距较大但具有包含关系的节点,不能有效处理包含文本相似但主题不同的节点,缺乏有效的类别标识提取算法。针对以上问题,在综合考虑主题相似性以及文本包含相似性的基础上,给出了改进的用于基类合并的相似度公式,并提出基于信息增益的类别标识提取算法。为了进一步提高聚类效率,给出了一种简单有效的用于基类选择的测度,用来排除一些无意义的广义后缀树节点。实验结果表明,所提算法不仅可以有效提高STC算法的聚类准确度,而且可以对聚类结果进行有效的类别标识。 展开更多
关键词 文本聚类 WEB挖掘 广义后缀树 后缀树聚类(STC)
在线阅读 下载PDF
中文微博实体链接研究 被引量:12
18
作者 朱敏 贾真 +3 位作者 左玲 吴安峻 陈方正 柏玉 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期73-78,共6页
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用... 针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法,提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF中文微博实体链接评测任务中正确结果的准确率为0.8838,在10个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。 展开更多
关键词 微博实体链接 改进的拼音编辑距离 后缀词表匹配法 实体消歧
在线阅读 下载PDF
全文索引技术时空效率分析 被引量:17
19
作者 刘小珠 彭智勇 《软件学报》 EI CSCD 北大核心 2009年第7期1768-1784,共17页
全文索引技术(full-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现技术的不同,将其分为三大类:索引技术、压缩与索引混合技术以及自索引技术(self-index technique).从... 全文索引技术(full-text index technique)作为提高全文检索时空效率的有效方式之一,近年来得到了广泛而深入的研究.根据全文索引实现技术的不同,将其分为三大类:索引技术、压缩与索引混合技术以及自索引技术(self-index technique).从上述分类角度综述了全文索引时空效率方法中具有代表性的一些方法和技术:倒排文件、签名文件、后缀树与后缀数组、基于这3种索引的压缩技术、基于倒排文件的自索引与基于后缀数组的自索引的基本原理、所面临的问题及进展,并对这些技术的时空性能进行了详细的分析和比较,分析了各种技术的适应环境及优劣.最后总结了上述技术的特点,指出了存在的问题以及未来的研究方向. 展开更多
关键词 倒排文件 签名文件 后缀树 后缀数组 自索引 压缩 时空效率
在线阅读 下载PDF
一种时间复杂度最优的精确串匹配算法 被引量:25
20
作者 贺龙涛 方滨兴 余翔湛 《软件学报》 EI CSCD 北大核心 2005年第5期676-683,共8页
现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地... 现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m?1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(logσm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用. 展开更多
关键词 后缀自动机 有限状态自动机 LDM算法 串匹配 复杂度分析
在线阅读 下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部