期刊文献+
共找到829篇文章
< 1 2 42 >
每页显示 20 50 100
Markedness and UG in Chinese Children's Acquisition of One-word and Negative Sentences 被引量:1
1
作者 Yu Shanzhi Department of Foreign LanguagesHenan University Kadeng 475001P. R. China< sZyu@mail.henu.edu.cn>Zhang Xinhong Faculty Of English Language and Culture Guangdong University of Foreign Studies Guangzhou 510420P. R. China or < bbjohnson@ ]63.net > 《现代外语》 CSSCI 北大核心 1999年第4期379-381,共3页
Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednesso... Thepresentstudyisaninvestigationandanalysisoftherelationshipbetweenmarkednessandfirstlanguageacquisitionsequence,asshowninthecasesofone-wordandnegativesentences.Hereourobjectivesaretoargueforthepriorityofunmarkednessovermarkednessintheacquisitionsequ... 展开更多
关键词 MARKEDNESS UG ACQUISITION one-word sentencE negative sentence.
在线阅读 下载PDF
Next Words Prediction and Sentence Completion in Bangla Language Using GRU-Based RNN on N-Gram Language Model
2
作者 Afranul Hoque Busrat Jahan +3 位作者 Shaikat Chandra Paul Zinat Ara Zabu Rakhi Mondal Papeya Akter 《Journal of Data Analysis and Information Processing》 2023年第4期388-399,共12页
We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuab... We use a lot of devices in our daily life to communicate with others. In this modern world, people use email, Facebook, Twitter, and many other social network sites for exchanging information. People lose their valuable time misspelling and retyping, and some people are not happy to type large sentences because they face unnecessary words or grammatical issues. So, for this reason, word predictive systems help to exchange textual information more quickly, easier, and comfortably for all people. These systems predict the next most probable words and give users to choose of the needed word from these suggested words. Word prediction can help the writer by predicting the next word and helping complete the sentence correctly. This research aims to forecast the most suitable next word to complete a sentence for any given context. In this research, we have worked on the Bangla language. We have presented a process that can expect the next maximum probable and proper words and suggest a complete sentence using predicted words. In this research, GRU-based RNN has been used on the N-gram dataset to develop the proposed model. We collected a large dataset using multiple sources in the Bangla language and also compared it to the other approaches that have been used such as LSTM, and Naive Bayes. But this suggested approach provides excellent exactness than others. Here, the Unigram model provides 88.22%, Bi-gram model is 99.24%, Tri-gram model is 97.69%, and 4-gram and 5-gram models provide 99.43% and 99.78% on average accurateness. We think that our proposed method profound impression on Bangla search engines. 展开更多
关键词 Bangla Language words Prediction sentence Completion GRU RNN Corpus N-Gram
在线阅读 下载PDF
An Abstractive Summarization Technique with Variable Length Keywords as per Document Diversity 被引量:1
3
作者 Muhammad Yahya Saeed Muhammad Awais +4 位作者 Muhammad Younas Muhammad Arif Shah Atif Khan M.Irfan Uddin Marwan Mahmoud 《Computers, Materials & Continua》 SCIE EI 2021年第3期2409-2423,共15页
Text Summarization is an essential area in text mining,which has procedures for text extraction.In natural language processing,text summarization maps the documents to a representative set of descriptive words.Therefo... Text Summarization is an essential area in text mining,which has procedures for text extraction.In natural language processing,text summarization maps the documents to a representative set of descriptive words.Therefore,the objective of text extraction is to attain reduced expressive contents from the text documents.Text summarization has two main areas such as abstractive,and extractive summarization.Extractive text summarization has further two approaches,in which the first approach applies the sentence score algorithm,and the second approach follows the word embedding principles.All such text extractions have limitations in providing the basic theme of the underlying documents.In this paper,we have employed text summarization by TF-IDF with PageRank keywords,sentence score algorithm,and Word2Vec word embedding.The study compared these forms of the text summarizations with the actual text,by calculating cosine similarities.Furthermore,TF-IDF based PageRank keywords are extracted from the other two extractive summarizations.An intersection over these three types of TD-IDF keywords to generate the more representative set of keywords for each text document is performed.This technique generates variable-length keywords as per document diversity instead of selecting fixedlength keywords for each document.This form of abstractive summarization improves metadata similarity to the original text compared to all other forms of summarized text.It also solves the issue of deciding the number of representative keywords for a specific text document.To evaluate the technique,the study used a sample of more than eighteen hundred text documents.The abstractive summarization follows the principles of deep learning to create uniform similarity of extracted words with actual text and all other forms of text summarization.The proposed technique provides a stable measure of similarity as compared to existing forms of text summarization. 展开更多
关键词 METADATA page rank sentence score word2vec cosine similarity This
在线阅读 下载PDF
Research of Paraphrasing for Chinese Complex Sentences Based on Templates
4
作者 Zhongjian Wang Ling Wang 《Modern Electronic Technology》 2022年第1期38-42,共5页
Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural anal... Based on the paraphrasing of Chinese simple sentences,the complex sen­tence paraphrasing by using templates are studied.Through the classifica­tion of complex sentences,syntactic analysis and structural analysis,the proposed methods construct complex sentence paraphrasing templates that the associated words are as the core.The part of speech tagging is used in the calculation of the similarity between the paraphrasing sentences and the paraphrasing template.The joint complex sentence can be divided into parallel relationship,sequence relationship,selection relationship,progres­sive relationship,and interpretive relationship’s complex sentences.The subordinate complex sentence can be divided into transition relationship,conditional relationship,hypothesis relationship,causal relationship and objective relationship’s complex sentences.Joint complex sentence and subordinate complex sentence are divided to associated words.By using pretreated sentences,the preliminary experiment is carried out to decide the threshold between the paraphrasing sentence and the template.A small scale paraphrase experiment shows the method is availability,acquire the coverage rate of paraphrasing template 40.20%and the paraphrase correct rate 62.61%. 展开更多
关键词 Complex sentence Associated word Paraphrasing template
在线阅读 下载PDF
WordNet和词向量相结合的句子检索方法 被引量:3
5
作者 刘欣 席耀一 +1 位作者 王波 魏晗 《信息工程大学学报》 2017年第4期486-491,共6页
针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一... 针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一定程度上解决了查询项数据稀疏的问题;然后利用在大规模语料中训练神经网络语言模型获取的词向量对查询项和句子进行表示;最后引入WMD(word mover's distance)计算查询项与句子的语义相似度,从而利用语义信息进一步降低"词不匹配"问题带来的影响,将句子按相似度值从高到低排序作为句子检索结果。文章方法在TREC2003和TREC2004会议的项目中进行评测,MAP和R-Precision值相较于次优结果分别提高了13.29%和13.54%。 展开更多
关键词 wordNET 查询项扩展 词向量 语义相似度 句子检索
在线阅读 下载PDF
Product image sentence annotation based on kernel descriptors and tag-rank
6
作者 张红斌 姬东鸿 +2 位作者 尹兰 任亚峰 殷依 《Journal of Southeast University(English Edition)》 EI CAS 2016年第2期170-176,共7页
Dealing with issues such as too simple image features and word noise inference in product image sentence anmotation, a product image sentence annotation model focusing on image feature learning and key words summariza... Dealing with issues such as too simple image features and word noise inference in product image sentence anmotation, a product image sentence annotation model focusing on image feature learning and key words summarization is described. Three kernel descriptors such as gradient, shape, and color are extracted, respectively. Feature late-fusion is executed in turn by the multiple kernel learning model to obtain more discriminant image features. Absolute rank and relative rank of the tag-rank model are used to boost the key words' weights. A new word integration algorithm named word sequence blocks building (WSBB) is designed to create N-gram word sequences. Sentences are generated according to the N-gram word sequences and predefined templates. Experimental results show that both the BLEU-1 scores and BLEU-2 scores of the sentences are superior to those of the state-of-art baselines. 展开更多
关键词 product image sentence annotation kerneldescriptors tag-rank word sequence blocks building(WSBB) N-gram word sequences
在线阅读 下载PDF
基于SentencePiece的中医学分词模型建模研究 被引量:2
7
作者 刘双巧 周璐 +7 位作者 李彩艳 袁慧敏 张异卓 李昱达 刘锦钢 郑丰杰 孙燕 李宇航 《世界中医药》 CAS 2021年第6期981-985,990,共6页
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。... 目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。 展开更多
关键词 分词 中文分词 分词模型 无监督学习 无监督分词 sentencePiece
暂未订购
A Contrastive Study of Word Order in Chinese and English
8
作者 刘俊 《海外英语》 2012年第20期169-170,180,共3页
The present paper attempts to make a contrastive study on Chinese and English word order with a view of identifying the discrepancies and propose its significance to mutual translation.As to the research methodology,q... The present paper attempts to make a contrastive study on Chinese and English word order with a view of identifying the discrepancies and propose its significance to mutual translation.As to the research methodology,qualitative analysis and com parative analysis are adopted when the similarities and differences of the word order of English and Chinese are explained.It can be concluded that Chinese and English word order differs at the phrase level and sentence level:in terms of the discrepancies in phrase structure,they are mainly manifested in adverbial and attributive phrases;as to the discrepancies in sentence structure,they are reflected in simple,complex and special sentences. 展开更多
关键词 word order PHRASE SIMPLE sentences complex sentenc
在线阅读 下载PDF
对文求义九则
9
作者 杨琳 《长江学术》 2025年第3期106-113,共8页
“对文”指在对称的结构形式中,相对应的位置上运用意义相同相近或相关的词语的语言现象。根据对文的这一特点,可以借助已知词语来判定对应词语的未知含义,或从对应词语的多个已知词义中选取恰当的词义来理解文意。本文运用对文求义法... “对文”指在对称的结构形式中,相对应的位置上运用意义相同相近或相关的词语的语言现象。根据对文的这一特点,可以借助已知词语来判定对应词语的未知含义,或从对应词语的多个已知词义中选取恰当的词义来理解文意。本文运用对文求义法解证“空乏其身行、俛起、易精极虑、视、撩、拍、装胖学蠢、通俗、鼓鬣”等九则疑难词语,以见对文求义法在训诂中的价值。 展开更多
关键词 训诂方法 疑难词语 对文求义
在线阅读 下载PDF
汉语表达被动的语序手段和词汇手段
10
作者 王艳 储泽祥 《汉语学习》 北大核心 2025年第3期45-53,共9页
本文在类型学背景下重新思考汉语无标记被动句的争议问题。在考察有标记被动句和无标记被动句的过程中,汉语表达被动的句法手段包括OV语序和被动标记。OV语序是汉语表达被动的语序手段,可以独立表达被动意义。被动标记是汉语表达被动的... 本文在类型学背景下重新思考汉语无标记被动句的争议问题。在考察有标记被动句和无标记被动句的过程中,汉语表达被动的句法手段包括OV语序和被动标记。OV语序是汉语表达被动的语序手段,可以独立表达被动意义。被动标记是汉语表达被动的词汇手段,不能独立使用,必须与OV语序叠加使用。 展开更多
关键词 OV语序 被动标记 被动句 句法手段
原文传递
海外非母语儿童中文句子书写能力萌发研究
11
作者 吴登鹏 徐彩华 朱志平 《汉语学习》 北大核心 2025年第6期94-104,共11页
书面产出是非母语儿童汉语二语能力发展的核心难点,但现已有研究对其萌发期规律的探讨非常薄弱。本研究以中文书写能力萌发为研究目标,通过句子听写为核心任务,考查173名美国小学一至四年级汉语沉浸式项目儿童与102名新加坡小学一至四... 书面产出是非母语儿童汉语二语能力发展的核心难点,但现已有研究对其萌发期规律的探讨非常薄弱。本研究以中文书写能力萌发为研究目标,通过句子听写为核心任务,考查173名美国小学一至四年级汉语沉浸式项目儿童与102名新加坡小学一至四年级双语儿童的中文句子书写表现,探索词汇书写、书面语序在句子书写中的作用。结果发现:(1)两组儿童句子书写能力发展差异较大,美国儿童在二年级末出现首次快速提升,新加坡儿童在一年级末就超过美国四年级的水平,在三年级末进一步大幅提升;(2)总体上,美国儿童词汇书写发展略领先于句子书写,新加坡儿童则相反;(3)词汇书写对两类儿童句子书写均有显著预测力,书面语序不仅通过词汇书写的中介作用间接影响句子书写,且美国儿童的书面语序成绩还对句子书写有直接预测效应。 展开更多
关键词 非母语儿童 句子书写 书面语序 跨环境比较
原文传递
俄罗斯学生汉语陈述句停延习得实验研究
12
作者 邱雨晴 《文化创新比较研究》 2025年第19期36-40,共5页
该文基于语调格局的研究思路,对两名俄罗斯学生汉语陈述句语调的音长停延率的习得情况进行考察,并基于此做出相关数据图。通过将俄罗斯学生实验数据与汉语母语者音长停延率数据进行对比,得出俄罗斯学生习得汉语陈述句的特点。考察俄罗... 该文基于语调格局的研究思路,对两名俄罗斯学生汉语陈述句语调的音长停延率的习得情况进行考察,并基于此做出相关数据图。通过将俄罗斯学生实验数据与汉语母语者音长停延率数据进行对比,得出俄罗斯学生习得汉语陈述句的特点。考察俄罗斯汉语学习者说话的停延能力,为对外汉语教学服务。研究发现:俄罗斯学生对于韵律词边界前字音延长这一点习得较好,但各韵律词的音长模式不同,且音节延长位置不固定。学生朗读句子过程中出现了停延次数过多、停延位置不恰当等问题,句首普遍存在被停延现象。针对这些现象,笔者提出了一些针对性的建议,希望可以为汉语语音教学尽一份绵薄之力。 展开更多
关键词 停延率 陈述句 对外汉语教学 语音习得 汉语陈述 韵律词
原文传递
安阳方言的“哩”
13
作者 郭岩 《文化创新比较研究》 2025年第7期11-15,共5页
安阳方言中的“哩”是安阳方言中最典型的词语,与普通话和其他方言中的“哩”在用法上大有不同,但目前尚未形成系统的理论阐述。该文介绍了“哩”在安阳话中的发音、作为助词和语气词的使用情况,以及“哩”在句子中放置的位置。同时,通... 安阳方言中的“哩”是安阳方言中最典型的词语,与普通话和其他方言中的“哩”在用法上大有不同,但目前尚未形成系统的理论阐述。该文介绍了“哩”在安阳话中的发音、作为助词和语气词的使用情况,以及“哩”在句子中放置的位置。同时,通过与普通话、其他安阳方言语气词的对比分析,说明了“哩”在安阳方言中的独特性。语音上,“哩”在安阳方言中因弱化音节发音改变为[lei];语法上,“哩”在安阳方言中可以用作助词和语气词;在句子结构上,“哩”可以放在句中和句末帮助表达语义。通过研究,该文希望能够系统说明“哩”在安阳方言中的具体用法,为相关方言研究提供有益参考,为安阳方言保护作出贡献。 展开更多
关键词 安阳方言 助词 语气词 语法功能 句中位置
原文传递
基于清华汉语树库的复句关系词识别与分类研究 被引量:19
14
作者 李艳翠 孙静 +1 位作者 周国栋 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期118-124,共7页
根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词... 根据清华汉语树库的标注方法,利用规则从中提取复句关系词并标注其类别,然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征,进行复句关系词的识别和分类。实验结果表明,复句关系词判断准确率达95.7%,复句关系词类别判断F1值为77.2%。 展开更多
关键词 复句关系词 清华汉语树库 关系词识别 关系词分类
在线阅读 下载PDF
基于主题词权重和句子特征的自动文摘 被引量:17
15
作者 蒋昌金 彭宏 +1 位作者 陈建超 马千里 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期50-55,共6页
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的... 为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%. 展开更多
关键词 主题词 自动文摘 组合词 权重计算 句子特征
在线阅读 下载PDF
三个层面的中文文本主题自动提取研究 被引量:13
16
作者 韩客松 王永成 +1 位作者 沈洲 吴芳芳 《中文信息学报》 CSCD 北大核心 2001年第4期20-27,共8页
为适应Internet时代和大规模文献处理的需要 ,以中文文本为处理对象 ,研究了从主题词、主题概念和主题句三个不同层面自动抽取文本主题的方法 ,着重讨论了加权体系和一些经验值的获取方法。对新闻类文献做了实验 。
关键词 主题词 主题概念 主题句 加权 中文文本 主题提取 文本处理
在线阅读 下载PDF
基于转折句式的文本情感倾向性分析 被引量:17
17
作者 邸鹏 李爱萍 段利国 《计算机工程与设计》 CSCD 北大核心 2014年第12期4289-4295,共7页
在文本的情感倾向性研究中缺乏对多种情感共现的转折句式的有效分析,为此提出一种专门对转折句式进行有效情感倾向性分析的方法。充分分析汉语中转折句式的结构特点,通过已有资源构建中文情感词典、转折词表、否定词表,依据转折句式中... 在文本的情感倾向性研究中缺乏对多种情感共现的转折句式的有效分析,为此提出一种专门对转折句式进行有效情感倾向性分析的方法。充分分析汉语中转折句式的结构特点,通过已有资源构建中文情感词典、转折词表、否定词表,依据转折句式中转折词、否定词、情感词的组合规律提出用于进行情感分析的启发式规则。在公开语料库的实验中,该方法能更好地对转折句式进行情感倾向性分析,将此规则融入到传统的朴素贝叶斯情感分类模型后,能获得更高的情感分析精度。 展开更多
关键词 情感倾向性 转折句式 情感词 转折词 否定词
在线阅读 下载PDF
基于汉语情感词表的句子情感倾向分类研究 被引量:34
18
作者 王素格 杨安娜 李德玉 《计算机工程与应用》 CSCD 北大核心 2009年第24期153-155,161,共4页
提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综... 提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综合F值为78.62%,若加入了否定短语语言粒度后,句子情感分类的综合F值提高了4.14%。 展开更多
关键词 情感词表 加权线性组合 句子情感分类
在线阅读 下载PDF
汉语复句关系词自动识别中规则的约束条件研究 被引量:7
19
作者 胡金柱 舒江波 +3 位作者 胡泉 杨进才 谢芳 李源 《语言文字应用》 CSSCI 北大核心 2015年第1期82-89,共8页
关系词在汉语复句中具有重要的作用,是汉语语法、语义的重要研究内容,在信息处理领域具有很高的研究价值,但复句关系词的计算机自动识别是一个非常困难的问题。本文从中文信息处理角度,研究"基于规则的关系词自动识别"系统中... 关系词在汉语复句中具有重要的作用,是汉语语法、语义的重要研究内容,在信息处理领域具有很高的研究价值,但复句关系词的计算机自动识别是一个非常困难的问题。本文从中文信息处理角度,研究"基于规则的关系词自动识别"系统中规则的约束条件,为进一步研究计算机自动识别复句的方法以及自动识别汉语句子和篇章的方法奠定基础。 展开更多
关键词 汉语复句 复句关系词 规则的约束条件 自动识别 中文信息处理
原文传递
基于多特征融合的句子语义相似度计算 被引量:18
20
作者 赵臻 吴宁 宋盼盼 《计算机工程》 CAS CSCD 2012年第1期171-173,共3页
传统的句子相似度计算方法只关注句子的某个特征,导致召回率和准确率的不均衡。针对该问题,提出一种基于多特征的句子相似度计算方法(MFS)。该方法加入包含词性和位置信息的词权重,并综合考虑词的语义和句子结构。实验结果表明,与其他... 传统的句子相似度计算方法只关注句子的某个特征,导致召回率和准确率的不均衡。针对该问题,提出一种基于多特征的句子相似度计算方法(MFS)。该方法加入包含词性和位置信息的词权重,并综合考虑词的语义和句子结构。实验结果表明,与其他方法相比,MFS方法的F1值较高。在基于实例的问答系统中,使用MFS方法得到的MRR值也较高。 展开更多
关键词 句子相似度 多特征 词权重 知网 问答系统
在线阅读 下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部