期刊文献+
共找到337篇文章
< 1 2 17 >
每页显示 20 50 100
儿童知识图谱的构建与应用 被引量:2
1
作者 王晓玉 张力 《贵州师范学院学报》 2025年第6期29-35,共7页
儿童知识图谱将碎片化的知识转化为结构化的语义网络,旨在为安全、智能且符合儿童认知发展的对话系统提供支持。首先用基于本体的语义网理论对知识进行抽象,建立基于“知识={概念,属性,关系,约束}”KG框架模型;其次参考Hownet、同义词... 儿童知识图谱将碎片化的知识转化为结构化的语义网络,旨在为安全、智能且符合儿童认知发展的对话系统提供支持。首先用基于本体的语义网理论对知识进行抽象,建立基于“知识={概念,属性,关系,约束}”KG框架模型;其次参考Hownet、同义词词林、CSC中文词库中的层级分类体系,制定适合儿童认知系统的KG体系,同时依据四元组模型建立各概念点相关的属性、关系及约束;然后用半自动方法对儿童语料进行知识抽取,并整合同义词、扩充知识图谱内容;最后以知识查询及推理、对话话题泛化、理解应答、词义消歧为例说明了儿童知识图谱的具体使用场景。 展开更多
关键词 知识图谱 儿童对话 人工智能 PROTÉGÉ
在线阅读 下载PDF
大语言模型模仿个人言语风格能力评估——以“文心一言”为例
2
作者 罗子翀 欧阳国亮 《辽宁工业大学学报(社会科学版)》 2025年第2期47-50,共4页
大语言模型具备模仿个人言语风格创作文本的功能。为探索模仿生成的文本和被模仿文本在言语风格上是否有明显差异,进而评价其模仿能力,首先选定国内最常用的“文心一言”大语言模型作为工具,令其模仿鲁迅和朱自清文章风格分别创作若干文... 大语言模型具备模仿个人言语风格创作文本的功能。为探索模仿生成的文本和被模仿文本在言语风格上是否有明显差异,进而评价其模仿能力,首先选定国内最常用的“文心一言”大语言模型作为工具,令其模仿鲁迅和朱自清文章风格分别创作若干文本,然后使用“汉语助研”软件对原文及模仿生成文本进行言语风格量化统计,得到25个维度的数据,最后使用社会科学统计软件对数据进行描述统计和曼-惠特尼秩和检验,以揭示模仿生成文本与原文在言语风格上的差异性。研究发现,“文心一言”模仿生成文本相较原文在言语风格上差异较大。 展开更多
关键词 大语言模型 言语风格 数理统计 差异性分析
在线阅读 下载PDF
基于改进图像多标签分类的古籍异体字部件识别研究
3
作者 郑澄璐 王昊 +1 位作者 孟序阳 杨思敏 《数字图书馆论坛》 2025年第10期12-22,共11页
针对古籍异体字多为图像存储,无法直接数字化检索的问题,本研究基于多标签分类的古籍异体字识别方法,构建ECA-HFF-DTA模型,包括增强型通道注意力(ECA)模块、多尺度特征融合分类头(HFFHead)和动态阈值调整(DTA)机制3个模块,自动识别其构... 针对古籍异体字多为图像存储,无法直接数字化检索的问题,本研究基于多标签分类的古籍异体字识别方法,构建ECA-HFF-DTA模型,包括增强型通道注意力(ECA)模块、多尺度特征融合分类头(HFFHead)和动态阈值调整(DTA)机制3个模块,自动识别其构成部件并生成多标签分类结果。实验表明,模型在独立测试集上的F1值达到0.5783,较原始模型提升显著,可以实现基于部件查询异体字的应用功能。但模型对复杂多嵌套结构异体字的识别效果仍有待提高。ECA-HFF-DTA模型提升了古籍异体字部件识别效果,为大规模古籍文献异体字的智能化整理与检索提供思路。 展开更多
关键词 古籍 异体字识别 多标签分类
在线阅读 下载PDF
基于数据挖掘的技术机会发现模型研究 被引量:18
4
作者 任智军 乔晓东 +1 位作者 徐硕 韩红旗 《情报杂志》 CSSCI 北大核心 2015年第6期174-177,190,共5页
海量信息分析及基于分析结果得出相应的结论是一项非常重要的工作,该工作需要投入大量的时间和精力。以特征选择和决策的技术机会发现(TOD)模型,进行科学与信息技术领域的数据信息分析及未来预测。最后,对比Gartner 2014新兴技术预测,... 海量信息分析及基于分析结果得出相应的结论是一项非常重要的工作,该工作需要投入大量的时间和精力。以特征选择和决策的技术机会发现(TOD)模型,进行科学与信息技术领域的数据信息分析及未来预测。最后,对比Gartner 2014新兴技术预测,实验结果显示,基于数据挖掘的技术机会发现模型的分析及预测结果是有效的。 展开更多
关键词 技术机会发现 数据挖掘 技术预测 技术生命周期 技术趋势预测 特征选择
在线阅读 下载PDF
基于独有属性特征的情态与语境互动关系数据挖掘研究 被引量:16
5
作者 于建平 付继林 +2 位作者 白塔娜 李少辉 洪文学 《燕山大学学报》 CAS 北大核心 2019年第5期462-470,共9页
情态是一个复杂语义系统,其语义不确定性给其词义识别带来很大困难。语境与情态互动并对情态动词的词义有很大的限制作用,因此,揭示情态与语境互动限制关系对自然语言处理、机器翻译和智能语义识别特征优选研究都具有重要意义。本文基... 情态是一个复杂语义系统,其语义不确定性给其词义识别带来很大困难。语境与情态互动并对情态动词的词义有很大的限制作用,因此,揭示情态与语境互动限制关系对自然语言处理、机器翻译和智能语义识别特征优选研究都具有重要意义。本文基于形式概念分析理论和独有属性特征计算方法,通过数据挖掘发现情态动词词义与语境特征的互动关系,以及语境特征对情态动词词义的限制作用等知识。以英语情态动词must为目标词,针对其主要词义,从语料库中抽取150个样本例句作为对象,分别从must出现的语境中提取了32个特征,包括语义、句法、语用和话题特征作为属性,建立了表达must不同词义对象与其所具有的属性特征之间关系的形式背景。采用独有属性特征计算方法提取了must词义分类规则。通过对比分析其不同词义分类规则,发现了must与不同语境特征的互动限制关系。研究结果为自然语言处理和智能语义识别特征选择研究提供了有价值的依据。 展开更多
关键词 情态动词 语境特征 互动关系 独有属性特征 数据挖掘
在线阅读 下载PDF
汉语书面语体庄雅度的自动测量 被引量:48
6
作者 冯胜利 王洁 黄梅 《语言科学》 CSSCI 2008年第2期113-126,共14页
文章以汉语书面语体理论"韵律语法"为基础,首先介绍了汉语书面语体的庄雅特征,如嵌偶词、合偶词、书面语句型等;其次给出了庄雅特征的量化方法及庄雅度自动测量的方法;再次通过HSK(高等)考试作文的语料验证了庄雅度计算结果... 文章以汉语书面语体理论"韵律语法"为基础,首先介绍了汉语书面语体的庄雅特征,如嵌偶词、合偶词、书面语句型等;其次给出了庄雅特征的量化方法及庄雅度自动测量的方法;再次通过HSK(高等)考试作文的语料验证了庄雅度计算结果的可靠性;最后讨论了庄雅度自动测量技术的应用领域并指出其现实及潜在意义之所在。 展开更多
关键词 书面正式语体 韵律语法 庄雅特征 庄雅度测量
在线阅读 下载PDF
计量语言学的现状、理论与方法 被引量:55
7
作者 刘海涛 黄伟 《浙江大学学报(人文社会科学版)》 CSSCI 北大核心 2012年第2期178-192,共15页
计量语言学以真实语言交际活动中呈现的各种语言现象、语言结构、结构属性以及它们之间的相互关系作为研究对象,通过概率论、随机过程、微分与微分方程、函数论等数学的定量方法对其进行精确的测量、观察、模拟、建模和解释,寻找语言现... 计量语言学以真实语言交际活动中呈现的各种语言现象、语言结构、结构属性以及它们之间的相互关系作为研究对象,通过概率论、随机过程、微分与微分方程、函数论等数学的定量方法对其进行精确的测量、观察、模拟、建模和解释,寻找语言现象背后的数理规律,揭示各种语言现象形成的内在原因,探索语言系统的自适应机制和语言演化的动因。对计量语言学现状、理论与方法进行分析,厘清该学科进一步发展的走向,旨在推动中国语言学的国际化与语言学研究的科学化水平。 展开更多
关键词 计量语言学 汉语 语言定律 ZIPF 数理语言学
在线阅读 下载PDF
甲骨文轮廓字形生成技术研究与通用甲骨文字库的建设 被引量:14
8
作者 马小虎 杨亦鸣 +1 位作者 黄文帆 酆格斐 《语言文字应用》 CSSCI 北大核心 2004年第3期105-111,共7页
甲骨文是我国迄今发现的最早的一种成熟文字系统 ,目前对甲骨文进行计算机处理的研究还远远不能满足实际的需要。本文就甲骨文字形的特点 ,提出通用甲骨文字库建设的设想 ,并根据字库建设的需要设计出甲骨文字形处理系统。
关键词 甲骨文轮廓字形 通用甲骨文字库 字形生成系统
原文传递
中文信息处理60年 被引量:17
9
作者 宗成庆 曹右琦 俞士汶 《语言文字应用》 CSSCI 北大核心 2009年第4期53-61,共9页
本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和... 本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和未来发展的目标给予粗略的展望。 展开更多
关键词 中文信息处理 自然语言处理 自然语言理解 计算语言学
原文传递
唐宋诗之计算机辅助深层研究 被引量:24
10
作者 胡俊峰 俞士汶 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第5期727-733,共7页
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗... 介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗文进行词语切分的基础上 ,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外 ,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能 。 展开更多
关键词 语料库语言学 未登录词发现 自动注音 唐宋诗计算机辅助研究系统 计算语言学 汉语信息处理
在线阅读 下载PDF
语料库技术及其应用 被引量:52
11
作者 常宝宝 俞士汶 《外语研究》 CSSCI 北大核心 2009年第5期43-51,共9页
现代意义上的语料库最早出现于20世纪60年代,40多年来,发展迅速,不但规模越来越大,而且加工深度越来越深,语料库方法在语言研究和计算语言学研究领域发挥了重要作用。本文首先概要介绍了语料库的概念、发展和应用,然后介绍了北京大学的... 现代意义上的语料库最早出现于20世纪60年代,40多年来,发展迅速,不但规模越来越大,而且加工深度越来越深,语料库方法在语言研究和计算语言学研究领域发挥了重要作用。本文首先概要介绍了语料库的概念、发展和应用,然后介绍了北京大学的现代汉语基本标注语料库和汉英双语平行语料库,最后介绍了北京大学计算语言学所开发的基于语料库的双语词典编纂平台,重点介绍了其中的词汇分析技术。 展开更多
关键词 语料库 汉语语料库 汉英平行语料库 词典编纂平台
在线阅读 下载PDF
基于偏序结构理论的情态与时、体、态互动关系知识发现研究 被引量:4
12
作者 于建平 魏雪姣 +2 位作者 耿延宏 洪文学 李少雄 《燕山大学学报》 CAS 北大核心 2016年第6期508-516,共9页
本文基于偏序结构理论和方法,研究了情态动词语义与时、体、态句法特征的互动关系。以英语情态动词can为目标词,划分了can的3个词义:能力(ability)、允许(permission)和可能性(possibility)。以can与相邻词的互信息作为语义特征,显性和... 本文基于偏序结构理论和方法,研究了情态动词语义与时、体、态句法特征的互动关系。以英语情态动词can为目标词,划分了can的3个词义:能力(ability)、允许(permission)和可能性(possibility)。以can与相邻词的互信息作为语义特征,显性和隐性时态、体、语态特征为句法特征,构建了反映情态动can词的3个词义与时、体、态句法特征共现关系的形式背景,并生成了可视化展示情态动词语义与其属性特征之间的偏序结构关系和概念层次关系的属性偏序图。基于此图,发现了情态动词can与时、体、态特征的互动关系等知识。本文研究结果为自然语言处理中的特征选择和规则提取研究提供了重要的理论和实践依据。 展开更多
关键词 偏序结构理论 情态 时、体、态 互动关系 知识发现
在线阅读 下载PDF
计算方法在汉语风格学研究中的应用 被引量:21
13
作者 曾毅平 朱晓文 《福建师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2006年第1期14-17,共4页
计算方法引入汉语风格学研究始于20世纪70、80年代,初期主要用于作者考证和作家作品语言风格研究;之后有学者深入探讨了建立风格学研究数学模型的问题;近年来扩展到语言本体研究以及情报学研究等诸多领域。
关键词 计算方法 统计 语言风格 计算风格学
在线阅读 下载PDF
读写结合写作测试任务在大型考试中的构念效度验证 被引量:30
14
作者 张新玲 曾用强 《解放军外国语学院学报》 CSSCI 北大核心 2009年第1期56-61,共6页
越来越多的语言写作考试采用读写结合写作任务,但其效度证据不足。基于Messick构念整体观和建构主义对读写构念的描述,本研究从构念效度的实质方面入手对这类任务在我国大规模考试中所得分数进行效度验证,发现所取样本考生的读写结合写... 越来越多的语言写作考试采用读写结合写作任务,但其效度证据不足。基于Messick构念整体观和建构主义对读写构念的描述,本研究从构念效度的实质方面入手对这类任务在我国大规模考试中所得分数进行效度验证,发现所取样本考生的读写结合写作测试应答数据和构念理论相拟合。相关证据能够较充分、适当地支持基于该考试分数的大学录取等决策。 展开更多
关键词 读写结合写作任务 构念效度 写作测试
在线阅读 下载PDF
大规模汉语标注语料库的制作与使用 被引量:20
15
作者 段慧明 松井久仁於 +2 位作者 徐国伟 胡国昕 俞士汶 《语言文字应用》 CSSCI 北大核心 2000年第2期72-77,共6页
随着自然语言处理研究的深入开展 ,大规模语料库的作用越来越重要。自从70年代美国制作了著名的BrownCorpus以来 ,世界上已制作了各种语料库。富士通研究开发中心和北京大学计算语言学研究所合作 ,以人民日报语料为对象 ,制作大规模汉... 随着自然语言处理研究的深入开展 ,大规模语料库的作用越来越重要。自从70年代美国制作了著名的BrownCorpus以来 ,世界上已制作了各种语料库。富士通研究开发中心和北京大学计算语言学研究所合作 ,以人民日报语料为对象 ,制作大规模汉语标注语料库 ,这个语料库是世界上规模最大的标注语料库之一。 展开更多
关键词 自然语言处理 大规模语料库 人民日报语料 语言资源 汉语切分系统 精度
原文传递
基于深层语言模型的古汉语知识表示及自动断句研究 被引量:22
16
作者 胡韧奋 李绅 诸雨辰 《中文信息学报》 CSCD 北大核心 2021年第4期8-15,共8页
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上通过条件随机场和卷积神经网络实现了高精度的自动断句模型。... 古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上通过条件随机场和卷积神经网络实现了高精度的自动断句模型。在诗、词和古文三种文体上,模型断句F1值分别达到99%、95%和92%以上。在表达较为灵活的词和古文文体上,模型较之传统双向循环神经网络方法的F1值提升幅度达到10%以上。实验数据显示,模型能较好地捕捉诗词表达的节奏感和韵律感,也能充分利用上下文信息,实现语序、语法、语义、语境等信息的编码。在进一步的案例应用中,该方法在已出版古籍的断句疑难误例上也取得了较好的效果。 展开更多
关键词 古汉语 自动断句 深层语言模型
在线阅读 下载PDF
应用语言学学术论文标题的历时研究 被引量:26
17
作者 姚克勤 姜亚军 《外语研究》 CSSCI 北大核心 2010年第3期36-39,共4页
本文通过分析美国语言学的专业权威期刊TESOL Quarterly中1108个原创论文的标题演化,揭示6种类型应用语言学学术论文标题的历时变化及其在演变过程中的相互关系。不同类型的论文标题各自发生了较为显著的变化。除复合标题外,其他类型标... 本文通过分析美国语言学的专业权威期刊TESOL Quarterly中1108个原创论文的标题演化,揭示6种类型应用语言学学术论文标题的历时变化及其在演变过程中的相互关系。不同类型的论文标题各自发生了较为显著的变化。除复合标题外,其他类型标题的使用率均呈下降趋势。复合标题已成为使用率最高的类型。受其影响,名词短语+介词短语标题的使用率明显降低。其他类型的标题逐渐递减,但历时变化幅度相对较小。 展开更多
关键词 论文标题 应用语言学 历时变化
在线阅读 下载PDF
基于话语计算的中华优秀传统文化传播路径重构
18
作者 赵鹏 《济源职业技术学院学报》 2025年第1期1-7,共7页
基于认知智能的话语计算在中华优秀传统文化传播中具有广阔的应用前景。认知智能作为一种新兴的信息处理技术,具备深度学习和自然语言处理的能力,可以帮助人们在语义理解、情感识别和模型训练等方面理解、传承和传播中华优秀传统文化。... 基于认知智能的话语计算在中华优秀传统文化传播中具有广阔的应用前景。认知智能作为一种新兴的信息处理技术,具备深度学习和自然语言处理的能力,可以帮助人们在语义理解、情感识别和模型训练等方面理解、传承和传播中华优秀传统文化。具体而言,通过话语计算可以在数据驱动决策、智能写作、虚拟主播和传播方式创新等领域为中华优秀传统文化的传播提供智能化的解决方案,大大提高了中华优秀传统文化的传播效果。 展开更多
关键词 认知智能 话语计算 深度学习 中华优秀传统文化 传播路径
在线阅读 下载PDF
中文词语倾向性分析处理 被引量:5
19
作者 李娟 张全 贾宁 《计算机工程与应用》 CSCD 北大核心 2009年第2期131-133,共3页
意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒... 意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒贬义词典的词语,并使用二元语法模型来判定多倾向性词语的倾向。实验结果褒义词的F-Score为79.31%,贬义词的F-Score为78.18%。 展开更多
关键词 意见挖掘 词语倾向 二元语法
在线阅读 下载PDF
会话智能代理与语音自动识别 被引量:8
20
作者 冯志伟 詹宏伟 《外语学刊》 CSSCI 北大核心 2018年第1期13-23,共11页
本文从会话智能代理的角度,论述语音自动识别的原理和方法,分析特征提取阶段、声学建模阶段和解码阶段的基本原理,最后介绍语音识别研究的历史与现状。
关键词 智能代理 语音自动识别 特征抽取阶段 声学建模阶段 解码阶段
原文传递
上一页 1 2 17 下一页 到第
使用帮助 返回顶部