期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
“华西黉医”大模型构建与应用 被引量:7
1
作者 石锐 郑兵 +13 位作者 姚巡 杨豪 杨煦晨 张思远 王真吾 刘东峰 董婧 谢佳希 马虎 贺志阳 蒋成 乔丰 罗凤鸣 黄进 《中国胸心血管外科临床杂志》 北大核心 2025年第5期587-593,共7页
目的构建“华西黉医”大模型,探索其在辅助病历生成中的应用效果。方法采用“数据标注-模型训练-场景孵化”全链条的医疗大模型建设范式,通过多模态数据融合、领域自适应训练及国产化硬件适配策略,构建720亿参数规模的医学大模型,即“... 目的构建“华西黉医”大模型,探索其在辅助病历生成中的应用效果。方法采用“数据标注-模型训练-场景孵化”全链条的医疗大模型建设范式,通过多模态数据融合、领域自适应训练及国产化硬件适配策略,构建720亿参数规模的医学大模型,即“华西黉医”大模型。结合语音识别、知识图谱和强化学习技术,在构建“华西黉医”大模型的基础上开发辅助病历生成应用系统。结果以出院小结辅助生成为例,试点科室应用病历生成系统后每份病历书写平均时间由21 min缩短至5 min,效率提高3.2倍,系统输出准确率92.4%。结论医疗机构构建自主可控的医学大模型并以此孵化各类应用系统的模式可行,能为同类机构人工智能建设提供路径参考。 展开更多
关键词 医疗大模型 数据标注 多模态学习 病历生成 人工智能
原文传递
个性化学情感知的智慧助教算法设计与实践 被引量:3
2
作者 董艳民 林佳佳 +6 位作者 张征 程程 吴金泽 王士进 黄振亚 刘淇 陈恩红 《计算机应用》 北大核心 2025年第3期765-772,共8页
随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化... 随着大语言模型(LLM)的快速发展,基于LLM的对话助手逐渐成为学生学习的新方式。通过学生的问答互动,对话助手能生成相应的解答,从而帮助学生解决问题,并提高学习效率。然而,现有的对话助手忽略了学生的个性化需求,无法为学生提供个性化的回答,实现“因材施教”。因此,提出一种基于学生能力感知的个性化对话助手框架。该框架包括2个主要模块:学生能力感知模块和个性化回答生成模块。能力感知模块通过分析学生的答题记录来挖掘学生的知识掌握程度,回答生成模块则根据学生的能力生成个性化回答。基于此框架,设计基于指令、基于小模型驱动和基于智能体Agent的3种实现范式,以深入探讨框架的实际效果。基于指令的对话助手利用LLM的推理能力,从学生的答题记录中挖掘知识掌握程度以帮助生成个性化回答;基于小模型驱动的对话助手利用深度知识追踪(DKT)模型生成学生的知识掌握程度;基于Agent的个性化对话助手采用LLM Agent的方式整合学生能力感知、个性化检测、答案修正等工具辅助答案的生成。基于ChatGLM(Chat General Language Model)、GPT4o_mini的对比实验结果表明,应用3种范式的LLM均能为学生提供个性化的回答,其中基于Agent的范式的准确度更高,表明该范式能更好地感知学生能力,并生成个性化回答。 展开更多
关键词 智慧教育 个性化对话助手 大语言模型 知识追踪 LLM智能体
在线阅读 下载PDF
多粒度关键词注意力修正机制的篇章机器翻译方法
3
作者 林超 张为泰 +2 位作者 王士进 刘俊华 刘聪 《中文信息学报》 北大核心 2025年第11期95-103,共9页
篇章级机器翻译因可充分考量上下文信息,故而能有效提升译文质量与连贯性。然而,输入序列长度的大幅扩增,对翻译模型在长序列里捕获关键信息的能力提出了更为严苛的要求。针对上述问题,该文提出了一种多粒度关键词注意力修正机制的篇章... 篇章级机器翻译因可充分考量上下文信息,故而能有效提升译文质量与连贯性。然而,输入序列长度的大幅扩增,对翻译模型在长序列里捕获关键信息的能力提出了更为严苛的要求。针对上述问题,该文提出了一种多粒度关键词注意力修正机制的篇章机器翻译方法。具体地,首先引入掩码注意力扰动模块,评估篇章序列中不同词的重要性,并对关键词的权重进行激励,对噪声词权重进行抑制;其次,结合上下文知识迁移学习方法,将模型在子句和句子粒度层面的上下文建模能力迁移至篇章级翻译模型,从而提升篇章机器翻译模型的鲁棒性和翻译效果。与基线篇章翻译模型相比,在开源的WMT篇章翻译任务数据集上,该文方法平均提升0.55个BLEU,用词一致性提升4.1%,表明该方法在上下文信息利用上具有显著的有效性。 展开更多
关键词 注意力修正机制 篇章级机器翻译 迁移学习
在线阅读 下载PDF
少数民族文字文本分析与识别的研究进展 被引量:6
4
作者 王维兰 胡金水 +8 位作者 魏宏喜 库尔班·吾布力 邵文苑 毕晓君 贺建军 李振江 丁凯 金连文 高良才 《中国图象图形学报》 CSCD 北大核心 2024年第6期1685-1713,共29页
对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究... 对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究的一个热点领域。然而,由于少数民族文字种类繁多、应用场景多样及数据集的稀缺性等问题,这一研究领域仍面临诸多挑战。本文旨在总结先前的工作,并为未来的研究提供支持,重点讨论了印刷体文本、联机手写、古籍文档及场景文字识别等任务,概述了国内外在少数民族文种识别领域的发展和最新成果。首先阐明了少数民族文字文本分析与识别的重要性及其价值,介绍了特定少数民族文字及其古籍文档的特征。然后,回顾了这一领域的发展历史和现状,分析并总结了传统方法的代表性成果及其应用;详细讨论了研究重点向深度神经网络模型和深度学习方法的全面转移,这一转变使得各文种的识别性能得到了显著提升。最后,基于相关分析,本文指出了在不同文种文档分析与识别中存在的精度和泛化能力等方面的不足,以及与汉文文本分析与识别的差异;面对少数民族文字文本识别领域的主要困难与挑战,展望了未来的研究趋势和技术发展目标。 展开更多
关键词 少数民族文字 文档分析与识别 印刷体文本识别 手写识别 古籍文档识别 场景文字识别
原文传递
基于人工智能的病案首页智能编码技术研究与应用 被引量:11
5
作者 李强 尤心心 +4 位作者 周佳雯 杨雪 崔好胜 刘喜恩 吴及 《中国数字医学》 2022年第10期59-63,共5页
目的:设计病案首页智能辅助编码系统,实现该系统与病案管理系统的对接,提高编码效率和编码准确率。方法:构建两个阶段的编码技术框架,先通过TF-IDF、编辑距离等文本计算方法进行快速的粗编码,以获得疾病诊断的多个候选码,再通过张量图... 目的:设计病案首页智能辅助编码系统,实现该系统与病案管理系统的对接,提高编码效率和编码准确率。方法:构建两个阶段的编码技术框架,先通过TF-IDF、编辑距离等文本计算方法进行快速的粗编码,以获得疾病诊断的多个候选码,再通过张量图神经网络方法关联更加详细的信息进行精编码,最终获得最优编码推荐。结果:相比于人工编码,病案首页智能辅助编码系统能够在保证编码准确性的同时,提高病案室专业编码人员的编码效率。结论:利用人工智能技术,通过人机耦合的方式能够有效提高住院病案首页的编码效率和编码准确率,进而提高住院病案首页的填写质量。 展开更多
关键词 住院病案首页 智能编码 张量图构建 图内卷积 图间卷积
暂未订购
基于人工智能的病案首页诊断漏写检查技术应用研究 被引量:16
6
作者 李强 周佳雯 +4 位作者 崔好胜 周开银 刘少辉 刘喜恩 吴及 《中国数字医学》 2022年第6期56-61,共6页
目的:解决住院病案首页诊断漏写的问题,提高病案首页诊断填写质量。方法:基于自然语言处理技术及知识库构建技术设计诊断漏写检查系统,通过解析全病历内容,对病历中出现过的诊断是否确实漏写进行判断。结果:通过实际应用发现,该系统相... 目的:解决住院病案首页诊断漏写的问题,提高病案首页诊断填写质量。方法:基于自然语言处理技术及知识库构建技术设计诊断漏写检查系统,通过解析全病历内容,对病历中出现过的诊断是否确实漏写进行判断。结果:通过实际应用发现,该系统相比于人工审查,能够找出更多可能漏写的疾病,并且保证较高的准确率。结论:利用人工智能技术,通过人机耦合的方式能够有效提高住院病案首页诊断漏写检查效率,进而提高住院病案首页填写质量。 展开更多
关键词 自然语言处理 住院病案首页 诊断漏写
暂未订购
基于深度学习的英语口语自动评分研究
7
作者 苏琴 付瑞吉 《信息技术》 2023年第2期97-101,共5页
为提高英语口语学习效率,在研究了深度神经网络、声学模型、自动语音评分基础上,设计了一种基于深度学习的端到端自动英语评分系统。在输入层,将词汇表示为一个序列张量,其中每个位置对应于来自预先训练的词汇向量,并采用双向LSTM网络... 为提高英语口语学习效率,在研究了深度神经网络、声学模型、自动语音评分基础上,设计了一种基于深度学习的端到端自动英语评分系统。在输入层,将词汇表示为一个序列张量,其中每个位置对应于来自预先训练的词汇向量,并采用双向LSTM网络得到高层信息。在声学模型层,文中将注意力机制模型融入网络,从而提高系统运行效率。在输出层,将词汇的表示方式与口语表达连接起来,并利用softmax函数对成绩进行预测。通过仿真分析,结果表明所提方法较传统LSTM、GRU方法性能有所提升。仿真结果进一步验证了所提系统的有效性。 展开更多
关键词 英语口语 自动评分 长短时记忆网络 注意机制
在线阅读 下载PDF
面向作文自动评分的优美句识别 被引量:22
8
作者 付瑞吉 王栋 +2 位作者 王士进 胡国平 刘挺 《中文信息学报》 CSCD 北大核心 2018年第6期88-97,共10页
语言优美是学生写作能力中重要的一部分。该文提出一个面向作文自动评分的作文优美句识别任务,主要识别中学生中文作文中的优美句。相比传统文本分类任务,优美句识别更加难以用特征工程的方式解决。因此,该文提出一种基于卷积神经网络(C... 语言优美是学生写作能力中重要的一部分。该文提出一个面向作文自动评分的作文优美句识别任务,主要识别中学生中文作文中的优美句。相比传统文本分类任务,优美句识别更加难以用特征工程的方式解决。因此,该文提出一种基于卷积神经网络(CNN)和双向长短时记忆(BiLSTM)网络的混合神经网络结构进行优美句识别,并和CNN、BiLSTM网络进行了对比。实验证明,混合神经网络的准确率最高,达到89.23%,F1值与BiLSTM相当,达到75.39%。此外,该文将优美句子特征用于作文自动评分任务,可使计算机评分和人工评分的大分差比例下降21.41%。 展开更多
关键词 优美句识别 深度神经网络 作文自动评分
在线阅读 下载PDF
面向学科题目的文本分析方法与应用研究综述
9
作者 黄振亚 刘淇 +4 位作者 陈恩红 林鑫 何理扬 刘嘉聿 王士进 《中文信息学报》 CSCD 北大核心 2022年第10期1-16,共16页
分析学科题目含义、模拟人类解决问题,是当前“人工智能+教育”融合研究的重要方向之一。近年来,智能教育系统的快速发展积累了大量学科题目资源,为相关研究提供了数据支撑。为此,利用大数据分析与自然语言处理相关的技术,研究者提出了... 分析学科题目含义、模拟人类解决问题,是当前“人工智能+教育”融合研究的重要方向之一。近年来,智能教育系统的快速发展积累了大量学科题目资源,为相关研究提供了数据支撑。为此,利用大数据分析与自然语言处理相关的技术,研究者提出了大量面向学科题目的文本分析方法,开展了许多重要的智能应用任务,对探索人类知识学习等认知能力具有重要意义。该文围绕智能教育与自然语言处理交叉领域,介绍了若干代表性研究任务,包括题目质量分析、机器阅读理解、数学题问答、文章自主评分等,并对相应研究进展进行阐述和总结;此外,对相关数据集和开源工具包进行了总结和介绍;最后,展望了多个未来研究方向。 展开更多
关键词 学科题目 题目质量分析 机器阅读理解 数学题问答 文章自主评分
在线阅读 下载PDF
深度学习建模下的自动句子填空技术
10
作者 陈志刚 华磊 +3 位作者 刘权 尹坤 魏思 胡国平 《中文信息学报》 CSCD 北大核心 2019年第8期101-110,共10页
该文提出了一种结合依存句法分析和深度神经网络的自动句子填空技术。首先,提出了一种依存句法信息展开的序列建模方案,可以在引入句法信息的同时兼顾效率,并在此基础上利用排序学习思想,训练候选答案排序模型;其次,针对整体序列建模的... 该文提出了一种结合依存句法分析和深度神经网络的自动句子填空技术。首先,提出了一种依存句法信息展开的序列建模方案,可以在引入句法信息的同时兼顾效率,并在此基础上利用排序学习思想,训练候选答案排序模型;其次,针对整体序列建模的细节建模失准问题,提出了一种基于语言模型多状态信息融合的自动句子填空模型;最后,设计了一种结合序列表示、依存句法信息、多状态信息的多源信息融合模型。该文还构建出一个英文答题数据集并据此进行了实验。实验结果表明,依存句法展开模型相对于常用的序列建模方案,准确率有11%的绝对提升;语言模型状态排序模型相对于基线模型,准确率有9.3%的绝对提升;最终的多源信息融合模型,在测试集上获得最高76.9%的准确率。 展开更多
关键词 句子填空 句法分析 序列建模 深度学习
在线阅读 下载PDF
基于铁路客运知识库的意图识别模型训练及应用研究
11
作者 杨立鹏 陈华龙 +3 位作者 张睿 王勃 孟庆晔 李强 《计算机应用文摘》 2023年第21期49-54,共6页
自2018年以来,铁路客服中心开始引入人工智能技术,并在语音机器人场景进行系统试用,然而试用过程中发现存在知识检索精度低以及知识构建和维护效率低等问题。为了解决上述问题,文章主要研究了基于铁路客运客服知识库的意图识别模型训练... 自2018年以来,铁路客服中心开始引入人工智能技术,并在语音机器人场景进行系统试用,然而试用过程中发现存在知识检索精度低以及知识构建和维护效率低等问题。为了解决上述问题,文章主要研究了基于铁路客运客服知识库的意图识别模型训练及应用技术,从以下三个方面展开探讨:首先,介绍了多预训练模型融合蒸馏的意图识别模型训练技术,包括模型预训练、模型融合和模型蒸馏等关键技术;其次,研究了基于意图识别的信息检索技术,该技术在传统基于关键字的信息检索技术的基础上,结合了检索意图识别,从而提高了知识检索的精度;最后,介绍了基于规则与模型结合的非结构化知识自动采编技术,通过设计规则抽取和意图识别模型抽取两种方法,实现了从海量非结构化文本中自动抽取和采编结构化知识的功能,从而解决了知识构建及维护效率低的问题。 展开更多
关键词 铁路客服 自然语言处理 意图识别 信息检索 非结构化知识采编
在线阅读 下载PDF
RE^(2):improving Chinese grammatical error correction via retrieving appropriate examples with explanation
12
作者 Baoxin WANG Yumeng LUO +3 位作者 Yixuan WANG Dayong WU Wanxiang CHE Shijin WANG 《Frontiers of Computer Science》 2025年第12期87-100,共14页
The primary objective of Chinese grammatical error correction(CGEC)is to detect and correct errors in Chinese sentences.Recent research shows that large language models(LLMs)have been applied to CGEC with significant ... The primary objective of Chinese grammatical error correction(CGEC)is to detect and correct errors in Chinese sentences.Recent research shows that large language models(LLMs)have been applied to CGEC with significant results.For LLMs,selecting appropriate reference examples can help improve their performance.However,existing methods predominantly rely on text similarity for example retrieval,a strategy that frequently mismatches actual error patterns and retrieves lexically similar yet grammatically irrelevant sentences.To address this problem,we propose a method named RE^(2),which retrieves appropriate examples with explanations of grammatical errors.Instead of using text similarity of the input sentence,we use explanations of grammatical errors to select reference examples,which are used by LLMs to improve the performance of CGEC.We conduct experiments on two CGEC datasets and create a high-quality grammatical error explanation(GEE)dataset,which is not only used in our research but also serves as a valuable resource for future studies in both CGEC and GEE.The experimental results on the two datasets indicate that our proposed method effectively improves the performance of CGEC. 展开更多
关键词 grammatical error correction large language model grammatical error explanation
原文传递
MiMu: mitigating multiple shortcut learning behavior of transformers
13
作者 Lili ZHAO Qi LIU +7 位作者 Wei CHEN Liyi CHEN Ruijun SUN Min HOU Yang WANG Shijin WANG Pingping REN Jiafeng ZHOU 《Frontiers of Computer Science》 2025年第12期69-85,共17页
Empirical Risk Minimization(ERM)models often rely on spurious correlations between features and labels during the learning process,leading to shortcut learning behavior that undermines robustness generalization perfor... Empirical Risk Minimization(ERM)models often rely on spurious correlations between features and labels during the learning process,leading to shortcut learning behavior that undermines robustness generalization performance.Current research mainly targets identifying or mitigating a single shortcut;however,in real-world scenarios,cues within the data are diverse and unknown.In empirical studies,we reveal that models rely more on strong shortcuts than weak ones,with their performance under multiple shortcuts typically falling between that of an individual shortcut.To address these challenges,we propose MiMu,a novel method integrated with Transformer-based ERMs designed to Mitigate Multiple shortcut learning behavior,which incorporates self-calibration strategy and self-improvement strategy.In the source model,we first propose the self-calibration strategy to prevent the model from relying on shortcuts and make overconfident predictions.Then,we design self-improvement strategy in target model to further reduce the reliance on multiple shortcuts.The random mask strategy involves randomly masking partial attention positions to diversify the focus of target model avoiding fixation on a fixed region.Meanwhile,the adaptive attention alignment module facilitates the alignment of attention weights to the calibrated source model,without the need for post-hoc attention maps or supervision.Finally,extensive experiments conducted on Natural Language Processing(NLP)and Computer Vision(CV)demonstrate the effectiveness of MiMu in improving the robustness generalization abilities. 展开更多
关键词 shortcut learning ROBUSTNESS GENERALIZABILITY
原文传递
英语口语自动评测新方法——中国学生英语朗读自动评测系统 被引量:17
14
作者 陈桦 吴奎 李景娜 《外语电化教学》 CSSCI 北大核心 2019年第1期72-77,共6页
自动评测可以弥补人工评测主观性较强、费时费力等不足,但目前仍存在评测项涵盖不够全面、技术层面和语言学层面结合不够紧密等问题。为此,本研究开发了中国学生英语朗读自动评测系统,其特点体现在语音评测项、评分方式、人工专家的作... 自动评测可以弥补人工评测主观性较强、费时费力等不足,但目前仍存在评测项涵盖不够全面、技术层面和语言学层面结合不够紧密等问题。为此,本研究开发了中国学生英语朗读自动评测系统,其特点体现在语音评测项、评分方式、人工专家的作用、技术模型等方面。此外,该系统基于中国英语学习者语音数据库,评测对象更具针对性。本系统的研发与不断优化对语言评测动态体系的构建及口语自动评测技术的发展具有重要的理论和实践意义。 展开更多
关键词 朗读口语 自动评测 动态评测体系
原文传递
神经网络分类算法驱动的口译教学语料难度分级系统 被引量:3
15
作者 刘晨璇 王吟颖 +1 位作者 李小喜 戴礼荣 《中国翻译》 CSSCI 北大核心 2023年第3期71-80,190,共11页
教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可... 教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可视为一个分类问题。本文使用RoBERTa预训练模型构建神经网络系统,通过对286段语料进行人工标注再使用数据增强和知识蒸馏技术扩充数据集的方法,开发了一套基于机器学习的教学语料难度自动分级系统。该系统可以根据输入的源语语料自动输出其难度分级结果,帮助教师和学习者更好地开展课堂教学和自主学习。 展开更多
关键词 教材 教学语料库 难度 分类算法 RoBERTa 数据增强
原文传递
Leveraging proficiency and preference for online Karaoke recommendation 被引量:3
16
作者 Ming HE Hao GUO +4 位作者 Guangyi LV Le WU Yong GE Enhong CHEN Haiping MA 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第2期273-290,共18页
Recently,many online Karaoke(KTV)platforms have been released,where music lovers sing songs on these platforms.In the meantime,the system automatically evaluates user proficiency according to their singing behavior.Re... Recently,many online Karaoke(KTV)platforms have been released,where music lovers sing songs on these platforms.In the meantime,the system automatically evaluates user proficiency according to their singing behavior.Recommending approximate songs to users can initialize singers5 participation and improve users,loyalty to these platforms.However,this is not an easy task due to the unique characteristics of these platforms.First,since users may be not achieving high scores evaluated by the system on their favorite songs,how to balance user preferences with user proficiency on singing for song recommendation is still open.Second,the sparsity of the user-song interaction behavior may greatly impact the recommendation task.To solve the above two challenges,in this paper,we propose an informationfused song recommendation model by considering the unique characteristics of the singing data.Specifically,we first devise a pseudo-rating matrix by combing users’singing behavior and the system evaluations,thus users'preferences and proficiency are leveraged.Then we mitigate the data sparsity problem by fusing users*and songs'rich information in the matrix factorization process of the pseudo-rating matrix.Finally,extensive experimental results on a real-world dataset show the effectiveness of our proposed model. 展开更多
关键词 KTV matrix FACTORIZATION RECOMMENDATION system
原文传递
Enriching Context Information for Entity Linking with Web Data
17
作者 Yi-Ting Wang Jie Shen +6 位作者 Zhi-Xu Li Qiang Yang An Liu Peng-Peng Zhao Jia-Jie Xu Lei Zhao Xun-Jie Yang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2020年第4期724-738,共15页
Entity linking(EL)is the task of determining the identity of textual entity mentions given a predefined knowledge base(KB).Plenty of existing efforts have been made on this task using either"local"informatio... Entity linking(EL)is the task of determining the identity of textual entity mentions given a predefined knowledge base(KB).Plenty of existing efforts have been made on this task using either"local"information(contextual information of the mention in the text),or"global"information(relations among candidate entities).However,either local or global information might be insufficient especially when the given text is short.To get richer local and global information for entity linking,we propose to enrich the context information for mentions by getting extra contexts from the web through web search engines(WSE).Based on the intuition above,two novel attempts are made.The first one adds web-searched results into an embedding-based method to expand the mention's local information,where we try two different methods to help generate high-quality web contexts:one is to apply the attention mechanism and the other is to use the abstract extraction method.The second one uses the web contexts to extend the global information,i.e.,finding and utilizing more extra relevant mentions from the web contexts with a graph-based model.Finally,we combine the two models we propose to use both extended local and global information from the extra web contexts.Our empirical study based on six real-world datasets shows that using extra web contexts to extend the local and the global information could effectively improve the F1 score of entity linking. 展开更多
关键词 ENTITY LINKING web search engine (WSE) attention mechanism ABSTRACT extraction
原文传递
Promoting interactions between cognitive science and large language models 被引量:1
18
作者 Youzhi Qu Penghui Du +10 位作者 Wenxin Che Chen Wei Chi Zhang Wanli Ouyang Yatao Bian Feiyang Xu Bin Hu Kai Du Haiyan Wu Jia Liu Quanying Liu 《The Innovation》 EI 2024年第2期9-10,共2页
Large language models(LLMs)have made unprecedented progress,demonstrating human-like language proficiency and an extraordinary ability to encode complex knowledge.The emergence of high-level cognitive capabilities in ... Large language models(LLMs)have made unprecedented progress,demonstrating human-like language proficiency and an extraordinary ability to encode complex knowledge.The emergence of high-level cognitive capabilities in LLMs,such as in-context learning and complex reasoning,suggests a path toward the realization of artificial general intelligence(AGI).However,we lack scientific theories and tools to assess and interpret such an emergence of the advanced intelligence of LLMs.Artificial intelligence(AI)has been extensively applied in various areas of fundamental science to accelerate scientific research. 展开更多
关键词 COGNITIVE SUCH LANGUAGE
原文传递
Discriminative explicit instance selection for implicit discourse relation classification
19
作者 Wei SONG Hongfei HAN +4 位作者 Xu HAN Miaomiao CHENG Jiefu GONG Shijin WANG Ting LIU 《Frontiers of Computer Science》 SCIE EI CSCD 2024年第4期129-138,共10页
Discourse relation classification is a fundamental task for discourse analysis,which is essential for understanding the structure and connection of texts.Implicit discourse relation classification aims to determine th... Discourse relation classification is a fundamental task for discourse analysis,which is essential for understanding the structure and connection of texts.Implicit discourse relation classification aims to determine the relationship between adjacent sentences and is very challenging because it lacks explicit discourse connectives as linguistic cues and sufficient annotated training data.In this paper,we propose a discriminative instance selection method to construct synthetic implicit discourse relation data from easy-to-collect explicit discourse relations.An expanded instance consists of an argument pair and its sense label.We introduce the argument pair type classification task,which aims to distinguish between implicit and explicit argument pairs and select the explicit argument pairs that are most similar to natural implicit argument pairs for data expansion.We also propose a simple label-smoothing technique to assign robust sense labels for the selected argument pairs.We evaluate our method on PDTB 2.0 and PDTB 3.0.The results show that our method can consistently improve the performance of the baseline model,and achieve competitive results with the state-of-the-art models. 展开更多
关键词 discourse analysis PDTB discourse relation implicit discourse relation classification data expansion
原文传递
Visible-infrared person re-identification via specific and shared representations learning
20
作者 Aihua Zheng Juncong Liu +3 位作者 Zi Wang Lili Huang Chenglong Li Bing Yin 《Visual Intelligence》 2023年第1期28-39,共12页
The primary goal of visible-infrared person re-identification(VI-ReID)is to match pedestrian photos obtained during the day and night.The majority of existing methods simply generate auxiliary modalities to reduce the... The primary goal of visible-infrared person re-identification(VI-ReID)is to match pedestrian photos obtained during the day and night.The majority of existing methods simply generate auxiliary modalities to reduce the modality discrepancy for cross-modality matching.They capture modality-invariant representations but ignore the extraction of modality-specific representations that can aid in distinguishing among various identities of the same modality.To alleviate these issues,this work provides a novel specific and shared representations learning(SSRL)model for VI-ReID to learn modality-specific and modality-shared representations.We design a shared branch in SSRL to bridge the image-level gap and learn modality-shared representations,while a specific branch retains the discriminative information of visible images to learn modality-specific representations.In addition,we propose intra-class aggregation and inter-class separation learning strategies to optimize the distribution of feature embeddings at afine-grained level.Extensive experimental results on two challenging benchmark datasets,SYSU-MM01 and RegDB,demonstrate the superior performance of SSRL over state-of-the-art methods. 展开更多
关键词 Person Re-identification(Re-ID) Cross-modality Specific Representations Shared Representations
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部