期刊文献+
共找到2,794篇文章
< 1 2 140 >
每页显示 20 50 100
BURST-LDA: A NEW TOPIC MODEL FOR DETECTING BURSTY TOPICS FROM STREAM TEXT 被引量:3
1
作者 Qi Xiang Huang Yu +4 位作者 Chen Ziyan Liu Xiaoyan Tian Jing Huang Tinglei Wang Hongqi 《Journal of Electronics(China)》 2014年第6期565-575,共11页
Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty... Topic models such as Latent Dirichlet Allocation(LDA) have been successfully applied to many text mining tasks for extracting topics embedded in corpora. However, existing topic models generally cannot discover bursty topics that experience a sudden increase during a period of time. In this paper, we propose a new topic model named Burst-LDA, which simultaneously discovers topics and reveals their burstiness through explicitly modeling each topic's burst states with a first order Markov chain and using the chain to generate the topic proportion of documents in a Logistic Normal fashion. A Gibbs sampling algorithm is developed for the posterior inference of the proposed model. Experimental results on a news data set show our model can efficiently discover bursty topics, outperforming the state-of-the-art method. 展开更多
关键词 text mining Burst detection Topic model Graphical model Bayesian inference
在线阅读 下载PDF
面向研究生招生咨询的中文Text-to-SQL模型 被引量:1
2
作者 王庆丰 李旭 +1 位作者 姚春龙 程腾腾 《计算机工程》 北大核心 2025年第3期362-368,共7页
研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言... 研究生招生咨询是一种具有代表性的短时间高频次问答应用场景。针对现有基于词向量等方法的招生问答系统返回答案不够精确,以及每年需要更新问题库的问题,引入了基于文本转结构化查询语言(Text-to-SQL)技术的RESDSQL模型,可将自然语言问题转化为SQL语句后到结构化数据库中查询答案并返回。搜集了研究生招生场景中的高频咨询问题,根据3所高校真实招生数据,构建问题与SQL语句模板,通过填充模板的方式构建数据集,共有训练集1501条、测试集386条。将RESDSQL的RoBERTa模型替换为具有更强多语言生成能力的XLM-RoBERTa模型、T5模型替换为mT5模型,并在目标领域数据集上进行微调,在招生领域问题上取得了较高的准确率,在mT5-large模型上执行正确率为0.95,精确匹配率为1。与基于ChatGPT3.5模型、使用零样本提示的C3SQL方法对比,该模型性能与成本均更优。 展开更多
关键词 中文文本转结构化查询语言 自然语言查询 中文SQL语句生成 预训练模型 text-to-SQL数据集
在线阅读 下载PDF
基于24Model的动火作业事故致因文本挖掘 被引量:1
3
作者 牛茂辉 李威君 +1 位作者 刘音 王璐 《中国安全科学学报》 北大核心 2025年第3期151-158,共8页
为探究工业动火作业事故的根源,提出一种基于“2-4”模型(24Model)的文本挖掘方法。首先,收集整理220篇动火作业事故报告,并作为数据集,构建基于来自变换器的双向编码器表征量(BERT)的24Model分类器,使用预训练模型训练和评估事故报告... 为探究工业动火作业事故的根源,提出一种基于“2-4”模型(24Model)的文本挖掘方法。首先,收集整理220篇动火作业事故报告,并作为数据集,构建基于来自变换器的双向编码器表征量(BERT)的24Model分类器,使用预训练模型训练和评估事故报告数据集,构建分类模型;然后,通过基于BERT的关键字提取算法(KeyBERT)和词频-逆文档频率(TF-IDF)算法的组合权重,结合24Model框架,建立动火作业事故文本关键词指标体系;最后,通过文本挖掘关键词之间的网络共现关系,分析得到事故致因之间的相互关联。结果显示,基于BERT的24Model分类器模型能够系统准确地判定动火作业事故致因类别,通过组合权重筛选得到4个层级关键词指标体系,其中安全管理体系的权重最大,结合共现网络分析得到动火作业事故的7项关键致因。 展开更多
关键词 “2-4”模型(24model) 动火作业 事故致因 文本挖掘 指标体系
原文传递
Statistical Language Model for Chinese Text Proofreading
4
作者 张仰森 曹元大 《Journal of Beijing Institute of Technology》 EI CAS 2003年第4期441-445,共5页
Statistical language modeling techniques are investigated so as to construct a language model for Chinese text proofreading. After the defects of n-gram model are analyzed, a novel statistical language model for Chine... Statistical language modeling techniques are investigated so as to construct a language model for Chinese text proofreading. After the defects of n-gram model are analyzed, a novel statistical language model for Chinese text proofreading is proposed. This model takes full account of the information located before and after the target word wi, and the relationship between un-neighboring words w_i and w_j in linguistic environment(LE). First, the word association degree between w_i and w_j is defined by using the distance-weighted factor, w_j is l words apart from w_i in the LE, then Bayes formula is used to calculate the LE related degree of word w_i, and lastly, the LE related degree is taken as criterion to predict the reasonability of word w_i that appears in context. Comparing the proposed model with the traditional n-gram in a Chinese text automatic error detection system, the experiments results show that the error detection recall rate and precision rate of the system have been improved. 展开更多
关键词 statistical language model N-GRAM linguistic environment text proofreading
在线阅读 下载PDF
Enhancing BERTopic with Pre-Clustered Knowledge: Reducing Feature Sparsity in Short Text Topic Modeling
5
作者 Qian Wang Biao Ma 《Journal of Data Analysis and Information Processing》 2024年第4期597-611,共15页
Modeling topics in short texts presents significant challenges due to feature sparsity, particularly when analyzing content generated by large-scale online users. This sparsity can substantially impair semantic captur... Modeling topics in short texts presents significant challenges due to feature sparsity, particularly when analyzing content generated by large-scale online users. This sparsity can substantially impair semantic capture accuracy. We propose a novel approach that incorporates pre-clustered knowledge into the BERTopic model while reducing the l2 norm for low-frequency words. Our method effectively mitigates feature sparsity during cluster mapping. Empirical evaluation on the StackOverflow dataset demonstrates that our approach outperforms baseline models, achieving superior Macro-F1 scores. These results validate the effectiveness of our proposed feature sparsity reduction technique for short-text topic modeling. 展开更多
关键词 Topic model BERTopic Short text Feature Sparsity CLUSTER
在线阅读 下载PDF
Creating Knowledge-Based Diagnostic Models by Mining Textual Diagnostic Reports of SPECT Scans
6
作者 Chuangui Cao Chengcheng Han Qiang Lin 《Journal of Computer and Communications》 2021年第5期10-19,共10页
Mining rich semantic information hidden in heterogeneous information network is one of the important tasks of data mining. Generally, a nuclear medicine text consists of the description of disease (<i>i.e.</i... Mining rich semantic information hidden in heterogeneous information network is one of the important tasks of data mining. Generally, a nuclear medicine text consists of the description of disease (<i>i.e.</i>, lesions) and diagnostic results. However, how to construct a computer-aided diagnostic model with a large number of medical texts is a challenging task. To automatically diagnose diseases with SPECT imaging, in this work, we create a knowledge-based diagnostic model by exploring the association between a disease and its properties. Firstly, an overview of nuclear medicine and data mining is presented. Second, the method of preprocessing textual nuclear medicine diagnostic reports is proposed. Last, the created diagnostic modes based on random forest and SVM are proposed. Experimental evaluation conducted real-world data of diagnostic reports of SPECT imaging demonstrates that our diagnostic models are workable and effective to automatically identify diseases with textual diagnostic reports. 展开更多
关键词 text Classification Nuclear Medicine SPECT Imaging Diagnostic model Random Forest SVM
在线阅读 下载PDF
基于检索增强Text-to-SQL生成的书目搜索对话问答系统研究
7
作者 王震宇 朱学芳 +2 位作者 张君冬 杨睿 刘崧印 《数据分析与知识发现》 北大核心 2025年第11期165-174,共10页
【目的】针对书目搜索场景中自然语言查询难以准确映射为结构化数据库查询的问题,本文构建对话式问答系统并提出改进方法。【方法】该系统采用模型上下文协议实现大语言模型与外部数据库的无缝集成。在此基础上,针对示例驱动的Text-to-... 【目的】针对书目搜索场景中自然语言查询难以准确映射为结构化数据库查询的问题,本文构建对话式问答系统并提出改进方法。【方法】该系统采用模型上下文协议实现大语言模型与外部数据库的无缝集成。在此基础上,针对示例驱动的Text-to-SQL生成易受噪声与领域差异影响的问题,设计了一种基于对比学习的示例选择策略,通过微调文本嵌入模型,使其更关注查询的句法结构与检索意图,从而提升相似度排序质量。实验基于构建的书目搜索语义解析数据集进行,在零样本与少样本条件下对系统性能进行对比验证。【结果】相较于零样本设置,采用本文方法的DeepSeek-V3模型在5-Shot场景下的SQL执行准确率提高了18.5个百分点,验证了该示例选择策略在专业领域Text-to-SQL任务中的有效性。【局限】由于实验数据集覆盖范围有限,系统对跨领域查询的适应性仍需进一步增强。【结论】研究证明了大语言模型结合对比学习示例选择策略在书目智能搜索场景中的有效性,可为其他垂直领域对话问答系统的构建与优化提供参考。 展开更多
关键词 书目搜索 检索增强生成 text-to-SQL 对话问答系统 模型上下文协议
原文传递
政策再生产视角下老旧小区改造的话语演变与治理转向
8
作者 刘铮 李倩如 《风景园林》 北大核心 2026年第2期40-49,共10页
【目的】基于政策再生产理论,分析中国老旧小区改造政策的演进特征与城市差异,为推动老旧小区改造的制度完善与治理创新提供实证依据。【方法】选取2005—2025年中央及地方改造政策文本,采用主题模型提取各阶段政策主题,并结合Word2Vec... 【目的】基于政策再生产理论,分析中国老旧小区改造政策的演进特征与城市差异,为推动老旧小区改造的制度完善与治理创新提供实证依据。【方法】选取2005—2025年中央及地方改造政策文本,采用主题模型提取各阶段政策主题,并结合Word2Vec词向量模型计算主题相似度,构建政策主题演化路径。基于住建部最新颁布的八批次城镇老旧小区改造可复制政策机制清单,进一步论证现阶段政策的话语构成与制度特征。【结果】老旧小区改造政策实现了从政策实验探索向政策机制完善的阶段演化,近年来呈现出多元共治的治理转向特征。同时,各地改造政策制定从早期的差异化探索逐步走向治理机制协同深化。【结论】老旧小区改造的治理投入持续提升,已实现从政策试验向制度完善的系统演进。进入存量增效提质阶段,老旧小区改造工作应进一步以“设计治理”理念为指引,充分吸收分借鉴可复制政策机制清单的创新经验,最终实现城市空间品质与治理效能的持续提升。 展开更多
关键词 城市更新 老旧小区改造 政策再生产 可复制政策机制清单 政策文本分析 主题建模分析
在线阅读 下载PDF
Geo-Text-700测试集的GIS领域国产大语言模型的性能评测
9
作者 侯家熙 袁莹 +1 位作者 黄宗财 李晖 《厦门理工学院学报》 2025年第5期40-47,共8页
针对国产大语言模型(large language models,LLMs)在地理信息科学(geographic information science,GIS)领域缺乏系统性评估基准问题,构建Geo-Text-700测试集的GIS领域定制化测评体系,基于优劣解距离层次分析法(technique for order pre... 针对国产大语言模型(large language models,LLMs)在地理信息科学(geographic information science,GIS)领域缺乏系统性评估基准问题,构建Geo-Text-700测试集的GIS领域定制化测评体系,基于优劣解距离层次分析法(technique for order preference by similarity to ideal solution,TOPSIS)对10个主流国产模型进行多维度评估。测评结果显示:模型表现呈现显著题型分化,客观题平均得分为68.4(标准差±5.2),较主观题低21.7%(P<0.05);Doubao-pro-32k综合得分最优(87.3),客观题优势显著(单选86,填空77);hunyuan-turbo在主观题(简答88.1,编程90.83)方面展现高阶任务潜力;领域知识盲区突出,如GIS拓扑规则题错误率为43.6%。 展开更多
关键词 地理信息科学(GIS) 大语言模型 评测体系 Geo-text-700测试集 TOPSIS-AHP法
在线阅读 下载PDF
基于主题的SE-TextRank情感摘要方法 被引量:8
10
作者 刘志明 于波 +3 位作者 欧阳纯萍 余颖 阳小华 翟云 《情报工程》 2017年第3期97-104,共8页
技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分... 技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank情感摘要方法。通过LDA模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。 展开更多
关键词 文本摘要 LDA模型 余弦距离 SE-textRank 特征融合
在线阅读 下载PDF
大语言模型幻觉检测方法综述 被引量:1
11
作者 李自拓 孙建彬 +5 位作者 陈广州 方馨悦 崔瑞靖 田植良 黄震 杨克巍 《计算机研究与发展》 北大核心 2026年第1期123-146,共24页
近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucinati... 近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。 展开更多
关键词 幻觉检测 大语言模型 事实一致性 文本生成 自然语言处理
在线阅读 下载PDF
基于无监督文本特征的隐含主题自动抽取方法
12
作者 包永红 《现代电子技术》 北大核心 2026年第4期42-46,共5页
文本数据中蕴含着丰富的信息,但这些信息往往以隐含的方式存在,不易被直接观察或理解。目前传统的监督学习方法需要大量的人工标注数据来训练模型,易受标注者的主观性影响,为解决该问题,提出一种基于无监督文本特征的隐含主题自动抽取... 文本数据中蕴含着丰富的信息,但这些信息往往以隐含的方式存在,不易被直接观察或理解。目前传统的监督学习方法需要大量的人工标注数据来训练模型,易受标注者的主观性影响,为解决该问题,提出一种基于无监督文本特征的隐含主题自动抽取方法。利用双向最大匹配法对文本进行分词后,去除其中的停用词,完成文本预处理工作;采用无监督TF-IDF算法提取预处理后文本的特征,再将文本数据转换为数值型特征向量,构建词特征向量集;引入LDA模型自动抽取隐含主题,即构建词特征向量中词汇对应隐含主题的概率分布模型,并利用Gibbs快速抽样法获取模型超参数,得到隐含主题概率分布,进而依据该分布结果实现文本隐含主题的自动抽取。实验结果表明,所提方法在应用过程中的F1值高于0.93,困惑度低于0.6,能够精准地抽取文本中的隐含主题。 展开更多
关键词 隐含主题 自动抽取 文本特征 无监督TF-IDF算法 LDA模型 Gibbs快速抽样法
在线阅读 下载PDF
融合FastText模型和注意力机制的网络新闻文本分类模型 被引量:11
13
作者 王婉 张向先 +1 位作者 卢恒 张莉曼 《现代情报》 CSSCI 2022年第3期40-47,共8页
[目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用... [目的/意义]构建融合Fast Text模型和注意力机制的网络新闻文本分类模型,为网络新闻平台运营提供了智能化的知识组织思路。[方法/过程]基于Word2vec模型与Fast Text模型相结合的词向量模型Ngram2vec进行网络新闻文本的语义表达,并运用融合注意力机制的Bi LSTM;tte模型实现新闻文本分类。[结果/结论]实验结果显示,融合了Fast Text模型与注意力机制的网络新闻文本分类模型使F1值从90.62%提升到92.03%,说明本文提出的文本分类模型能够提升网络新闻文本分类的精确率,对网络新闻平台提升知识组织效率、优化服务水平具有重要参考价值。 展开更多
关键词 网络新闻 文本分类 注意力机制 双向长短期记忆神经网络模型
在线阅读 下载PDF
科技文献文本知识抽取的提示框架研究
14
作者 陈昱成 韩涛 胡正银 《现代情报》 北大核心 2026年第2期91-101,共11页
[目的/意义]在小样本的情况下,基于大语言模型的科技文献知识抽取方法被广泛应用,模型的效果依赖于提示词的框架质量,因此需设计高质量的科技文献知识抽取提示词框架。[方法/过程]本研究以有机太阳能电池领域为例,设计有机太阳能电池领... [目的/意义]在小样本的情况下,基于大语言模型的科技文献知识抽取方法被广泛应用,模型的效果依赖于提示词的框架质量,因此需设计高质量的科技文献知识抽取提示词框架。[方法/过程]本研究以有机太阳能电池领域为例,设计有机太阳能电池领域的知识抽取知识体系,设计科技文献自动知识抽取提示词框架,利用不同的大模型进行对比实验。[结果/结论]实验结果表明,在有机太阳能电池领域的期刊文献知识抽取任务中,相比于普通的提示词知识抽取的方法,利用本文提出的提示词框架方法效果更优。 展开更多
关键词 提示词框架 大模型 文本挖掘 有机太阳能电池 高质量数据基座建设
在线阅读 下载PDF
结合细粒度文本与空间控制信号的人体动作扩散模型
15
作者 蒋滨泽 宋文凤 +1 位作者 侯霞 李帅 《系统仿真学报》 北大核心 2026年第1期136-157,共22页
为提升文本驱动动作生成的精确性、可控性与真实感,提出了一种融合细粒度文本语义信息与空间控制信号的人体动作生成方法。在扩散模型框架下,引入全局文本标记与身体部位级别的局部标记,通过CLIP编码后得到对应的特征,输入到动作扩散模... 为提升文本驱动动作生成的精确性、可控性与真实感,提出了一种融合细粒度文本语义信息与空间控制信号的人体动作生成方法。在扩散模型框架下,引入全局文本标记与身体部位级别的局部标记,通过CLIP编码后得到对应的特征,输入到动作扩散模型,实现对不同身体部位的精细控制。利用空间指导在扩散去噪过程中动态调整关节位置,使生成动作满足空间约束;结合真实性指导,有效改善未受控关节的自然性与整体协调性。基于HumanML3D数据集进行实验,使用ChatGPT-4o对44970条文本进行细粒度重写,提升文本与动作的语义对齐度。结果表明:所提方法在动作语义一致性、空间控制精度和生成质量等方面均优于现有方法,能够生成在语义一致性与动作质量上均符合用户预期的人体运动。 展开更多
关键词 人体运动 细粒度文本 多模态融合 扩散模型 空间控制信号
原文传递
大语言模型驱动的图书馆业务数据对话系统设计与实现
16
作者 张光照 王忠义 +2 位作者 王楠 张银玲 杨帆 《图书馆论坛》 北大核心 2026年第3期124-134,共11页
探索微调大语言模型的方法,使其能通过自然语言描述需求生成SQL查询语句,获取图书馆业务数据库报表,以解决现有业务系统查询功能固化,难以应对实际工作中多元化的需求的问题。文章根据图书馆各业务部门报表分析和决策需求,针对图书馆业... 探索微调大语言模型的方法,使其能通过自然语言描述需求生成SQL查询语句,获取图书馆业务数据库报表,以解决现有业务系统查询功能固化,难以应对实际工作中多元化的需求的问题。文章根据图书馆各业务部门报表分析和决策需求,针对图书馆业务数据库和中图分类法特征制作图书馆领域Text-to-SQL数据训练集和测试集;基于6-7B参数量选取国内外典型的开源中等参数规模大语言模型在训练集上进行LoRA微调,而后在测试集上验证SQL查询语句生成有效性,最后利用FastChat部署模型和研发可视化交互系统实现交互能力并在真实场景中分析应用效果。研究发现,在Chatglm3-6B模型微调中取得了0.9426的执行准确度,并在真实业务需求交互场景中探讨了微调后的中等参数规模大语言模型与超大规模参数模型Qwen-Max的应用效果,证明采用Textto-SQL微调大语言模型用于图书馆业务数据自然语言查询的有效性。 展开更多
关键词 图书馆业务数据 text-to-SQL 大语言模型 数据库对话系统 微调
在线阅读 下载PDF
基于动态主题模型的我国公共文化服务政策演进分析
17
作者 谢紫悦 陈雅 +2 位作者 杜佳 吴柯烨 王丹 《图书馆杂志》 北大核心 2026年第2期19-32,57,共15页
系统梳理我国公共文化服务政策发展轨迹,掌握其主题与演化趋势,提取优化逻辑,为后续政策制定与实践发力提供科学依据。选取我国20062023年间中央与省级层面公共文化服务政策文本,利用动态主题模型(Dynamic Topic Model,DTM)从主题强度... 系统梳理我国公共文化服务政策发展轨迹,掌握其主题与演化趋势,提取优化逻辑,为后续政策制定与实践发力提供科学依据。选取我国20062023年间中央与省级层面公共文化服务政策文本,利用动态主题模型(Dynamic Topic Model,DTM)从主题强度及语义层面捕捉我国公共文化服务政策演化趋势,并以可视化形式回溯其具体演进趋势与轨迹,精准提取我国公共文化服务政策体系的优化逻辑。基于动态主题模型挖掘出13个政策主题,根据时序分布、主题强度与语义演化可以看出我国公共文化服务政策布局逻辑遵循“建构解构再建构”的循环模式,呈现多元性与均衡性的结构特征,兼具协调发展与跨域融合的双重优势,实现了优化改革与持续性发展中的动态平衡,并对新机遇和挑战表现出高度敏感性和适应性。 展开更多
关键词 公共文化服务 政策文本分析 DTM 政策演化 主题演化
原文传递
基于集成学习与多模态大语言模型的图文情感分析方法
18
作者 王宁 武芳宇 +2 位作者 赵宇轩 张百灵 庞超逸 《计算机工程与应用》 北大核心 2026年第3期153-162,共10页
提出了一种融合集成学习与多模态大语言模型(multimodal large language models,MLLMs)的图文情感分析方法。针对图文情感分析中类别不平衡与跨模态情感不一致等关键挑战,设计了EMSAN(ensemble multimodal sentiment analysis network)... 提出了一种融合集成学习与多模态大语言模型(multimodal large language models,MLLMs)的图文情感分析方法。针对图文情感分析中类别不平衡与跨模态情感不一致等关键挑战,设计了EMSAN(ensemble multimodal sentiment analysis network)框架。该框架采用主辅模型结构,将在完整数据集上训练的主模型与在平衡子集上优化的辅助模型相结合,实现对各情感类别的精准识别。在特征学习方面,EMSAN采用两阶段策略增强情感特征:利用多模态大语言模型生成高质量的图像描述,缩小视觉与文本模态间的语义差距;引入一致性对比学习机制,通过对比文本和视觉特征的差异,强化跨模态情感的一致性表达,获得更为精细的特征。通过在平衡和不平衡数据集上的学习,EMSAN在保持数据自然分布的同时,有效缓解了类别不平衡问题。多个公共基准数据集上的实验结果表明,提出的方法取得了显著的性能提升。 展开更多
关键词 集成学习 多模态大语言模型 图文情感分析
在线阅读 下载PDF
视觉语言模型驱动的目标计数
19
作者 曹锋 张孝文 +2 位作者 岳子杰 李莉 史淼晶 《中国图象图形学报》 北大核心 2026年第1期289-302,共14页
目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neur... 目的大型视觉语言模型的进展给解决基于文本提示的目标计数问题带来新的思路。然而,现有方法仍面临类别语义错位与解码器架构局限两大挑战。前者导致模型易将相似背景或无关类别误检为目标,后者依赖单一卷积神经网络(convolutional neural network,CNN)架构的局部特征提取,可能引发全局语义与局部细节的割裂,严重制约复杂场景下的计数鲁棒性。针对上述问题,提出跨分支协作对齐网络(cross-branch cooperative alignment net⁃work,CANet)。方法其核心包括:1)双分支解码器架构:通过并行Transformer分支(建模全局上下文依赖)与CNN分支(提取细粒度局部特征),结合信息互馈模块实现跨分支的特征交互和密度图预测;2)视觉—文本类别对齐损失:通过约束图像与文本特征的跨模态对齐,迫使模型区分目标与干扰语义,实现对类别的准确检测。结果在5个基准数据集上与先进的4种基于文本的目标计数方法进行比较实验。在FSC-147(few-shot counting-147)数据集上,CANet相较于性能第2的模型,在测试集上的平均绝对误差(mean absolute error,MAE)和均方根误差(root mean squared error,RMSE)分别降低1.22和8.45;在CARPK(car parking lot dataset)和PUCPR+(Pontifical Catholic Univer⁃sity of Parana+dataset)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低0.08和3.58;在SHA(ShanghaiTech part-A)和SHB(ShanghaiTech part-B)数据集的交叉验证实验上,相较于性能第2的模型,MAE分别降低了47.0和9.8。同时也在FSC-147数据集上进行丰富的消融实验以验证算法的有效性,消融实验结果表明提出的方法针对两个问题做出了有效改进。结论本文方法能够解决现有方法所面临的两个问题,使计数结果更加准确。本文方法在4个数据集的交叉验证实验均取得SOTA(state-of-the-art)的性能,表明了CANet在零样本目标计数任务中的强大泛化能力。 展开更多
关键词 目标计数 视觉语言模型(VLM) 文本提示 双分支解码器 信息互馈
原文传递
针对文本情感分类任务的textSE-ResNeXt集成模型 被引量:9
20
作者 康雁 李浩 +2 位作者 梁文韬 宁浩宇 霍雯 《计算机工程与应用》 CSCD 北大核心 2020年第7期205-209,共5页
针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截... 针对深度学习方法中文本表示形式单一,难以有效地利用语料之间细化的特征的缺陷,利用中英文语料的不同特性,有区别地对照抽取中英文语料的特征提出了一种新型的textSE-ResNeXt集成模型。通过PDTB语料库对语料的显式关系进行分析,从而截取语料主要情感部分,针对不同中、英文情感词典进行情感程度关系划分以此获得不同情感程度的子数据集。在textSE-ResNeXt神经网络模型中采用了动态卷积核策略,以此对文本数据特征进行更为有效的提取,模型中融合了SEnet和ResNeXt,有效地进行了深层次文本特征的抽取和分类。将不同情感程度的子集上对textSE-ResNeXt模型采用投票集成的方法进一步提高分类效率。分别在中文酒店评论语料和六类常见英文分类数据集上进行实验。实验结果表明了本模型的有效性。 展开更多
关键词 文本情感分类 textSE-ResNeXt 特征划分 集成模型
在线阅读 下载PDF
上一页 1 2 140 下一页 到第
使用帮助 返回顶部