期刊文献+
共找到634篇文章
< 1 2 32 >
每页显示 20 50 100
基于Labeled-LDA模型的科学数据与科技文献关联识别研究——以生物医学领域为例 被引量:7
1
作者 潘有能 吕晶晶 丁楠 《情报科学》 CSSCI 北大核心 2023年第9期138-145,154,共9页
【目的/意义】在万物互联的开放科学时代,建立科学数据与科技文献之间的关联成为推动科学数据开放获取、共享和重用的重要举措。【方法/过程】本研究基于Labeled-LDA模型,辅以基于规则的识别方法,构建科学数据与科技文献关联识别模型,... 【目的/意义】在万物互联的开放科学时代,建立科学数据与科技文献之间的关联成为推动科学数据开放获取、共享和重用的重要举措。【方法/过程】本研究基于Labeled-LDA模型,辅以基于规则的识别方法,构建科学数据与科技文献关联识别模型,并以生物医学领域为例分别针对规范化引用、非规范化引用以及无引用三种关联情况进行模型训练与测试。【结果/结论】研究发现本模型在识别规范化引用测试集时识别率和F值分别为0.9和0.5左右,有比较稳定的识别效果,在识别非规范化引用和无引用的测试集时识别率分别为0.465和0.5,也展现出较强的可移植性与应用潜力。通过对非规范化引用和无引用识别结果进行人工判断,发现科学研究中确实存在数据引用不规范的现象,需要学界共同推动数据引用规范化。【创新/局限】与其他研究相比,本文构建的模型为基于语义的关联识别提供了方法层面的参考和基础,可以应用于大规模语料研究,从而促进更深层次语义关联的知识发现。 展开更多
关键词 科学数据 科技文献 labeled-LDA 关联识别 数据引用
原文传递
用于多标签分类的改进Labeled LDA模型 被引量:12
2
作者 江雨燕 李平 王清 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第4期425-432,共8页
概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言... 概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言处理等领域的重点研究方向.本文通过对隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)及其扩展模型的研究,提出一种适用于文档多标签判定的改进Labeled LDA模型.模型中的标记被映射为多个主题的组合,其中包含若干个独享的主题和共享主题.在文档类别判定过程中通过联合独享主题和共享主题来对类别进行预测.为了验证算法的有效性本文将提出的模型分别与PLDA模型及其他非主题模型进行了对比.实验结果表明,改进LabeledLDA模型能够有效解决PLDA模型无法有效分析类别标记之间共享主题的问题,具有明显优于PLDA和其他非主题模型的多标签判定能力. 展开更多
关键词 主题模型 隐含狄利克雷分配 多标签分类 共享主题
在线阅读 下载PDF
基于Labeled LDA主题模型的医学文献自动分类法 被引量:5
3
作者 宫小翠 安新颖 单连慧 《中华医学图书情报杂志》 CAS 2018年第10期53-58,共6页
提出了一种基于Labeled LDA主题模型的医学文献自动分类法。以10个医学领域的研究文献为案例,通过语料库的设置及参数设置调整模型为最佳,与SVM方法进行对比实验。结果显示,无论是准确率还是召回率,基于Labeled LDA主题模型的自动分类... 提出了一种基于Labeled LDA主题模型的医学文献自动分类法。以10个医学领域的研究文献为案例,通过语料库的设置及参数设置调整模型为最佳,与SVM方法进行对比实验。结果显示,无论是准确率还是召回率,基于Labeled LDA主题模型的自动分类法均比SVM法高出7.00%左右,表明基于Labeled LDA主题模型的医学文献自动分类法具有较好的医学领域文本分类效果。 展开更多
关键词 labeled LDA 主题模型 自动分类 SVM
在线阅读 下载PDF
Label-free quantitative proteomics reveals fibrinopeptide B and heparin cofactorⅡas potential serum biomarkers in respiratory syncytial virus-infected mice treated with Qingfei oral liquid formula 被引量:3
4
作者 ZHOU Li-Hua XU Jian-Ya +2 位作者 DAI Chen FAN Yi-Man YUAN Bin 《Chinese Journal of Natural Medicines》 SCIE CAS CSCD 2018年第4期241-251,共11页
Respiratory syncytial virus(RSV) is a leading cause of acute lower respiratory tract infections. Qingfei oral liquid(QFOL), a traditional Chinese medicine, is widely used in clinical treatment for RSV-induced pneumoni... Respiratory syncytial virus(RSV) is a leading cause of acute lower respiratory tract infections. Qingfei oral liquid(QFOL), a traditional Chinese medicine, is widely used in clinical treatment for RSV-induced pneumonia. The present study was designed to reveal the potential targets and mechanism of action for QFOL by exploring its influence on the host cellular network following RSV infection. We investigated the serum proteomic changes and potential biomarkers in an RSV-infected mouse pneumonia model treated with QFOL. Eighteen BALB/c mice were randomly divided into three groups: RSV pneumonia model group(M), QFOL-treated group(Q) and the control group(C). Serum proteomes were analyzed and compared using a label-free quantitative LC-MS/MS approach. A total of 172 protein groups, 1009 proteins, and 1073 unique peptides were successfully identified. 51 differentially expressed proteins(DEPs) were identified(15 DEPs when M/C and 43 DEPs when Q/M; 7 DEPs in common). Classification and interaction network showed that these proteins participated in various biological processes including immune response, blood coagulation, complement activation, and so forth. Particularly, fibrinopeptide B(FpB) and heparin cofactor Ⅱ(HCII) were evaluated as important nodes in the interaction network, which was closely involved in coagulation and inflammation. Further, the Fp B level was increased in Group M but decreased in Group Q, while the HCII level exhibited the opposite trend. These findings not only indicated FpB and HCII as potential biomarkers and targets of QFOL in the treatment of RSV pneumonia, but also suggested a regulatory role of QFOL in the RSV-induced disturbance of coagulation and inflammation-coagulation interactions. 展开更多
关键词 Qingfei oral liquid Respiratory syncytial virus-infected mouse pneumonia model label-free quantitative proteomics Potential serum biomarkers RSV-host interaction network
原文传递
面向雷达目标识别的一种在线迁移学习框架 被引量:1
5
作者 杨予昊 孙晶明 +2 位作者 张强 晏媛 王众 《现代雷达》 北大核心 2025年第5期16-20,共5页
可靠、高效、精准的目标识别性能需求,与完备的目标数据库构建困难之间的矛盾,要求雷达目标识别系统具备动态学习能力,动态实现数据、模型的更新与识别能力的跃升。而样本自标注、模型自更新等功能的实现是达到这一目标的前提条件。针... 可靠、高效、精准的目标识别性能需求,与完备的目标数据库构建困难之间的矛盾,要求雷达目标识别系统具备动态学习能力,动态实现数据、模型的更新与识别能力的跃升。而样本自标注、模型自更新等功能的实现是达到这一目标的前提条件。针对雷达目标识别在实际应用中的性能自提升需求,通过借鉴在线学习与迁移学习的思想,提出一种在线迁移学习框架,通过结合在线学习和迁移学习技术,采用闭环结构,通过样本标注和模型微调,实现模型的自我迭代优化,可自动完成样本标注、模型更新等任务。基于仿真数据的实验结果表明,所提框架可显著提升雷达目标识别的准确性,具有流程简单、部署快捷的优点,具有较强的工程实用性。 展开更多
关键词 雷达目标识别 样本自标注 模型自更新 在线学习 迁移学习
原文传递
Image processing algorithm acceleration using reconfigurable macro processor model 被引量:2
6
作者 SunGuanKfu ChenHuaming LuHuanzhang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2004年第2期110-114,共5页
The concept and advantage of reconfigurable technology is introduced. A kind of processor architecture of re configurable macro processor (RMP) model based on FPGA array and DSP is put forward and has been implemented... The concept and advantage of reconfigurable technology is introduced. A kind of processor architecture of re configurable macro processor (RMP) model based on FPGA array and DSP is put forward and has been implemented. Two image algorithms are developed: template-based automatic target recognition and zone labeling. One is estimating for motion direction in the infrared image background, another is line picking-up algorithm based on image zone labeling and phase grouping technique. It is a kind of 'hardware' function that can be called by the DSP in high-level algorithm. It is also a kind of hardware algorithm of the DSP. The results of experiments show the reconfigurable computing technology based on RMP is an ideal accelerating means to deal with the high-speed image processing tasks. High real time performance is obtained in our two applications on RMP. 展开更多
关键词 real-time image processing reconfigurable computing technology reconfigurable macro processor model template matching image zone labeling.
在线阅读 下载PDF
基于伪标签的二阶段时序半监督学习框架
7
作者 彭鸿鑫 骆淑云 罗志一 《电子科技》 2026年第2期9-18,共10页
针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练... 针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练,以充分利用标签数据和无标签数据之间的紧密关联来提升模型性能。在多个公开时序分类数据集进行实验来验证所提框架的有效性,并对不同第2阶段伪标签训练方法的适用条件进行深入探讨。实验结果表明,在标签数据比例仅为1%和5%的情况下,所提学习框架在两个基模型和多个数据集上的准确率平均提升了约5.1%和3.5%,充分证明了所提方法能够有效解决半监督时序分类问题。 展开更多
关键词 半监督分类 时序数据 学习框架 伪标签技术 二阶段训练 对比学习 预训练 模型微调
在线阅读 下载PDF
地理标志产品直播销售过程中的根脉文化传播 被引量:2
8
作者 吕琼艺 《特区经济》 2025年第3期144-147,共4页
地理标志产品对拉动本土经济发展具有重要作用,根脉诉求传播是培育高质量地理标志品牌的关键途径。通过微分动力学模型,文中分析了地理标志产品直播销售过程中根脉诉求传播的主要影响因素。结果表明:根脉诉求的传播与直播人员的加入率... 地理标志产品对拉动本土经济发展具有重要作用,根脉诉求传播是培育高质量地理标志品牌的关键途径。通过微分动力学模型,文中分析了地理标志产品直播销售过程中根脉诉求传播的主要影响因素。结果表明:根脉诉求的传播与直播人员的加入率、离开率、学习率和遗弃率相关;无论加入率、离开率、遗弃率和学习率如何变化,电商直播中地理标志产品根脉知识拥有者最终都将达到稳定状态。提高地理标志产品根脉诉求直播电商主播的加入率和接触率,并最大限度降低根脉知识拥有者的遗弃率,能够提高直播电商中根脉知识拥有者所占的比例,促进地理标志产品高质量快速发展。 展开更多
关键词 根脉诉求 地理标志产品 电商直播 微分动力学模型
原文传递
区域性职业装品牌竞争态势分析与对策建议
9
作者 任力 袁沁汝 《时尚设计与工程》 2025年第1期79-81,共3页
温州(瓯海)作为国内职业装生产和供应的主要市场,面临着新的市场优势与劣势。以温州职业装品牌市场为研究对象,对温州职业装品牌的发展现状进行了阶梯化分析,并深入探讨了厂牌运营模式与区域品牌发展之间的关系。研究尝试探索如何通过... 温州(瓯海)作为国内职业装生产和供应的主要市场,面临着新的市场优势与劣势。以温州职业装品牌市场为研究对象,对温州职业装品牌的发展现状进行了阶梯化分析,并深入探讨了厂牌运营模式与区域品牌发展之间的关系。研究尝试探索如何通过整合各方资源、充分发挥温州本地产业链的功能与集群效应,形成具有区域特色的动态交互职业装品牌,为温州职业装品牌的生存与发展提供一种新的形态和发展路径。 展开更多
关键词 职业装 厂牌模式 温州品牌
在线阅读 下载PDF
基于改进标签传播算法的舆情社交网络社区发现 被引量:1
10
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
一种基于预训练标签序列生成模型的多标签情绪分类方法
11
作者 揭安全 陈雷 +1 位作者 曾雪强 左家莉 《中文信息学报》 北大核心 2025年第11期183-194,共12页
基于序列到序列的情绪标签生成模型采用循环神经网络建模情绪相关性,是一种有效的多标签情绪分类方法。然而,现有序列生成模型仅通过隐状态隐式地学习标签相关性,难以有效捕捉细粒度情绪间的强相关性。针对这一问题,该文提出了一种基于... 基于序列到序列的情绪标签生成模型采用循环神经网络建模情绪相关性,是一种有效的多标签情绪分类方法。然而,现有序列生成模型仅通过隐状态隐式地学习标签相关性,难以有效捕捉细粒度情绪间的强相关性。针对这一问题,该文提出了一种基于预训练序列生成模型的多标签情绪分类方法(Multi-Label Emotion Classification Based on Pre-trained BART,EmoBART)。EmoBART模型采用预训练生成式语言模型BART为情绪标签序列生成的网络骨架,使用相关性网络(CorNet)显式地学习情绪相关性。EmoBART模型由编码模块、解码模块和相关性网络模块组成。编码模块提取文本语义信息、解码模块采用生成式标签链构建情绪标签序列、相关性网络模块显式建模情绪相关性,并对情绪标签进行预测。在细粒度情绪数据集上的对比实验结果表明,EmoBART模型具有比已有模型更优的情绪识别性能。 展开更多
关键词 多标签情绪分类 序列生成模型 序列到序列 情绪相关性学习
在线阅读 下载PDF
基于主动迁移学习的负荷辨识泛化方法 被引量:1
12
作者 蔡清淮 罗庆全 +3 位作者 余涛 刘前进 刘熙鹏 潘振宁 《电力自动化设备》 北大核心 2025年第3期209-216,共8页
为实现低成本地提升负荷辨识方法对新场景负荷样本的识别精度,提出一种基于主动迁移学习的负荷辨识泛化方法,利用极少量标签数据和无标签数据来高效提升方法的泛化性能。该方法利用异构模型的共识筛选高质量的伪标注样本,并对预训练模... 为实现低成本地提升负荷辨识方法对新场景负荷样本的识别精度,提出一种基于主动迁移学习的负荷辨识泛化方法,利用极少量标签数据和无标签数据来高效提升方法的泛化性能。该方法利用异构模型的共识筛选高质量的伪标注样本,并对预训练模型进行更新;设计一种考虑模型分歧和样本多样性的主动学习策略来标注高价值样本,可在大幅降低样本标注成本的同时实现模型的高效迁移。在2个公开数据集中的实验对比,验证了所提方法的优越性。 展开更多
关键词 负荷辨识 泛化 主动学习 迁移学习 伪标注 异构模型
在线阅读 下载PDF
信息互补的锐度感知最小化的标签噪声学习
13
作者 许朝阳 吴婉晗 林耀海 《贵州大学学报(自然科学版)》 2025年第3期52-58,共7页
标签噪声在机器学习和计算机视觉应用中是一个普遍存在的问题。锐度感知最小化通过向模型参数空间中引入对抗性权重扰动,有效地提升了在噪声标签数据环境下学习模型的泛化性能。但是由于标签噪声的存在,锐度感知最小化难以在每批噪声数... 标签噪声在机器学习和计算机视觉应用中是一个普遍存在的问题。锐度感知最小化通过向模型参数空间中引入对抗性权重扰动,有效地提升了在噪声标签数据环境下学习模型的泛化性能。但是由于标签噪声的存在,锐度感知最小化难以在每批噪声数据中找到正确的对抗性扰动。为了克服这一问题,采用信息互补的锐度感知最小化结合扰动前后信息实现互补的效果,以此更好地寻找正确的扰动方向。同时为了提高扰动方向的准确性,还引入了动态阈值策略来区分噪声样本与干净样本。在CIFAR10,CIFAR100和ANIMAL-10N等多个基准数据集上的大量实验结果也证实了该方法的优越性。本方法能够在噪声标签环境下有效减少噪声对扰动方向的干扰,提高分类准确度,且具备优秀的泛化能力。 展开更多
关键词 机器学习 深度学习 神经网络 锐度感知最小化 标签噪声学习 模型泛化 扰动计算 信息互补
在线阅读 下载PDF
碳标签对中国水产品出口贸易的经济影响 被引量:1
14
作者 苏萌 吴怿凡 李蕾 《海洋经济》 2025年第3期25-33,共9页
在经济全球化和多边贸易发展的世界背景下,水产品贸易迅速增长。但是随着全球化的发展,针对我国水产品出口的保护政策也在发生改变。世界各国对全球气候变暖的关注不断增加,碳标签作为一种绿色壁垒逐渐成为发达国家限制发展中国家贸易... 在经济全球化和多边贸易发展的世界背景下,水产品贸易迅速增长。但是随着全球化的发展,针对我国水产品出口的保护政策也在发生改变。世界各国对全球气候变暖的关注不断增加,碳标签作为一种绿色壁垒逐渐成为发达国家限制发展中国家贸易进口的工具。目前,虽然发达国家尚未对中国水产品实施碳标签限制,但随着产品碳标签制度实施的国家范围和产品领域不断扩大,未来发达国家很可能对中国水产品实施碳标签,对中国水产品出口贸易产生影响。本文在绿色壁垒对出口贸易影响理论分析的基础上,对中国水产品出口隐含碳排放进行测算,从而推算水产品附加碳标签对我国水产品出口的影响。本文运用VAR模型,首先计算二氧化碳排放系数,进一步通过实证检验出口水产品隐含碳排放对水产品出口的影响。实证结果发现:碳标签对中国水产品出口贸易经济效应存在J曲线效应,在碳标签实施初期会因出口成本提高导致中国水产品出口受阻;长期来看,水产品贸易出口逐渐回升甚至增加,并且促进中国水产品出口转型升级。同时,出口隐含碳排放对于中国水产品出口额的贡献度约占25%,可以发现对水产品附加碳标签会对中国水产品出口产生一定影响。因此,根据结论针对性地提出中国水产品出口应对碳标签制度的政策建议。 展开更多
关键词 水产品出口 碳标签 贸易壁垒 水产品贸易 VAR模型
在线阅读 下载PDF
基于图提示的半监督开放词汇多标记学习 被引量:1
15
作者 李仲年 皇甫志宇 +3 位作者 杨凯杰 营鹏 孙统风 许新征 《计算机研究与发展》 北大核心 2025年第2期432-442,共11页
半监督多标记学习利用有标记数据和无标记数据进行模型的训练,降低了多标记数据的标记成本并取得了不错的结果,吸引了很多研究者不断进行研究.然而,在半监督标注过程中,由于标记的数量较多,往往会出现某些标记缺失标注样本的情况,这些... 半监督多标记学习利用有标记数据和无标记数据进行模型的训练,降低了多标记数据的标记成本并取得了不错的结果,吸引了很多研究者不断进行研究.然而,在半监督标注过程中,由于标记的数量较多,往往会出现某些标记缺失标注样本的情况,这些标记被称为开放词汇.开放词汇会导致模型无法学习到该类别的标记信息,使得模型性能下降. 针对上述问题,提出了基于图提示的半监督开放词汇多标记 学习方法. 具体地,该方法利用基于提示的图神经网络对预训练大模型进行微调,挖掘和探索开放词汇与 监督样本之间的关系. 通过使用包含图像与文本的多模态数据构造图神经网络作为预训练大模型的文本 输入进行学习. 其次利用预训练大模型在开放词汇上的泛化能力,对无监督样本生成伪标记,实现对输出 分类层的微调,使模型在对开放词汇进行分类时能获得更加理想的效果. 多个基准数据集上的实验结果 均显示,基于图提示的半监督开放词汇多标记学习方法优于目前的主流方法,在 VOC,COCO,CUB,NUS 等基准数据集上均取得了最优的效果. 展开更多
关键词 半监督多标记学习 预训练模型 图神经网络 开放词汇 提示
在线阅读 下载PDF
基于提示标签协同的关系抽取方法
16
作者 冉哲宇 陈艳平 +2 位作者 王凯 黄瑞章 秦永彬 《计算机科学与探索》 北大核心 2025年第6期1580-1587,共8页
提示学习可以将下游任务转换为预训练任务形式的掩码预测任务。然而,将提示学习应用于关系抽取任务时,由于掩码的输出是标签类别的语义向量表示,容易导致生成空间过大而对掩码语义解析度不足。针对这一问题,提出了一种基于提示标签协同... 提示学习可以将下游任务转换为预训练任务形式的掩码预测任务。然而,将提示学习应用于关系抽取任务时,由于掩码的输出是标签类别的语义向量表示,容易导致生成空间过大而对掩码语义解析度不足。针对这一问题,提出了一种基于提示标签协同的关系抽取方法。为每个关系类构建两组同义词标签。其中一组用于学习掩码表示,另一组用于强化标签语义。在掩码语言模型中引入约束层以对掩码表示进行双向约束。使得两组同义词标签间隐含差异的语义和先验知识能够融入到关系表示中。由于同义词标签是基于知识初始化的,它们在潜在变量空间中可能不是最优的,应该与周围的上下文相关联。因此,在训练过程中,同义词标签表示会与掩码共同参与优化。提出的方法能够提高模型对标签语义的认知能力,同时优化掩码表示,从而提升模型对掩码的语义解析能力。实验结果表明,该方法在标准和小样本设置的三个公共数据集上均明显优于对比方法,证明了该方法的有效性。 展开更多
关键词 提示学习 提示标签协同 掩码语言模型
在线阅读 下载PDF
基于可信伪标签微调的测试时适应算法
17
作者 李星辰 李宗民 杨超智 《图学学报》 北大核心 2025年第6期1292-1303,共12页
训练集和测试集之间的分布差距使深度学习模型在泛化方面面临挑战。通过系统分析,可发现2个亟待解决的关键问题:训练数据到测试数据的知识迁移优化不足,以及数据集中类别不均衡的影响。针对这些挑战,提出了一种新颖的测试时适应算法—... 训练集和测试集之间的分布差距使深度学习模型在泛化方面面临挑战。通过系统分析,可发现2个亟待解决的关键问题:训练数据到测试数据的知识迁移优化不足,以及数据集中类别不均衡的影响。针对这些挑战,提出了一种新颖的测试时适应算法——可信伪标签微调方法(FTP)。通过优化样本选择过程,筛选出熵值较低的测试样本构建微调数据集,并结合原训练集实现模型微调,显著提高图像分类模型在测试集上的泛化性能。在MNIST,FashionMNIST和CIFAR10数据集上进行了广泛实验,结果表明结合FTP的图像分类模型在测试集上普遍获得性能提升,准确率最高提升约3%,F1分数相应提高,且优于TENT,COTTA,EATA和OSTTA等当前常用测试时适应方法。此外,基于梯度的可视化分析证明,经FTP微调的模型在保持高预测准确性的同时,依然维持了良好的可解释性,为实际应用提供了可靠保障。 展开更多
关键词 深度学习 测试时适应 可信伪标签 模型微调
在线阅读 下载PDF
基于思维链和语义解耦的层次化主题模型
18
作者 王志华 李旸 +1 位作者 李德玉 王素格 《模式识别与人工智能》 北大核心 2025年第7期613-626,共14页
层次主题模型可以挖掘文档中的隐含主题,建模主题间的层次结构关系,为数据治理、信息检索、内容分类和知识管理等应用提供技术支持.文中提出基于思维链和语义解耦的层次化主题模型.首先,建立基于思维链的层次主题生成模块,设计层次化主... 层次主题模型可以挖掘文档中的隐含主题,建模主题间的层次结构关系,为数据治理、信息检索、内容分类和知识管理等应用提供技术支持.文中提出基于思维链和语义解耦的层次化主题模型.首先,建立基于思维链的层次主题生成模块,设计层次化主题生成思维链,指导大语言模型(Large Language Model,LLM)生成初步的主题层次结构.然后,引入基于LLM的主题相似判别机制,生成精炼的主题,并利用样例指导LLM实现主题合并,提升生成主题的质量.最后,建立基于传输规划和语义解耦的主题层次优化模块,将初始层次主题结构作为下游建模的主题先验,构建主题关键词、文档主题分布和主题距离,并将主题层次关系建模为最优运输问题,结合上下层主题关键词进行父子主题解耦,优化主题层次结构.在NeurIPS、ACL、20 Newsgroups等涵盖新闻与学术论文的多个标准公开数据集上的实验表明,文中模型在主题质量指标和层次化指标上均取得较优值. 展开更多
关键词 层次主题模型 标签自动生成 思维链 大语言模型(LLM) 提示学习 语义解耦
在线阅读 下载PDF
基于岩石物理模型正演的标签制作方法在深度学习波阻抗预测中的应用
19
作者 赵昭阳 赵建国 +3 位作者 欧阳芳 肖增佳 马铭 闫博鸿 《地球物理学报》 北大核心 2025年第9期3554-3574,共21页
深度学习波阻抗预测已成为油气勘探领域的重要课题,因测井数据有限,导致可用于神经网络训练的标签数量明显不足.为此,本文采用理论岩石物理模型道集正演的方法来获得训练标签,该方法使得利用单口井数据进行深度学习储层参数反演成为可能... 深度学习波阻抗预测已成为油气勘探领域的重要课题,因测井数据有限,导致可用于神经网络训练的标签数量明显不足.为此,本文采用理论岩石物理模型道集正演的方法来获得训练标签,该方法使得利用单口井数据进行深度学习储层参数反演成为可能.通过理论岩石物理模型流体替换和波动方程正演,获得与实际工区岩石物理参数一致的变孔隙度和饱和度的训练标签.为了提高模型的泛化度和精确性,实验使用逐步回归法在20多种地震属性中优选出9种最优的地震属性组合.将这9种地震属性组合和对应的测井波阻抗数据带入到深度神经网络(DNN)中进行训练,准确地预测出波阻抗,预测波阻抗与实际波阻抗的互相关系数达到了0.992,平均误差为304(m·s^(-1))·(g·cm^(-3)).在三维实际地震工区的应用中,使用该方法预测了研究工区的纵、横波阻抗和密度结果,通过建立地层模型,反演地层模型参数,反演结果显示,深度学习反演方法的预测精度比传统反演方法预测精度高,因此更有利于对薄层的识别. 展开更多
关键词 岩石物理模型 模型正演 标签制作 深度神经网络 波阻抗反演
在线阅读 下载PDF
基于精细异质信息网络表示学习的文献推荐研究
20
作者 李琳娜 郭晓琪 +2 位作者 张运良 王力 张晓丹 《数字图书馆论坛》 2025年第5期11-19,共9页
目前针对异质信息网络的文献推荐主要基于已有的文献间引用、共同作者、同期刊发表等信息构建文献之间的关联关系,没有从文献的研究问题、方法模型等研究人员更关心的文献细粒度内容角度构建文献间关系,不能将这些细粒度的关联关系融入... 目前针对异质信息网络的文献推荐主要基于已有的文献间引用、共同作者、同期刊发表等信息构建文献之间的关联关系,没有从文献的研究问题、方法模型等研究人员更关心的文献细粒度内容角度构建文献间关系,不能将这些细粒度的关联关系融入文献推荐过程,从而影响最终的推荐效果。将文献的研究问题、方法模型两类细粒度标签加入学术信息网络,并提出了文献推荐模型PRM-FHIN,通过对异质信息网络表示学习方法HECO进行优化学习网络节点的结构向量,通过对SciBERT模型进行微调学习网络节点的内容向量,基于融合的内容向量和结构向量实现最终的文献推荐。从开放学术图谱中抽取2010—2020年计算机科学领域的185万篇论文作为实验数据,实验结果表明:优化后的HECO算法能更好地对网络节点进行嵌入式表示,在异质信息网络中融入研究问题和方法模型等细粒度标签可以丰富文献之间的语义信息,从而提高最终的文献推荐效果。 展开更多
关键词 精细异质信息网络 异质信息网络表示学习 文献推荐 细粒度标签 计算机科学 研究问题 方法模型
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部