期刊文献+
共找到128篇文章
< 1 2 7 >
每页显示 20 50 100
基于LDA-Word2vec的冷链物流政策的央地协同量化分析
1
作者 甘卫华 凌耀琛 +1 位作者 吴素浓 熊奥诗 《兰州交通大学学报》 2025年第4期9-20,共12页
自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LD... 自2008年以来,为推动冷链物流健康快速发展,国家及各省市出台了一系列冷链物流政策,这些政策的效果直接影响各地冷链物流的投资热度和运营质量。基于政策工具理论,以中央和地方(下文简称“央地”)出台的冷链物流政策作为研究对象,引入LDA主题模型和Word2vec词嵌入算法,进行政策文本的主题归纳分析、地域性差异分析、时序差异分析和央地协同性分析。研究结果表明:1) 2008-2023年研究期内,冷链物流政策主要聚焦“冷链物流行业的标准化”、“专项支持资金打造农产品冷链物流体系”、“多策并举落地冷链物流项目”、“构建绿色高效冷链供应链新模式”等四个主题;2)研究期内,冷链物流规范性政策文本具有时序阶段性特征,可分为萌芽期、增长期和稳健期,且各阶段主题强度不同,保证冷链物流的均衡发展;3)冷链物流规范性政策文本具有区域多样性,各地区对冷链侧重点存在差异,因地制宜制定冷链物流政策;4)华东城市群的冷链物流政策的央地协同性高于其他地区,且政策主题较为丰富,不仅响应中央政策要求,也适应各地区发展。 展开更多
关键词 冷链物流 政策协同 lda主题模型 Word2vec词嵌入算法
在线阅读 下载PDF
基于LDA2vec的数字图书馆信息资源共享研究
2
作者 王芳 《长江信息通信》 2025年第8期123-125,共3页
数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用... 数字图书馆信息资源自身主题构成多元,导致直接匹配共享请求时,反馈准确性低。对此,开展基于LDA2vec的数字图书馆信息资源共享研究。利用word2vec词向量在特定窗口大小训练原始数字图书馆信息资源文档,输出文本字符串形式信息资源;利用LDA输出包含主题document向量,求和计算得到转化后的信息资源。在数据共享请求的属性集中搜索与转化资源包含主题一致的属性,利用拉格朗日插值算法计算满足条件共享请求属性拟合阈值信息,输出多项式形式共享请求反馈结果。在结果中,设计方法在对测试样本信息资源向量化转化基础上,对共享请求反馈输出结果完整性高于88.0%,准确性在高于92.0%。 展开更多
关键词 lda2vec 数字图书馆 信息资源共享 word2vec lda 拉格朗日插值算法
在线阅读 下载PDF
基于无监督文本特征的隐含主题自动抽取方法
3
作者 包永红 《现代电子技术》 北大核心 2026年第4期42-46,共5页
文本数据中蕴含着丰富的信息,但这些信息往往以隐含的方式存在,不易被直接观察或理解。目前传统的监督学习方法需要大量的人工标注数据来训练模型,易受标注者的主观性影响,为解决该问题,提出一种基于无监督文本特征的隐含主题自动抽取... 文本数据中蕴含着丰富的信息,但这些信息往往以隐含的方式存在,不易被直接观察或理解。目前传统的监督学习方法需要大量的人工标注数据来训练模型,易受标注者的主观性影响,为解决该问题,提出一种基于无监督文本特征的隐含主题自动抽取方法。利用双向最大匹配法对文本进行分词后,去除其中的停用词,完成文本预处理工作;采用无监督TF-IDF算法提取预处理后文本的特征,再将文本数据转换为数值型特征向量,构建词特征向量集;引入LDA模型自动抽取隐含主题,即构建词特征向量中词汇对应隐含主题的概率分布模型,并利用Gibbs快速抽样法获取模型超参数,得到隐含主题概率分布,进而依据该分布结果实现文本隐含主题的自动抽取。实验结果表明,所提方法在应用过程中的F1值高于0.93,困惑度低于0.6,能够精准地抽取文本中的隐含主题。 展开更多
关键词 隐含主题 自动抽取 文本特征 无监督TF-IDF算法 lda模型 Gibbs快速抽样法
在线阅读 下载PDF
基于粒子群算法的LDA实现方法研究 被引量:8
4
作者 钟伟 黄元亮 +1 位作者 郝真真 姜甜甜 《计算机工程与应用》 CSCD 北大核心 2017年第1期39-43,共5页
针对传统线性判别分析方法存在的问题,在研究现有理论成果的基础上,提出一种新的LDA实现方法。该方法首先对原有的Fisher准则进行修正,然后通过迭代搜寻最佳鉴别矢量,最后对获取的鉴别矢量进行比较分析。在标准的JAFFE人脸库上的表情识... 针对传统线性判别分析方法存在的问题,在研究现有理论成果的基础上,提出一种新的LDA实现方法。该方法首先对原有的Fisher准则进行修正,然后通过迭代搜寻最佳鉴别矢量,最后对获取的鉴别矢量进行比较分析。在标准的JAFFE人脸库上的表情识别和地区综合消费水平的评价中的实验结果表明,此算法不仅具有良好的识别效果而且还可以突破样本维数的限制;与其他LDA算法相比,该算法更具灵活性且更易于实现。 展开更多
关键词 线性判别式分析 投影矢量 离散度矩阵 粒子群算法 PSO-lda算法
在线阅读 下载PDF
PCA-LDA算法在性别鉴别中的应用 被引量:19
5
作者 何国辉 甘俊英 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期208-210,213,共4页
结合主元分析(Principal Components Analysis,PCA)与线性鉴别分析(Linear Discriminant Analysis,LDA)的特点,提出用于性别鉴别的PCA-LDA算法。该算法通过PCA算法求得训练样本的特征子空间,并在此基础上计算LDA算法的特征子空间。将PC... 结合主元分析(Principal Components Analysis,PCA)与线性鉴别分析(Linear Discriminant Analysis,LDA)的特点,提出用于性别鉴别的PCA-LDA算法。该算法通过PCA算法求得训练样本的特征子空间,并在此基础上计算LDA算法的特征子空间。将PCA算法与LDA算法的特征子空间进行融合,获得PCA-LDA算法的融合特征空间。训练样本与测试样本分别朝融合特征空间投影,从而得到识别特征。利用最近邻准则即可完成性别鉴别。基于ORL(Olivetti Research Laboratory)人脸数据库的实验结果表明,PCA-LDA算法比PCA算法识别性能好,在性别鉴别中是一种有效的方法。 展开更多
关键词 性别鉴别 PCA-lda算法 融合算法
在线阅读 下载PDF
基于词加权LDA算法的无监督情感分类 被引量:5
6
作者 郝洁 谢珺 +2 位作者 苏婧琼 续欣莹 韩晓霞 《智能系统学报》 CSCD 北大核心 2016年第4期539-545,共7页
主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和... 主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST(Joint Sentiment/Topic model)模型相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。 展开更多
关键词 情感分类 主题情感混合模型 主题模型 lda 加权算法
在线阅读 下载PDF
网络食品安全问题话题发现的LDA-K-means算法 被引量:8
7
作者 刘金硕 彭映月 +2 位作者 章岚昕 陈煜森 邓娟 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2017年第2期307-310,共4页
提出一种基于LDA模型的K-means聚类的话题发现,并在网络食品安全问题中进行效果验证.该算法中使用LDA模型对文档空间建模,并选取文档对主题的概率分布作为每篇文档的向量,利用K-means算法对这些向量进行聚类处理,最终得到话题发现的结果... 提出一种基于LDA模型的K-means聚类的话题发现,并在网络食品安全问题中进行效果验证.该算法中使用LDA模型对文档空间建模,并选取文档对主题的概率分布作为每篇文档的向量,利用K-means算法对这些向量进行聚类处理,最终得到话题发现的结果.为了验证试验的效果,还进行了1组使用传统的VSM模型下的Kmeans算法的实验作为对照组.通过在涵盖43个食品安全分类的1 920条新闻报道和腾讯微博的数据上的实验,记录了6个不同迭代次数下的结果并得到平均值,实验结果表明该方法在3个评估指标P、R、F上都比传统方法提高了20%. 展开更多
关键词 食品安全 话题发现 lda K-MEANS
原文传递
基于LDA的煤矿安全隐患主题发现研究 被引量:21
8
作者 谭章禄 王泽 陈晓 《中国安全科学学报》 CAS CSCD 北大核心 2016年第6期123-128,共6页
为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,... 为提高安全管理者对安全隐患数据的理解和认知水平,增强其隐患排查和治理能力,以潞安集团司马煤业有限公司2014年安全隐患记录为数据源,基于潜在狄利克雷分配模型(LDA)挖掘煤矿安全隐患主题。利用R软件进行主题模型参数估计、模型计算,最终优选出14个安全隐患主题;采用桑基图揭示隐患主题与责任主体、隐患致因之间的关系。结果表明:LDA主题模型能较好揭示煤矿安全隐患数据中的潜在规律,为煤矿隐患排查、隐患治理以及安全管理决策提供重要信息。 展开更多
关键词 煤矿隐患 潜在狄利克雷分配模型(lda) Gibbs抽样算法 词云 桑基图
原文传递
基于LDA-SVM分类算法的技术融合测度研究 被引量:13
9
作者 苗红 赵润博 +1 位作者 黄鲁成 娄岩 《科学学与科学技术管理》 CSSCI CSCD 北大核心 2018年第10期13-29,共17页
技术融合是实现技术创新的主要途径之一。技术融合测度可以识别融合过程中发挥关键作用的技术,对于引导创新主体确立研发路径起着重要作用。针对大数据背景下研究效率不高、粒度较粗以及精准性差的问题,引入机器学习领域的LDA—SVM分类... 技术融合是实现技术创新的主要途径之一。技术融合测度可以识别融合过程中发挥关键作用的技术,对于引导创新主体确立研发路径起着重要作用。针对大数据背景下研究效率不高、粒度较粗以及精准性差的问题,引入机器学习领域的LDA—SVM分类算法,通过LDA从专利中提取主题特征,并结合SVM分类器进行技术分类,筛选出融合特征较强的专利子数据集;在此基础上,选用融合度指标和中介中心性指标进行测算专利子集中技术的融合程度和识别融合过程中的关键技术。以智能手机为例,选取电池、微处理器、相机和触屏4类技术,运用LDA-SVM算法筛选出具有多类技术特征的专利数据,并通过2个指标的测算,识别出智能手机领域的W01-C01G8(功能电话和智能手机)与W01-C01P2(个人数字助理)融合度最高;微处理器技术中W01-C01Q6A(图形和显示处理技术)、相机技术的W01-C01P6C(数码相机)、W04-M01B1(电子静态相机)和电池技术中的W01-C01E5B(电池省电供电技术)等均是融合过程中的关键技术。 展开更多
关键词 技术融合 lda-SVM分类算法 机器学习 中介中心性 专利共类分析
原文传递
基于LDA模型的多角度个性化微博推荐算法 被引量:11
10
作者 孙玉洁 秦永彬 《计算机工程》 CAS CSCD 北大核心 2017年第4期177-182,共6页
通过基于概率的主题挖掘模型隐含狄利克雷分布(LDA)挖掘用户兴趣主题,是目前最常用的用户兴趣主题挖掘方法。为进一步改善用户体验,推荐其感兴趣且质量好、新鲜度高的微博,提出一种新的多角度个性化微博推荐算法。通过微博发布时间、转... 通过基于概率的主题挖掘模型隐含狄利克雷分布(LDA)挖掘用户兴趣主题,是目前最常用的用户兴趣主题挖掘方法。为进一步改善用户体验,推荐其感兴趣且质量好、新鲜度高的微博,提出一种新的多角度个性化微博推荐算法。通过微博发布时间、转发数、评论数等特征计算微博重要度,利用LDA模型生成的用户-主题矩阵以及主题-词汇矩阵计算用户对微博的兴趣度,综合考虑微博本身的重要度以及用户对微博的兴趣度对微博进行评分,根据评分结果推荐微博。实验结果表明,该算法与主题模型相结合可有效够提高微博推荐的精准度。 展开更多
关键词 微博 个性化推荐 隐含狄利克雷分布模型 推荐算法 评分预测 Top-N推荐
在线阅读 下载PDF
基于LDA与混沌粒子群算法的车道线识别方法研究 被引量:4
11
作者 黄新 刘璋 《液晶与显示》 CAS CSCD 北大核心 2017年第6期491-498,共8页
与传统的车道线检测算法不同,本文采用LDA算法对道路图像进行针对性灰度化处理。加大车道线与道路的差异,然后使用抛物线模型对车道线进行拟合,采用混沌粒子群算法对抛物线参数进行优化,以车道线的灰度特征和梯度特征作为混沌粒子群的... 与传统的车道线检测算法不同,本文采用LDA算法对道路图像进行针对性灰度化处理。加大车道线与道路的差异,然后使用抛物线模型对车道线进行拟合,采用混沌粒子群算法对抛物线参数进行优化,以车道线的灰度特征和梯度特征作为混沌粒子群的适应度函数,经过多次的迭代得到抛物线拟合车道线的参数最优值,进而识别出车道线。实验结果表明,本文算法能在复杂环境下识别出车道线,对视频帧序列中的车道线连续追踪具有良好效果。 展开更多
关键词 车道线检测 lda 混沌粒子群算法 抛物线拟合
在线阅读 下载PDF
基于LDA模型和AP聚类的主题演化分析 被引量:7
12
作者 倪丽萍 刘小军 马驰宇 《计算机技术与发展》 2016年第12期6-11,共6页
随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管... 随着互联网的高速发展,网络信息呈现爆炸性增长态势,主题演化分析能够帮助人们从海量的互联网数据中获取更有价值的信息。分析主题的演化发展轨迹有利于人们了解主题事件发生的前因后果,并对主题事件发展趋势进行更好地预测,进而辅助管控。针对单个主题演化分析方法中阈值设定和主题漂移的问题,提出一种LDA-AP主题演化模型。该方法利用LDA模型对不同时间窗口内的新闻文本分别进行建模,得到相应的主题。利用AP聚类算法对不同时间窗口内的多个主题进行聚类,其中计算主题相似度采用加入时间衰减因子的JS散度来度量。最后对多个主题内容进行演化分析。通过相关的实验分析和对比,结果表明该方法可以改善主题演化的性能,并能较好地分析多个新闻主题事件随时间的演化趋势。 展开更多
关键词 多主题演化 时间窗口 lda模型 AP聚类算法 JS散度
在线阅读 下载PDF
一种新的基于LDA-MURE模型的音乐个性化推荐算法 被引量:4
13
作者 李艳 李葆华 王金环 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2017年第2期371-375,共5页
针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音... 针对基于音乐作品信息的音乐作品个性化推荐及协同过滤方法的不足,通过分析音乐作品需求者的音乐试听数据及下载数据,并结合LDA(latent Dirichlet allocation)主题挖掘模型,提出一种基于LDA-MURE模型的推荐算法.实验结果表明,与基于音乐作品需求者的协同过滤算法和基于音乐属性项目的协同过滤算法相比,LDA-MURE算法可更高效地向音乐作品需求者推荐感兴趣的音乐作品. 展开更多
关键词 协同过滤 lda模型 GIBBS抽样 lda-MURE模型 推荐算法
在线阅读 下载PDF
基于改进LDA和K-means算法的主题句聚类 被引量:4
14
作者 刘子平 李学明 《计算机应用》 CSCD 北大核心 2016年第A02期239-241,250,共4页
针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集... 针对隐含狄利克雷分布(LDA)主题个数的随机选定和传统K-means算法初始聚类中心选择的随机性等缺陷,提出一种新颖启发式的主题句聚类方法。该方法利用文档集聚类簇数与拆分为句子集中隐藏的主题数目一致特点,先通过层次聚类分析出文档集聚类簇,采用最小描述长度(MDL)剪枝算法来确定最佳聚类数n个,然后将n作为隐含狄利克雷分布的主题数目的先验参数,计算n个主题所在维度上的重要句子作为初始聚类中心,最终完成隐含主题句聚类。实验结果表明改进后聚类算法克服了噪声数据的干扰,避免了主题数的经验误差,聚类结果更精确。 展开更多
关键词 潜在狄立克雷分布 K-MEANS算法 最小描述长度算法 句子聚类
在线阅读 下载PDF
基于PCA和LDA算法的人脸识别考勤管理系统的设计 被引量:4
15
作者 石红姣 《自动化与仪器仪表》 2018年第9期114-116,120,共4页
首先分析探讨了PCA算法以及LDA算法,针对所存在的问题提出了结合两种算法的人脸识别方法,并在在MATLAB中的实现。在此基础上,本文进一步将该方法融入到考勤管理系统中,以此提出人脸识别考勤管理系统的设计方案,包括系统总体架构设计、... 首先分析探讨了PCA算法以及LDA算法,针对所存在的问题提出了结合两种算法的人脸识别方法,并在在MATLAB中的实现。在此基础上,本文进一步将该方法融入到考勤管理系统中,以此提出人脸识别考勤管理系统的设计方案,包括系统总体架构设计、功能模块设计以及数据库设计等。最后通过系统测试证明,本文所设计的基于PCA和LDA算法的人脸识别考勤管理系统,能够对不同光线、角度等情况下的人脸信息进行有效识别,达到了预期的设计要求。 展开更多
关键词 PCA算法 lda算法 人脸识别 考勤管理
原文传递
基于LDA模型的专利信息聚类技术 被引量:22
16
作者 范宇 符红光 文奕 《计算机应用》 CSCD 北大核心 2013年第A01期87-89,93,共4页
针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高... 针对传统专利情报采集的方式不能适应专利信息快速增加的问题,通过研究适用于专利信息聚类的主题模型和聚类算法,提出了将潜在狄利克雷分配(LDA)主题模型和OPTICS算法相结合的解决方案。该方案采用LDA主题模型将专利信息在词汇空间的高维表达转换到在主题空间的低维表达,高效地实现了对专利信息的降维,进而采用OPTICS算法及k近邻准则对专利信息进行聚类分析,达到收集感兴趣的专利情报信息的目的。理论分析和实验验证表明,提出的解决方案不仅能通过降维,提高专利聚类效率,而且能对专利信息分析提供帮助。 展开更多
关键词 潜在狄利克雷分配主题模型 聚类分析 OPTICS算法 专利信息聚类 专利分析
在线阅读 下载PDF
基于LDA主题模型的标签传递算法 被引量:5
17
作者 刘培奇 孙捷焓 《计算机应用》 CSCD 北大核心 2012年第2期403-406,410,共5页
标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基... 标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对LDA主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于LDA主题模型的标签传递算法LPLDA。该算法用LDA主题模型中的主题表示文本数据,一方面使用LDA主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。 展开更多
关键词 lda主题模型 标签传递算法 半监督学习 数据降维 流行假设
在线阅读 下载PDF
一种基于LDAO的唇读特征提取算法
18
作者 何俊 李赣平 《计算机应用研究》 CSCD 北大核心 2013年第1期288-290,294,共4页
在语音与唇读识别应用中,传统的LDA(linear discriminant analysis)算法一般以音节、半音节、HMM状态等基元为类别进行数据分段,经线性判别分析后获得的特征投影方向与识别率不直接相关,影响了识别率。提出了一种新的基于LDAO(linear di... 在语音与唇读识别应用中,传统的LDA(linear discriminant analysis)算法一般以音节、半音节、HMM状态等基元为类别进行数据分段,经线性判别分析后获得的特征投影方向与识别率不直接相关,影响了识别率。提出了一种新的基于LDAO(linear discriminant analysis based on object)的唇读特征提取算法,该算法以待识别对象为类别进行线性判别分析,在理论上保证了唇读特征矢量向最具判别能力的方向投影。基于唇读数据库的实验证明,该算法明显优于现有各种唇读特征提取算法,比DCT+LDA算法识别率提高了3%。 展开更多
关键词 唇读 特征提取 线性判别分析算法 基于对象的线性判别分析算法
在线阅读 下载PDF
基于LDA的隐式标签协同过滤推荐算法 被引量:2
19
作者 文勇军 何环晶 唐立军 《计算机与现代化》 2022年第3期53-58,69,共7页
固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型... 固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型生成项目文本的隐式标签,得到项目-标签特征权重,根据算法性能优化的要求选择标签数量,将项目-标签矩阵与用户评分矩阵结合得到用户对标签的偏好矩阵,最后通过协同过滤算法产生推荐。实验结果表明,本文提出的基于LDA的隐式标签协同过滤推荐算法缓解了数据稀疏性问题,项目推荐的召回率、准确度和F1值有较大提升。 展开更多
关键词 固定标签 协同过滤 lda主题模型 隐式标签 算法改进
在线阅读 下载PDF
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现 被引量:4
20
作者 刘爱琴 郭少鹏 张卓星 《国家图书馆学刊》 CSSCI 北大核心 2023年第5期84-92,共9页
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost... 互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。 展开更多
关键词 隐含狄利克雷分布(lda) 文本自动分类 SVM算法 Catboost算法
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部