-
题名基于TNG特征扩展的MLFM-MN短文本分类算法
被引量:1
- 1
-
-
作者
文武
李培强
郭有庆
-
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第11期2071-2078,共8页
-
文摘
在海量短文本中由于特征稀疏、数据维度高这一问题,传统的文本分类方法在分类速度和准确率上达不到理想的效果。针对这一问题提出了一种基于Topic N-Gram(TNG)特征扩展的多级模糊最小-最大神经网络(MLFM-MN)短文本分类算法。首先通过使用改进的TNG模型构建一个特征扩展库并对特征进行扩展,该扩展库不仅可以推断单词分布,还可以推断每个主题文本的短语分布;然后根据短文本中的原始特征,计算这些文本的主题倾向,根据主题倾向,从特征扩展库中选择适当的候选词和短语,并将这些候选词和短语放入原始文本中;最后运用MLFM-MN算法对这些扩展的原始文本对象进行分类,并使用精确率、召回率和F1分数来评估分类效果。实验结果表明,本文提出的新型分类算法能够显著提高文本的分类性能。
-
关键词
特征稀疏
tng模型
模糊神经网络
扩展库
主题倾向
-
Keywords
sparse feature
tng model
fuzzy neural network
extension library
topic tendency
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名林业复杂场景下“双碳”颠覆性技术主题识别
- 2
-
-
作者
安欣
杨禄鑫
徐硕
刘迪航
-
机构
北京林业大学经济管理学院
北京工业大学经济与管理学院
-
出处
《北京林业大学学报》
北大核心
2025年第12期12-25,共14页
-
基金
国家社会科学基金项目(24BTQ066)。
-
文摘
【目的】颠覆性技术是“双碳”战略下林业自主控碳范式构建、绿色技术主导权竞争的关键变量,其识别与培育对推动传统林业向自主控碳转型具有重要现实价值与深远战略意义。本文以精准识别“双碳”领域颠覆性技术为目标,构建系统化识别体系,比较分析单源数据与多源异构数据在技术主题抽取中的适用性,旨在为林业自主控碳等复杂场景下的关键技术挖掘提供可复制、可推广的方法框架,为自主控碳技术清单构建提供支撑。【方法】围绕颠覆性技术特征改进现有测度指标体系,采用兼顾单源数据与多源异构数据的TNG模型抽取技术主题,计算主题颠覆性指数。结合支撑“双碳”目标的林业(以下简称“林业双碳”)领域知识背景,按“源头减排”“末端治理”两大技术路径,对识别出的颠覆性技术进行分类解读与深入分析。【结果】经第三方资料对比验证,本文构建的方法识别效果良好,且多源异构数据融合的识别效果显著优于单源数据。在林业双碳领域,成功识别出核心技术主题——源头减排类(综合能源系统、智能配电网、生物质能减排)、末端治理类(森林土壤固碳技术、热反应二氧化碳捕获、离子液体−碳吸附、复合材料电催化剂制备),覆盖碳减排−碳捕集−碳利用−碳固存全链条,支撑自主控碳林业技术体系构建。【结论】本文提出的识别体系在颠覆性技术挖掘中表现出良好的适用性和稳定性,不仅为林业双碳领域“自主控碳转型”提供了精准的技术识别路径与核心技术清单,也为该方法在其他复杂领域的迁移应用提供了理论基础与实践依据。
-
关键词
主题识别
颠覆性技术
多源异构数据
tng模型
颠覆性指数
“双碳”
自主控碳
-
Keywords
topic identification
disruptive technology
multi-source heterogeneous data
tng model
disruptive index
“Dual Carbon”
independent carbon control
-
分类号
S718.56
[农业科学—林学]
G354.4
[文化科学—情报学]
-