期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种基于DA_FASTTEXT的文档分类研究
1
作者 王栋平 穆宁 +1 位作者 王峥 张晓燕 《价值工程》 2025年第6期145-147,共3页
传统文档分类系统都是基于文档的词属性,利用庞大的词典支持和复杂的切词处理实现文档分类,导致很难兼顾分类准确性和分类速度。本文研究基于FASTTEXT算法的中文文档分类,使中文文档分类在保证分类准确性的同时还降低了时间开销,同时利... 传统文档分类系统都是基于文档的词属性,利用庞大的词典支持和复杂的切词处理实现文档分类,导致很难兼顾分类准确性和分类速度。本文研究基于FASTTEXT算法的中文文档分类,使中文文档分类在保证分类准确性的同时还降低了时间开销,同时利用蜻蜓优化算法(DA)实现FASTTEXT参数优化,解决FASTTEXT算法参数过多、模型效果依赖于参数值的设定优化问题。本文提出了DA_FASTTEXT分类方法,实现了一个基于DA_FASTTEXT分类方法的中文文档分类系统。测试结果表明其具有更优的分类准确性和分类速度综合性能。 展开更多
关键词 文档分类 蜻蜓优化算法(DA) 参数优化 fasttext算法
在线阅读 下载PDF
基于fastText算法的行业分类技术 被引量:6
2
作者 吴震 冉晓燕 +3 位作者 苗权 刘纯艳 张栋 魏娜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期193-198,共6页
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行... 随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行分词和权重计算。然后,构建分类器模型,实现中文行业的自动分类。最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KNN等分类算法,取得了较好的应用效果。 展开更多
关键词 自然语言处理 行业分类 fasttext算法 关键词 语法模型
原文传递
基于SIF-Fasttext算法的应急预案快速生成 被引量:5
3
作者 刘彤 陈思源 倪维健 《中国科技论文》 CAS 北大核心 2020年第11期1270-1276,共7页
针对非常规突发事件应急决策复杂性问题,提出一种基于SIF-Fasttext算法计算应急预案相似度的预案生成框架。利用可扩展标记语言(eXtensible markup language,XML)统一表示半结构化应急预案,提取新的突发事件问题描述;优先计算同类型应... 针对非常规突发事件应急决策复杂性问题,提出一种基于SIF-Fasttext算法计算应急预案相似度的预案生成框架。利用可扩展标记语言(eXtensible markup language,XML)统一表示半结构化应急预案,提取新的突发事件问题描述;优先计算同类型应急预案相似度高的各部分章节内容,生成符合该新突发事件的半结构化应急预案;依据应急预案评价指标体系,运用层次分析法评估生成的应急预案。实验结果表明,所提方法能以最短的时间生成针对性的应急预案,提高决策效率,使应急决策者做出有效的应急措施。 展开更多
关键词 文字信息处理 SIF-fasttext算法 应急预案 相似度 层次分析法
在线阅读 下载PDF
基于fasttext实现船舶工况点分类系统研究
4
作者 陈浩天 刘晓东 《电子设计工程》 2023年第2期72-76,共5页
为了达到节省船舶领域对比工作消耗的时间与人力资源成本,文中对常用的文本分类算法进行分析比较,有针对性地对分类算法做出在船舶领域的创新。改进传统特征提取算法(TF-IDF算法),使得权重提取更加合理,改进fasttext分类算法,解决输入... 为了达到节省船舶领域对比工作消耗的时间与人力资源成本,文中对常用的文本分类算法进行分析比较,有针对性地对分类算法做出在船舶领域的创新。改进传统特征提取算法(TF-IDF算法),使得权重提取更加合理,改进fasttext分类算法,解决输入层参数的输入问题,提出改进后的C-fasttext算法。通过实验,将C-fasttext算法模型分类效果和朴素贝叶斯算法、支持向量机算法和传统fasttext模型进行对比。结果表明,改进C-fasttext算法准确率最高,为91.59%;传统的fasttext分类算法的准确率为88.27%;支持向量机算法处在较低水平,准确率只有59.98%;朴素贝叶斯方法在准确率上为76.19%。改进算法的匹配准确率超过90%,语料覆盖率超过95%,满足实验需求。 展开更多
关键词 自然语言处理 fasttext算法 TF-IDF算法 自动匹配
在线阅读 下载PDF
基于fastText的恶意域名分类方法 被引量:3
5
作者 姜天 匡立伟 《电子设计工程》 2021年第17期35-39,44,共6页
对于使用域名生成算法生成的恶意域名,传统方法依靠机器学习模型,通过分析字符的统计特征来达到分类和识别恶意域名的目的。然而,机器学习算法通常需要复杂的特征工程,其中特征构建的结果决定了最终模型的性能,因此传统方法难以实现恶... 对于使用域名生成算法生成的恶意域名,传统方法依靠机器学习模型,通过分析字符的统计特征来达到分类和识别恶意域名的目的。然而,机器学习算法通常需要复杂的特征工程,其中特征构建的结果决定了最终模型的性能,因此传统方法难以实现恶意域名的准确检测。鉴于此,提出一种基于fastText模型的恶意域名识别方法,通过预处理和词嵌入将构成域名的独立字符转化为多维词向量,经过隐藏层对词向量进行叠加平均,通过输出层输出特定的目标类别。实验结果表明,该方法能够实现恶意域名的准确分类与检测。 展开更多
关键词 域名生成算法 fasttext 词嵌入 准确分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部