期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
一种基于FastText-Transformer的微博作者身份识别
1
作者 蔡满春 陈政 何泉 《中国人民公安大学学报(自然科学版)》 2025年第1期54-59,共6页
随着网络文本的快速增长和社交媒体的普及,识别文本作者身份的需求日益增加,对来源追溯、网络安全以及社会管理等领域具有重要意义。而针对自媒体庞大且语义灵活的中文网络短文本作者身份识别仍然存在很大挑战。为实现自动化特征提取,... 随着网络文本的快速增长和社交媒体的普及,识别文本作者身份的需求日益增加,对来源追溯、网络安全以及社会管理等领域具有重要意义。而针对自媒体庞大且语义灵活的中文网络短文本作者身份识别仍然存在很大挑战。为实现自动化特征提取,提高识别准确率,通过基于深度学习框架和改进FastText模型,提升词向量表示质量,将FastText模型输出的词向量输入到改进的Transformer Encoder模型中,提升了分类质量。实验结果表明提出的算法模型对微博数据集文本作者身份识别准确率达92.3%,可以实现微博作者身份识别。 展开更多
关键词 作者识别 fasttext模型 Transformer模型
在线阅读 下载PDF
基于FastText模型和LCS匹配算法的虚端子自动关联方法 被引量:1
2
作者 王树刚 郭涛 +3 位作者 朱超 王中秋 何茂慧 戴晨蓉 《电力信息与通信技术》 2025年第4期70-76,共7页
虚端子自动关联技术是数字化变电站虚回路建立的关键一环,对系统安全运行尤为重要。现行的虚端子手动关联方式存在明显的效率低下问题,关联方法的限制也会导致虚端子识别效率低、准确性不高等问题,文章利用FastText模型对虚端子信息进... 虚端子自动关联技术是数字化变电站虚回路建立的关键一环,对系统安全运行尤为重要。现行的虚端子手动关联方式存在明显的效率低下问题,关联方法的限制也会导致虚端子识别效率低、准确性不高等问题,文章利用FastText模型对虚端子信息进行编码,将其映射到高维向量空间,可以实现对虚端子描述文件中关键特征的提取,以便提高后续匹配工作的效率;引入最长公共子序列(longest common subsequence,LCS)算法能够比较编码后的虚端子信息并找出最佳匹配对应关系。通过校验和修正匹配结果,确保关联的准确性,在实际变电站数据集上的算例验证表明,FastText模型的文本表示能力和LCS算法的字符串匹配优势有效提高了虚端子自动关联的准确率和计算效率,可为发展变电站的数字化改造技术提供参考。 展开更多
关键词 变电站数字化 虚端子 自动关联 fasttext模型 最长公共子序列匹配
在线阅读 下载PDF
一种基于DA_FASTTEXT的文档分类研究
3
作者 王栋平 穆宁 +1 位作者 王峥 张晓燕 《价值工程》 2025年第6期145-147,共3页
传统文档分类系统都是基于文档的词属性,利用庞大的词典支持和复杂的切词处理实现文档分类,导致很难兼顾分类准确性和分类速度。本文研究基于FASTTEXT算法的中文文档分类,使中文文档分类在保证分类准确性的同时还降低了时间开销,同时利... 传统文档分类系统都是基于文档的词属性,利用庞大的词典支持和复杂的切词处理实现文档分类,导致很难兼顾分类准确性和分类速度。本文研究基于FASTTEXT算法的中文文档分类,使中文文档分类在保证分类准确性的同时还降低了时间开销,同时利用蜻蜓优化算法(DA)实现FASTTEXT参数优化,解决FASTTEXT算法参数过多、模型效果依赖于参数值的设定优化问题。本文提出了DA_FASTTEXT分类方法,实现了一个基于DA_FASTTEXT分类方法的中文文档分类系统。测试结果表明其具有更优的分类准确性和分类速度综合性能。 展开更多
关键词 文档分类 蜻蜓优化算法(DA) 参数优化 fasttext算法
在线阅读 下载PDF
基于改进TF-IDF的FastText新闻文本分类算法
4
作者 李卫卫 葛欣杭 刘晓丹 《电脑与电信》 2025年第1期27-31,共5页
新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本... 新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本数据,以验证该模型的分类性能。实验结果表明,所提分类模型的财经新闻文本分类精确率达到95.82%,相较于对比方案,最高提升6.91%,证明所提方案具有一定的有效性以及可行性,能够有效提升新闻文本分类效果。 展开更多
关键词 新闻文本分类 fasttext 特征因子 离散度 改进TF-IDF
在线阅读 下载PDF
基于LDA和fastText的文本分析研究——以广州市在线政务问卷为例
5
作者 谢旖 詹小健 《大数据时代》 2025年第5期41-46,共6页
随着我国在线政务服务的快速发展,网络问卷已成为收集社情民意的重要手段,但大量文本数据的整理归纳仍面临诸多挑战。因此,本研究基于机器学习技术,对问卷文本分类展开分析,着重分析LDA主题模型和fastText模型的分类效果,与传统机器学... 随着我国在线政务服务的快速发展,网络问卷已成为收集社情民意的重要手段,但大量文本数据的整理归纳仍面临诸多挑战。因此,本研究基于机器学习技术,对问卷文本分类展开分析,着重分析LDA主题模型和fastText模型的分类效果,与传统机器学习算法(SVM、贝叶斯分类算法、KNN)进行对照,并收集广州市人民政府网站的问卷文本数据,经预处理和参数优化后进行实验。结果表明,fastText模型在多个指标上表现出色;LDA主题模型能提供文本主题信息,且分类效果略优于传统算法。本研究旨在为相关部门优化问卷分类整理提供参考。 展开更多
关键词 在线政务服务 问卷文本分类 机器学习 LDA主题模型 fasttext模型
在线阅读 下载PDF
一种基于FastText的恶意代码家族分类方法
6
作者 张宇迪 冯永新 赵运弢 《沈阳理工大学学报》 CAS 2024年第1期61-68,90,共9页
传统的恶意代码家族分类方法主要通过代码家族浅层关联特征的统计分析达到分类和识别的目的。随着恶意代码加壳、混淆、多态技术的发展,传统方法的局限性逐渐显现,但恶意代码需调用API函数达成恶意目的始终是其不变的行为特征。基于embe... 传统的恶意代码家族分类方法主要通过代码家族浅层关联特征的统计分析达到分类和识别的目的。随着恶意代码加壳、混淆、多态技术的发展,传统方法的局限性逐渐显现,但恶意代码需调用API函数达成恶意目的始终是其不变的行为特征。基于embedding、word2vec模型的传统方法缺乏对低频API函数的特征提取能力,在表征API序列局部顺序特征时易产生映射失真,存在词典外API行为扩展、推理能力弱等导致分类准确率下降的不足。由此,引入负采样优化的FastText框架以加强对API序列映射的准确度,提出一种基于FastText框架下的恶意代码家族分类方法。利用FastText框架实现代码样本API序列的多维向量转换和精准表达,结合一维卷积及长短时记忆(LSTM)网络进一步提取API行为局部特征。实验结果表明,该模型的性能相较于传统的embedding方法和word2vec框架性能更优,准确率可达99%以上。 展开更多
关键词 fasttext 恶意代码家族分类 长短时记忆网络
在线阅读 下载PDF
基于FastText的藏文新闻文本分类的研究
7
作者 明玛卓玛 高定国 +1 位作者 胡心龙 旦增 《电脑知识与技术》 2024年第33期26-28,共3页
藏文新闻文本分类在新闻推荐和舆情监测等领域具有显著的重要性。文章探讨了FastText模型在藏文新闻文本分类中的性能表现。在介绍FastText模型工作原理的基础上,通过实验对比评估了DPCNN、FastText、TextCNN、Tex-tRCNN、TextRNN及Text... 藏文新闻文本分类在新闻推荐和舆情监测等领域具有显著的重要性。文章探讨了FastText模型在藏文新闻文本分类中的性能表现。在介绍FastText模型工作原理的基础上,通过实验对比评估了DPCNN、FastText、TextCNN、Tex-tRCNN、TextRNN及TextRNN_Att等模型在藏文文本分类任务中的表现。结果显示,FastText模型在测试集上展现出了优异的准确率、召回率和F1值。FastText模型不仅训练速度快、分类效率高,而且泛化能力强,为藏文文本分类提供了一种高效且有效的解决方案。 展开更多
关键词 深度学习 藏文新闻 文本分类 fasttext 性能比较
在线阅读 下载PDF
基于TI-FastText的拼音维语识别方法
8
作者 刘宣 季铎 滕超越 《中国人民公安大学学报(自然科学版)》 2024年第1期66-73,共8页
维吾尔语是中国新疆维吾尔自治区最重要的语言之一,由于计算机处理和信息检索中存在一些困难,拼音维语应运而生。拼音维语为维吾尔语的数字化处理提供了便利,但是由于拼音维语没有完全统一的标准、偏向于口语化、网络社交媒体居多、数... 维吾尔语是中国新疆维吾尔自治区最重要的语言之一,由于计算机处理和信息检索中存在一些困难,拼音维语应运而生。拼音维语为维吾尔语的数字化处理提供了便利,但是由于拼音维语没有完全统一的标准、偏向于口语化、网络社交媒体居多、数据收集困难等特点,导致计算机对拼音维语的识别存在困难。基于此,首先引入TF-IDF和FastText模型融合的方法对拼音维语进行识别,与传统方法相比,该方法的创新之处在于TF-IDF可以对拼音维语独特的语言特点进行更深度的提取,并且融合FastText模型可以降低单一模型的局限性,利用其对词序和低频词汇的高敏感性,可以进行更精准的维语识别;同时为了降低模型的鲁棒性,引入数据伪造技术获取了大量的多语种数据集。实验结果显示,该项技术识别拼音维语的准确率可以达到95%以上。通过开发拼音维语识别技术,可以帮助在数字化时代更好地处理和管理维吾尔语的信息,可以推动自然语言处理和人工智能领域技术在维吾尔语识别方面的研究和应用。 展开更多
关键词 拼音维语 fasttext模型 识别 维语
在线阅读 下载PDF
融合TF-IDF和LDA的中文FastText短文本分类方法 被引量:33
9
作者 冯勇 屈渤浩 +2 位作者 徐红艳 王嵘冰 张永刚 《应用科学学报》 CAS CSCD 北大核心 2019年第3期378-388,共11页
FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocatio... FastText文本分类模型具有快速高效的优势,但直接将其用于中文短文本分类则存在精确率不高的问题.为此提出一种融合词频-逆文本频率(term frequency-inverse document frequency, TF-IDF)和隐含狄利克雷分布(latent Dirichlet allocation, LDA)的中文FastText短文本分类方法.该方法在FastText文本分类模型的输入阶段对n元语法模型处理后的词典进行TF-IDF筛选,使用LDA模型进行语料库主题分析,依据所得结果对特征词典进行补充,从而在计算输入词序列向量均值时偏向高区分度的词条,使其更适用于中文短文本分类环境.对比实验结果可知,所提方法在中文短文本分类方面具有更高的精确率. 展开更多
关键词 中文短文本分类 fasttext 词频-逆文本频率 词向量 隐含狄利克雷分布
在线阅读 下载PDF
融合类别特征扩展与N-gram子词过滤的fastText短文本分类 被引量:6
10
作者 李志明 孙艳 +1 位作者 何宜昊 申利民 《小型微型计算机系统》 CSCD 北大核心 2022年第8期1596-1601,共6页
以提升fastText短文本分类模型性能为目标,从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡献度语义特征时产生的干扰角度展开研究,提出基于TF-IDF的LDA类别特征提取方法以提升类别特征质量,提出... 以提升fastText短文本分类模型性能为目标,从获取高质量的类别特征、降低N-gram子词中低类别区分贡献度子词对模型学习高类别区分贡献度语义特征时产生的干扰角度展开研究,提出基于TF-IDF的LDA类别特征提取方法以提升类别特征质量,提出基于词汇信息熵的N-gram子词过滤方法过滤N-gram子词中低类别区分贡献度子词,并构建更专注于高类别区分贡献度语义特征学习的EF-fastText短文本分类模型.实验结果表明基于TF-IDF的LDA类别特征提取方法,以及基于词汇信息熵的N-gram子词过滤方法对于EF-fastText短文本分类模型性能提升是有效性的. 展开更多
关键词 短文本分类 fasttext 类别特征 词汇信息熵 N-GRAM
在线阅读 下载PDF
基于fastText算法的行业分类技术 被引量:6
11
作者 吴震 冉晓燕 +3 位作者 苗权 刘纯艳 张栋 魏娜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期193-198,共6页
随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行... 随着中国经济的高速发展和技术创新能力的不断提升,高效的组织、分类信息是提供个性化行业管理和跟踪分析的基础。根据行业信息特点和发展规律,提出了一种基于fastText算法的行业分类模型。首先,构建行业分类关键词库,通过特征词库进行分词和权重计算。然后,构建分类器模型,实现中文行业的自动分类。最后,实验选取了80000个包含企业经营范围、企业信息、舆论信息的测试文档,结果表明,所提模型结果高于Bayes、决策树、KNN等分类算法,取得了较好的应用效果。 展开更多
关键词 自然语言处理 行业分类 fasttext算法 关键词 语法模型
原文传递
基于FastText字向量与双向GRU循环神经网络的短文本情感分析研究——以微博评论文本为例 被引量:24
12
作者 范昊 李鹏飞 《情报科学》 CSSCI 北大核心 2021年第4期15-22,共8页
【目的/意义】提出基于字向量与双向GRU循环神经网络的模型以提高网络化短文本情感分类准确率,有助于关注民众在网络上的情绪状态,维护社会稳定,净化网络环境,提升人民幸福感。【方法/过程】通过FastText算法生成字向量与词向量,对比两... 【目的/意义】提出基于字向量与双向GRU循环神经网络的模型以提高网络化短文本情感分类准确率,有助于关注民众在网络上的情绪状态,维护社会稳定,净化网络环境,提升人民幸福感。【方法/过程】通过FastText算法生成字向量与词向量,对比两者在双向GRU的循环神经网络的训练效果,预测微博评论的情感分类。【结果/结论】研究结果表明,使用字向量训练可以降低模型过拟合的风险,本文提出的模型在准确率、精确率、召回率、F1分数四个指标上的分数都达到0.92以上,具有优秀的拟合能力和泛化能力。【创新/局限】本文根据理论为模型配置了独特的词嵌入层和循环神经网络层,模型在中文短文本二分类情感分析任务中表现优越,但在长文本或者三分类情感分析任务中的表现未知。 展开更多
关键词 短文本 情感分析 fasttext字向量 GRU 双向循环神经网络
原文传递
TI-FastText自动商品分类算法 被引量:3
13
作者 邵欣欣 《计算机科学》 CSCD 北大核心 2022年第S01期206-210,共5页
为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法。该方法首先利用FastText本身的特点,将词库表示成前缀树;然后对n元语法模型n-gram处理后的词典进行TF-IDF筛选,从而在... 为了实现根据商品标题信息进行商品自动分类的功能,提出了基于词频-逆文本频率(TF-IDF)的中文Fasttext商品分类方法。该方法首先利用FastText本身的特点,将词库表示成前缀树;然后对n元语法模型n-gram处理后的词典进行TF-IDF筛选,从而在计算输入词序列向量均值时,偏向高群分度的词条;最后将文本内容以字符顺序进行大小为N的窗口滑动操作,使其更适用于商品标题分类。基于Anaconda平台,对基于FastText的商品分类算法进行实现和优化,经评估,最终的分类器准确率较高,能够满足电商平台对商品分类的需求。 展开更多
关键词 商品分类 中文短文本分类 fasttext TF-IDF
在线阅读 下载PDF
基于FastText和多尺度深层金字塔卷积神经网络的中文文本情感分类模型 被引量:3
14
作者 何颖刚 王宇 +2 位作者 夏丽丽 郭静 郑新旺 《宁德师范学院学报(自然科学版)》 2022年第4期382-388,共7页
为提高中文文本情感分类效率,提出一种基于FastText和多尺度深层金字塔卷积神经网络的文本情感分类模型.利用FastText模型构建文本向量矩阵;使用多尺寸过滤器从文本向量矩阵中提取多个特征图;融合多个特征图并输入多尺度深层金字塔卷积... 为提高中文文本情感分类效率,提出一种基于FastText和多尺度深层金字塔卷积神经网络的文本情感分类模型.利用FastText模型构建文本向量矩阵;使用多尺寸过滤器从文本向量矩阵中提取多个特征图;融合多个特征图并输入多尺度深层金字塔卷积神经网络模型进行情感分类.在中文情感挖掘语料库数据集上进行实验,多组实验对比结果表明,与其他算法相比,本文模型能有效提高文本情感分类的准确率. 展开更多
关键词 情感分类 深层金字塔卷积神经网络 fasttext 词向量 多尺度
在线阅读 下载PDF
基于fastText模型的词向量表示改进算法 被引量:10
15
作者 阴爱英 吴运兵 +1 位作者 郑一江 余小燕 《福州大学学报(自然科学版)》 CAS 北大核心 2019年第3期314-319,共6页
传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次... 传统词向量表示模型往往忽视了单词间的句法形态结构,导致模型预测准确率不高.为此,提出基于fastText模型的词向量表示改进算法.首先,在训练模型数据集上,引入stopwords处理技术,剔除一些无意义介词等对预测模型干扰,减少噪声数据;其次,针对fastText模型中n-gram分解格式进行限定,将分解条件设置为符合英文单词的组成结构;最后,去除fastText模型中单词前后缀标记符,减少无用分解对模型预测产生干扰.实验结果表明,与fastText模型相比,所提出的改进模型在单词关系评分、语义相似性、句法相似性均取得较好的准确率. 展开更多
关键词 词向量 skip-gram模型 fasttext模型 自然语言处理
在线阅读 下载PDF
基于Borderline-Smote算法改进的FastText中文情感极性分析 被引量:6
16
作者 潘正军 赵莲芬 +1 位作者 袁丽娜 王红勤 《计算机应用与软件》 北大核心 2021年第11期295-299,349,共6页
针对单一的FastText模型在不平衡中文语料中的情感极性分析效果不好,以及传统Jieba分词对广领域中文文本适应性不强,数据倾斜导致中文情感极性分析的准确率和召回率产生波动等问题,提出一种基于Borderline-Smote算法改进的FastText中文... 针对单一的FastText模型在不平衡中文语料中的情感极性分析效果不好,以及传统Jieba分词对广领域中文文本适应性不强,数据倾斜导致中文情感极性分析的准确率和召回率产生波动等问题,提出一种基于Borderline-Smote算法改进的FastText中文情感极性分析,通过过采样Borderline-Smote和pkuseg中文分词等预处理方式分别解决分类中数据倾斜、涉及领域广的问题,再与FastText结合进行中文情感极性分析。实验结果表明,该模型在中文情感极性分析中的准确率得到了一定的提高。 展开更多
关键词 机器学习 中文分词 Borderline-Smote fasttext 情感极性分析
在线阅读 下载PDF
基于fastText的中文文本分类 被引量:20
17
作者 代令令 蒋侃 《计算机与现代化》 2018年第5期35-40,85,共7页
在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的... 在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的效果。相对于目前主流的文本分类方法,基于fastText模型的分类方法在保证分类效果的同时,大大缩短了分类时间。此外,在分类准确率和参数设置方面进行分析并得出相应的优化规则。 展开更多
关键词 文本分类 fasttext 线性分类器 快速文本分类模型
在线阅读 下载PDF
基于FastText和关键句提取的中文长文本分类 被引量:5
18
作者 汪家成 薛涛 《计算机系统应用》 2021年第8期213-218,共6页
FastText是一种准确高效的文本分类模型,但直接应用在中文长文本分类领域存在准确度不高的问题.针对该问题,提出一种融合TextRank关键子句提取和词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)的FastText中文长文... FastText是一种准确高效的文本分类模型,但直接应用在中文长文本分类领域存在准确度不高的问题.针对该问题,提出一种融合TextRank关键子句提取和词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)的FastText中文长文本分类方法.该方法在FastText模型输入阶段使用TextRank算法提取文本的关键子句输入训练模型,同时采用TF-IDF提取文本的关键词作为特征补充,从而在减少训练语料的同时尽可能保留文本分类的关键特征.实验结果表明,此文本分类方法在数据集上准确率达到86.1%,比经典的FastText模型提高了约4%. 展开更多
关键词 文本分类 fasttext TextRank 词频-逆文本频率
在线阅读 下载PDF
基于FastText模型的农业短文本分类研究 被引量:1
19
作者 王福健 魏霖静 +1 位作者 安昭先 刘志祖 《软件》 2022年第10期27-29,共3页
本文提出基于FastText分类语言模型来解决农业短文本分类问题。在数据处理好类别的情况下,利用实验对12万条农业数据集进行实验。并探究与典型深度语言模型(TextRNN、TextCNN、TextDPCNN、Transformer)进行对比分析其中的分类准确率和... 本文提出基于FastText分类语言模型来解决农业短文本分类问题。在数据处理好类别的情况下,利用实验对12万条农业数据集进行实验。并探究与典型深度语言模型(TextRNN、TextCNN、TextDPCNN、Transformer)进行对比分析其中的分类准确率和分类处理响应时间。实验结果得出结论,基于深度学习的FastText模型的农业短文本分类效果最好,FastText模型对比其他模型的准确率、精确率、召回率和F1值提高了1%~4%。FastText模型可以对中文农业短文本分类处理速度更好,更优于其他典型深度语言模型算法。 展开更多
关键词 农业短文本分类 文本分类 语言模型 fasttext
在线阅读 下载PDF
基于fasttext模型的中文专利快速分类 被引量:1
20
作者 陈子豪 谢从华 +1 位作者 时敏 唐晓娜 《常熟理工学院学报》 2020年第5期47-50,共4页
针对现有中文专利文本的自动分类方法存在分类处理过程复杂耗时长、精度低且对硬件的要求较高等问题,本文提出了一种基于fasttext的中文专利文本快速分类的新方法.首先,对采集的专利文本数据使用中文处理工具包FoolNLTK分词,参照百度停... 针对现有中文专利文本的自动分类方法存在分类处理过程复杂耗时长、精度低且对硬件的要求较高等问题,本文提出了一种基于fasttext的中文专利文本快速分类的新方法.首先,对采集的专利文本数据使用中文处理工具包FoolNLTK分词,参照百度停用词表去除停用词,减少停用词出现的频率,提高关键词密度.其次,将输入层中的词和词组利用n-gram模型构造文本特征向量,再将文本特征向量通过线性变换映射到隐藏层变量,隐藏层通过求解最大似然函数,根据每个类别的权重和模型参数在输出层上构建Huffman树,利用softmax计算概率实现专利文本分类.实验结果表明,本方法分类精度高,与基于TextCNN、TextRCNN深度学习的专利分类方法相比,分类速度快很多. 展开更多
关键词 fasttext 快速分类 文本分类 专利分类
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部