期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于网格的Multi_Agent web文本挖掘系统 被引量:5
1
作者 贾志娟 胡明生 《微计算机信息》 北大核心 2006年第07X期266-268,141,共4页
企业决策对web文本挖掘的速度和准确性的要求越来越高。本文提出了一个基于网格技术的能够并行处理的Mul-ti_Agentweb文本挖掘系统。并讨论了该系统提供文本挖掘服务的方法和步骤。
关键词 网格 多AGENT 文本挖掘
在线阅读 下载PDF
基于虚拟类别匹配的分布外文本检测方法
2
作者 虞佳淼 王慧芳 +3 位作者 张亦翔 周辉 罗华峰 宣佳卓 《电网技术》 北大核心 2025年第4期1681-1688,I0075,共9页
电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产... 电力专业领域的文本分类任务中,建立的深度学习模型在实际应用时常出现模型性能下降的问题,亟需分布外文本检测方法对实际文本数据进行检测,以保障模型的泛化能力。以电力现场作业文本的风险等级评级为应用背景,总结分析了分布外文本产生的原因及检测难点,提出了基于虚拟类别匹配的分布外文本检测方法。使用特征分解方法得到主、副成分子空间,用副成分子空间构建分布外文本的虚拟类别,以放大分布内、外文本之间的差异性。分析了该方法具有融合预测概率方法与特征分布空间方法的优势。通过分布内、外文本不同词汇相似度的数据集,验证了所提方法的可行性和有效性,并展现了在电力现场作业文本自动评级中的实际应用效果,评级性能及置信度获得大幅提升。 展开更多
关键词 分布外文本检测 虚拟类别匹配 电力现场作业 电力领域文本分类 文本挖掘
原文传递
一个基于网格的文本复制检测系统 被引量:7
3
作者 鲍军鹏 沈钧毅 刘晓东 《微电子学与计算机》 CSCD 北大核心 2004年第9期7-10,共4页
如何快速、及时地在大规模文集中发现剽窃文本是知识产权保护中的一个核心问题。我们利用Globus构建了一个文本复制检测网格系统,称之为DCDGrid。在DCDGrid原型中我们把单个巨型文集分解成多个中小规模文集,然后将其分布在网络上。通过... 如何快速、及时地在大规模文集中发现剽窃文本是知识产权保护中的一个核心问题。我们利用Globus构建了一个文本复制检测网格系统,称之为DCDGrid。在DCDGrid原型中我们把单个巨型文集分解成多个中小规模文集,然后将其分布在网络上。通过网格计算的方式,我们可以同时在多台计算机上检测剽窃文本,可以动态增扩检测文集,缩短检测时间,整个系统具有很高的性价比。局域网上的模拟测试表明DCDGrid系统是比较实用的。 展开更多
关键词 复制检测 网格 剽窃 文本挖掘
在线阅读 下载PDF
基于信息抽取的电网缺陷文本挖掘系统设计
4
作者 宋立华 《电子设计工程》 2022年第3期31-34,39,共5页
由于电网中存在大量的缺陷文本,传统方法无法精准区分缺陷类型,导致文本挖掘精准度较低,为此提出了基于信息抽取的电网缺陷文本挖掘系统设计。使用数据存储模块直接访问系统内存,通过负载均衡服务器执行请求响应。设计多进程浏览器架构... 由于电网中存在大量的缺陷文本,传统方法无法精准区分缺陷类型,导致文本挖掘精准度较低,为此提出了基于信息抽取的电网缺陷文本挖掘系统设计。使用数据存储模块直接访问系统内存,通过负载均衡服务器执行请求响应。设计多进程浏览器架构,负责浏览多进程应用程序。构建文本挖掘模型,将大量信息元素整理成电网缺陷术语表形式,输入电网缺陷文本后,利用术语注解标准形式识别术语表内容,并计算标签在固定周期中的覆盖率,记录平均时间间隔和偏离度,由此得到电网缺陷标签标记的周期。在该周期内,确定缺陷种类,完成数据挖掘。实验结果表明,该系统的挖掘精度最低为85%,说明该方法的挖掘结果较为可靠,具有实际应用价值。 展开更多
关键词 信息抽取 电网缺陷 文本挖掘 偏离度
在线阅读 下载PDF
面向智能电网的多领域海量文本过滤框架研究 被引量:2
5
作者 李健 《电力信息与通信技术》 2015年第11期31-35,共5页
高效安全的数据交互是实现智能电网信息化、互动化的重要保障,对智能电网互动数据进行识别与过滤是防止其泄露的关键技术,目前传统的集中式或分布式数据过滤方法已无法适应新的需求。文章提出面向智能电网的多领域海量文本过滤框架,重... 高效安全的数据交互是实现智能电网信息化、互动化的重要保障,对智能电网互动数据进行识别与过滤是防止其泄露的关键技术,目前传统的集中式或分布式数据过滤方法已无法适应新的需求。文章提出面向智能电网的多领域海量文本过滤框架,重点描述了智能电网专业语料库的构建、智能电网多领域高维文本特征选择模型以及智能电网海量文本数据自适应分类等内容。文章提出的方法可以提高智能电网数据交换的安全性和准实时性,防止敏感业务数据的泄漏,对促进智能电网互动化业务应用安全稳定运行有重要意义。 展开更多
关键词 智能电网 海量文本 文本过滤 特征选择 函数挖掘
在线阅读 下载PDF
文本挖掘下的电网企业管理定量测算模型 被引量:1
6
作者 殷伍平 冯伟 莫志华 《武汉理工大学学报(信息与管理工程版)》 CAS 2023年第4期619-624,共6页
为提高电网企业对用户的综合管理效率,推动电网企业的综合发展,对文本挖掘技术进行讨论,论述了电网企业的管理模型,构建了基于文本挖掘技术的电网企业管理定量测算模型,并对模型进行了综合评估。结果表明:模型在文档频率方法评估中的各... 为提高电网企业对用户的综合管理效率,推动电网企业的综合发展,对文本挖掘技术进行讨论,论述了电网企业的管理模型,构建了基于文本挖掘技术的电网企业管理定量测算模型,并对模型进行了综合评估。结果表明:模型在文档频率方法评估中的各项指标数值较低,精准度为33%~98%,召回率为8%~90%,F 1为12%~60%;模型文本分类准确率普遍在90%左右,其他3种模型的准确率普遍在80%左右;与其他3种评估方法相比,向量空间模型能够适应多种领域的文本分类操作,且分类效果较好。 展开更多
关键词 电网企业 计算机 文本挖掘 企业管理 文档频率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部