期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
Emotion Deduction from Social Media Text Data Using Machine Learning Algorithm
1
作者 Thambusamy Velmurugan Baskaran Jayapradha 《Journal of Computer and Communications》 2023年第11期183-196,共14页
Emotion represents the feeling of an individual in a given situation. There are various ways to express the emotions of an individual. It can be categorized into verbal expressions, written expressions, facial express... Emotion represents the feeling of an individual in a given situation. There are various ways to express the emotions of an individual. It can be categorized into verbal expressions, written expressions, facial expressions and gestures. Among these various ways of expressing the emotion, the written method is a challenging task to extract the emotions, as the data is in the form of textual dat. Finding the different kinds of emotions is also a tedious task as it requires a lot of pre preparations of the textual data taken for the research. This research work is carried out to analyse and extract the emotions hidden in text data. The text data taken for the analysis is from the social media dataset. Using the raw text data directly from the social media will not serve the purpose. Therefore, the text data has to be pre-processed and then utilised for further processing. Pre-processing makes the text data more efficient and would infer valuable insights of the emotions hidden in it. The preprocessing steps also help to manage the text data for identifying the emotions conveyed in the text. This work proposes to deduct the emotions taken from the social media text data by applying the machine learning algorithm. Finally, the usefulness of the emotions is suggested for various stake holders, to find the attitude of individuals at that moment, the data is produced. . 展开更多
关键词 data pre-processing Machine Learning algorithms Emotion Deduction Sentiment Analysis
在线阅读 下载PDF
SDD-1改进算法在Hive中应用 被引量:7
2
作者 王宝进 吴淑跃 薛娟 《湘潭大学自然科学学报》 CAS 北大核心 2014年第4期77-82,共6页
针对Hive在处理连接查询时所存在的执行时间长和带宽资源消耗大等问题,提出了一种基于数据预处理和双半连接的SDD-1改进算法.首先,引入预处理技术,在各分布节点对原始数据进行归并排序,以减少汇聚节点的数据映射次数,加快数据处理执行速... 针对Hive在处理连接查询时所存在的执行时间长和带宽资源消耗大等问题,提出了一种基于数据预处理和双半连接的SDD-1改进算法.首先,引入预处理技术,在各分布节点对原始数据进行归并排序,以减少汇聚节点的数据映射次数,加快数据处理执行速度;其次,采用基于行和列的双半连接技术,进一步缩减在不同节点间的数据传输量,减少带宽资源消耗.仿真实验表明,相比原始的Hive连接算法,改进算法在元组数达到5 000和8 000时,可使查询速度提升10%,有效缩短查询的处理和响应时间,该改进算法可方便地应用到其他云计算平台上. 展开更多
关键词 数据预处理 双半连接 SDD-1改进算法
在线阅读 下载PDF
基于L-M算法的火电厂实时数据神经网络预测模型研究 被引量:5
3
作者 杨雁梅 陈梅倩 刘杰 《热力发电》 CAS 北大核心 2008年第1期54-57,64,共5页
提出了一种建立在BP神经网络上的基于Levenberg-Marquardt(简称L-M)算法的火电厂实时数据神经网络预测模型,以减少训练次数和提高训练精度。通过对某电厂300MW机组高压加热器进口温度进行训练和校核,分析了数据预处理的重要性。仿真结... 提出了一种建立在BP神经网络上的基于Levenberg-Marquardt(简称L-M)算法的火电厂实时数据神经网络预测模型,以减少训练次数和提高训练精度。通过对某电厂300MW机组高压加热器进口温度进行训练和校核,分析了数据预处理的重要性。仿真结果表明,该模型能够获得未来时刻合理的预测结果,可用于缺失数据补充和实时数据校核,提高数据可靠性,适用于在线对未来状态的评价,为状态检修提供参考依据。 展开更多
关键词 火电厂 L-M算法 BP神经网络 实时数据神经网络 预测模型 数据预处理 仿真
在线阅读 下载PDF
On Numerical methods for determination of Earth gravity field model using mass satellite gravity gradiometry data
4
作者 Zhu Guangbin Chang Xiaotao +2 位作者 Li Xinfa Zhang Xinhang Li Yuxing 《Geodesy and Geodynamics》 2012年第1期57-62,共6页
On the basis of Space-Wise Least Square method, three numerical methods including Cholesky de- composition, pre-conditioned conjugate gradient and Open Multi-Processing parallel algorithm are applied into the determin... On the basis of Space-Wise Least Square method, three numerical methods including Cholesky de- composition, pre-conditioned conjugate gradient and Open Multi-Processing parallel algorithm are applied into the determination of gravity field with satellite gravity gradiometry data. The results show that, Cholesky de- composition method has been unable to meet the requirements of computation efficiency when the computer hardware is limited. Pre-conditioned conjugate gradient method can improve the computation efficiency of huge matrix inversion, but it also brings a certain loss of precision. The application of Open Multi-Processing parallel algorithm could achieve a good compromise between accuracy and computation efficiency. 展开更多
关键词 satellite gravity gradiometry Cholesky decomposition pre-conditioned conjugate gradient open multi-processing parallel algorithm data processing
原文传递
基于电力大数据的真空断路器运行状态评估与故障预警分析
5
作者 张浩宇 《光源与照明》 2025年第6期69-71,共3页
文章旨在利用电力大数据开发真空断路器运行状态评估与故障预警方法。研究构建了基于物理机制的真空断路器健康指标体系,提出电气-机械-环境多域耦合状态评估框架,以实现全面、精准的真空断路器运行状态评估;综合采用了特征工程与样本... 文章旨在利用电力大数据开发真空断路器运行状态评估与故障预警方法。研究构建了基于物理机制的真空断路器健康指标体系,提出电气-机械-环境多域耦合状态评估框架,以实现全面、精准的真空断路器运行状态评估;综合采用了特征工程与样本均衡的预处理技术,创新性地引入跨场景迁移学习与知识共享机制,以解决真空断路器实际运行中故障样本稀缺的难题;开发了基于物理信息融合的混合故障预警模型,构建分层递进式故障预警与风险评估框架,并利用自优化故障预警系统与闭环验证机制实现预警系统性能的持续提升。 展开更多
关键词 电力大数据 真空断路器 预处理技术 混合故障预警模型 数据驱动算法
在线阅读 下载PDF
三点间管路自动布局方法研究 被引量:6
6
作者 白晓兰 王成恩 +1 位作者 张禹 柳强 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第2期283-286,共4页
针对管路布局设计中三点间管路布局问题,提出了一种基于迷宫算法的管路自动布局方法.该方法利用网格预处理,将实际管路布局空间转换到网格空间,并利用迷宫算法模拟波的传播特点,在无障碍和有障碍两种情况下寻找到满足要求的三通位置,然... 针对管路布局设计中三点间管路布局问题,提出了一种基于迷宫算法的管路自动布局方法.该方法利用网格预处理,将实际管路布局空间转换到网格空间,并利用迷宫算法模拟波的传播特点,在无障碍和有障碍两种情况下寻找到满足要求的三通位置,然后结合规则引导进行回溯处理,确定满足约束条件的可行路径,经数据处理转换到管路布局空间中.基于网格预处理和改进的迷宫算法,给出三点间管路布局算法流程图.实例验证表明了该方法的有效性和可行性. 展开更多
关键词 管路布局 网格预处理 迷宫算法 规则引导 数据处理
在线阅读 下载PDF
面向中医辨证规范的交互式数据挖掘框架 被引量:25
7
作者 王波 张斌 +4 位作者 魏伟杰 马玉慧 梁茂新 王雪峰 董丹 《世界科学技术-中医药现代化》 2006年第1期24-30,共7页
传统的中医辨证规范采用经验式的逻辑分析方法和数理统计方法,数学模型都是预先选定的,不是由具体病证的内在规律决定,因而规范结果的客观真实性受到一定的质疑。本文在“十五攻关”项目的基础上,设计了基于小儿肺炎中医辨证的交互式数... 传统的中医辨证规范采用经验式的逻辑分析方法和数理统计方法,数学模型都是预先选定的,不是由具体病证的内在规律决定,因而规范结果的客观真实性受到一定的质疑。本文在“十五攻关”项目的基础上,设计了基于小儿肺炎中医辨证的交互式数据挖掘框架,采用三层模型,在挖掘信息的同时,通过人机交互,推动了数据挖掘技术和传统中医现代化的结合。 展开更多
关键词 辨证规范 数据挖掘 数据预处理 挖掘算法 技术平台
暂未订购
基于切片技术的点云数据预处理研究 被引量:4
8
作者 张胜文 张洪刚 +1 位作者 方喜峰 李敏 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2009年第5期403-406,共4页
针对扫描点云杂乱无序的特点,讨论了点云数据预处理的问题,提出了一种新的基于点云切片的数据预处理迭代算法.通过对点云最小包围盒进行均匀分割及分割后点云的密度分析,对密度过大的分割块进行迭代分割,建立了3个方向的点云切片和截面... 针对扫描点云杂乱无序的特点,讨论了点云数据预处理的问题,提出了一种新的基于点云切片的数据预处理迭代算法.通过对点云最小包围盒进行均匀分割及分割后点云的密度分析,对密度过大的分割块进行迭代分割,建立了3个方向的点云切片和截面线.结果不仅大大减少了点云数据量,并且在点云密度过大的区域很好地保持了模型的原始特征,同时将原始的无序数据点集转化为具有层列结构的有序组织形式,确定了各点之间的相互关系,为后续曲线曲面拟合做了很好的准备. 展开更多
关键词 点云切片 截面线 迭代算法 数据预处理 逆向工程
在线阅读 下载PDF
基于点云曲线辨识的卫星激光数据预处理算法 被引量:9
9
作者 刘雁雨 吴晓平 +1 位作者 高皓 刘晓刚 《大地测量与地球动力学》 CSCD 北大核心 2011年第1期105-108,112,共5页
针对卫星激光数据处理算法这一难题,分析了COMPASS系统GEO卫星激光观测数据的质量,讨论了反求工程和计算机视觉中的曲线识别与激光观测数据预处理的异同,提出了基于点云曲线辨识的卫星激光数据预处理算法。该算法将卫星激光观测数据预... 针对卫星激光数据处理算法这一难题,分析了COMPASS系统GEO卫星激光观测数据的质量,讨论了反求工程和计算机视觉中的曲线识别与激光观测数据预处理的异同,提出了基于点云曲线辨识的卫星激光数据预处理算法。该算法将卫星激光观测数据预处理视为有序带噪声的空间曲线重建问题,利用COMPASS系统多圈GEO卫星实测数据进行验证。结果表明:该方法与常用算法一致率在85%以上,能够实现激光观测数据的自动处理与满足导航系统的需要。 展开更多
关键词 卫星激光测距 点云曲线辨识 数据预处理算法 COMPASS 屏幕处理
在线阅读 下载PDF
一种适用于基因表达数据的特征加权FCM算法 被引量:2
10
作者 袁正午 魏荣 叶明星 《计算机应用研究》 CSCD 北大核心 2010年第7期2483-2485,共3页
针对FCM算法应用于基因表达数据分析时存在的局限性,提出一种特征加权自适应FCM算法。该算法在FCM算法的基础上引入数据集预处理机制,可依据数据集的分布特征自适应地获取分类数目和初始聚类中心,并通过ReliefF算法实现特征权值的自动... 针对FCM算法应用于基因表达数据分析时存在的局限性,提出一种特征加权自适应FCM算法。该算法在FCM算法的基础上引入数据集预处理机制,可依据数据集的分布特征自适应地获取分类数目和初始聚类中心,并通过ReliefF算法实现特征权值的自动确定。同时,新算法考虑了不同属性对分类贡献的差异,在FCM算法中引入特征权重。将算法应用于真实基因表达数据集,实验结果表明,算法能够自适应地确定聚类数目、获得稳定性较好的聚类结果,而且具有较高的聚类精度。 展开更多
关键词 基因表达数据 预处理算法 类间熵 加权模糊聚类
在线阅读 下载PDF
基于模糊聚类的改进的模糊关联规则挖掘算法(英文) 被引量:5
11
作者 李雷 崔岩 《计算机技术与发展》 2012年第11期18-21,26,共5页
文中提出一种新的方法通过使用模糊C均值对原始数据集进行预处理操作,通过这个操作可以把定量属性值转换为二进制值,继而就会得到原始数据集的模糊版本(由模糊记录和模糊属性组成)。另外,文中又提出了一种基于模糊Apriori算法的快速提... 文中提出一种新的方法通过使用模糊C均值对原始数据集进行预处理操作,通过这个操作可以把定量属性值转换为二进制值,继而就会得到原始数据集的模糊版本(由模糊记录和模糊属性组成)。另外,文中又提出了一种基于模糊Apriori算法的快速提取规则的算法,这种算法是利用模糊聚类从先前得到的原始数据集的模糊版本中提取模糊频繁项集从而可以得到模糊关联规则。在文章的最后,实验结果显示了提出的新算法在处理大型数据集时在挖掘时间上要优于传统的Apriori算法。对大型数据库来说,该算法在实用性和可用性上面都有很好的发展前景。 展开更多
关键词 预处理 模糊聚类 模糊C均值 模糊Apriori算法 数据挖掘
在线阅读 下载PDF
不一致性进化特征选择方法 被引量:1
12
作者 翟俊海 刘博 张素芳 《小型微型计算机系统》 CSCD 北大核心 2017年第5期967-971,共5页
特征选择是机器学习中重要的数据预处理步骤,它从原始特征集合中,选择一个重要的子集,以改进学习系统的性能或降低学习系统的计算复杂度,对学习系统的性能有重要的影响.针对离散值特征选择问题,提出一种基于遗传算法的特征选择方法.该... 特征选择是机器学习中重要的数据预处理步骤,它从原始特征集合中,选择一个重要的子集,以改进学习系统的性能或降低学习系统的计算复杂度,对学习系统的性能有重要的影响.针对离散值特征选择问题,提出一种基于遗传算法的特征选择方法.该方法利用遗传算法搜索最优或次优特征子集.具体地,利用二进制数对问题的解编码,利用不一致性度量作为适应度函数.实验结果显示本文提出的特征选择方法是行之有效的.提出的方法具有如下三个特点:1)简单且易于实现;2)测试精度较高;3)可解释性强. 展开更多
关键词 特征选择 数据预处理 遗传算法 不一致性
在线阅读 下载PDF
海量卫星重力梯度观测数据确定地球重力位模型的数值方法 被引量:1
13
作者 朱广彬 常晓涛 +2 位作者 邹贤才 徐新禹 王建强 《大地测量与地球动力学》 CSCD 北大核心 2011年第6期140-144,共5页
基于空域最小二乘法,对卫星重力梯度数据确定地球重力场中的Cholesky分解法、预条件共轭梯度法以及OpenMP并行算法3种数值方法进行比较与分析。研究表明,在计算机硬件资源有限的情况下,传统的Cholesky分解法已经无法满足求解要求;预条... 基于空域最小二乘法,对卫星重力梯度数据确定地球重力场中的Cholesky分解法、预条件共轭梯度法以及OpenMP并行算法3种数值方法进行比较与分析。研究表明,在计算机硬件资源有限的情况下,传统的Cholesky分解法已经无法满足求解要求;预条件共轭梯度法的求解效率较之Cholesky分解法有改进,但其以损失小量精度为代价;OpenMP并行算法在不损失求解精度的条件下,可提高求解的效率。 展开更多
关键词 卫星重力梯度 CHOLESKY分解 预条件共轭梯度 OpenMP并行算法 数据处理
在线阅读 下载PDF
交通监测毫米波雷达数据预处理方法研究 被引量:7
14
作者 田丰 霍雨佳 符渭波 《微波学报》 CSCD 北大核心 2022年第6期37-42,70,共7页
毫米波雷达交通监测场景中待检测目标较多、各目标间点迹特征接近,导致点迹凝聚精度低,对此,文中提出一种改进的交通监测毫米波雷达数据预处理方法。首先通过短时多帧数据积累提高车辆目标点迹密度,随后利用加权欧式距离度量点间距离以... 毫米波雷达交通监测场景中待检测目标较多、各目标间点迹特征接近,导致点迹凝聚精度低,对此,文中提出一种改进的交通监测毫米波雷达数据预处理方法。首先通过短时多帧数据积累提高车辆目标点迹密度,随后利用加权欧式距离度量点间距离以提高密集间隔目标的类间距离,并对点间距离分布进行曲线拟合实现聚类算法参数的自适应求解,最后利用基于密度的噪声空间聚类(DBSCAN)算法对点迹进行凝聚处理。由雷达实测数据进行实验验证,相较于传统方法,原始点迹数据经凝聚后跟踪得到车流量统计精度提高10.97%,结果表明所提方法能够对车辆点迹信息进行较为精确的凝聚,改善了毫米波雷达在交通监测领域的应用效果。 展开更多
关键词 交通监测 毫米波雷达 数据预处理 点迹凝聚 聚类算法
原文传递
基于学生伤害因素的关联规则挖掘
15
作者 何伟全 王天志 +3 位作者 曹洪华 向曦 马百友 段万春 《昆明理工大学学报(自然科学版)》 CAS 2015年第3期122-127,共6页
基于实际数据分析的管理和决策能够弥补简单主观经验主义的缺陷,该方法在高校学生安全工作的管理中越来越得到重视.笔者运用关联规则对收集的学生伤害数据进行研究,提出了"大学生伤害频繁项挖掘"等算法,并进行数据挖掘,获得... 基于实际数据分析的管理和决策能够弥补简单主观经验主义的缺陷,该方法在高校学生安全工作的管理中越来越得到重视.笔者运用关联规则对收集的学生伤害数据进行研究,提出了"大学生伤害频繁项挖掘"等算法,并进行数据挖掘,获得了大量的关联规则及多个影响因素之间内在联系.同时发现关联规则数对可信度的变化比较敏感,多线程运行对提高程序效率非常有效. 展开更多
关键词 数据预处理 频繁项挖掘算法 数据缩减 阈值调整
原文传递
基于两种方式的股票时间序列关联的研究
16
作者 闭英权 秦亮曦 《微计算机信息》 北大核心 2008年第36期242-243,258,共3页
Es-Apriori算法是一个对多元时间序列跨事务关联规则分析的高效处理算法,本文针对当前证券交易市场的特点对此算法的数据预处理部分改了一些改进,加入股票成交量数据项以及二维时间模式两种方式的分析。试验证明,该改进对投资者提供了... Es-Apriori算法是一个对多元时间序列跨事务关联规则分析的高效处理算法,本文针对当前证券交易市场的特点对此算法的数据预处理部分改了一些改进,加入股票成交量数据项以及二维时间模式两种方式的分析。试验证明,该改进对投资者提供了更为有效的决策支持。 展开更多
关键词 数据挖掘 Es-Apriori算法 成交量 数据预处理
在线阅读 下载PDF
麻雀搜索算法优化BP算法结合高光谱预测小米米粉糊化特性 被引量:6
17
作者 王国梁 王文俊 +5 位作者 成锴 刘鑫 赵建贵 李洪 郭二虎 李志伟 《食品科学》 EI CAS CSCD 北大核心 2022年第19期65-70,共6页
为了实现小米米粉糊化特征指标的批量、快速检测,探索计算机深度学习结合高光谱成像技术在小米米粉糊化特征指标预测方面的应用方法,本研究运用高光谱数据提取、预处理分步运算程序获得小米米粉平均光谱数据,并以该数据矩阵为基础,运用... 为了实现小米米粉糊化特征指标的批量、快速检测,探索计算机深度学习结合高光谱成像技术在小米米粉糊化特征指标预测方面的应用方法,本研究运用高光谱数据提取、预处理分步运算程序获得小米米粉平均光谱数据,并以该数据矩阵为基础,运用麻雀搜索算法(sparrow search algorithm,SSA)优化误差反向传播(error backpropagation,BP)算法进行待测样品糊化特征指标回归、预测。结果表明,光谱数据预处理程序能够标准化并简化光谱数据提取、预处理过程,该程序在粉末及小颗粒样本光谱数据的提取、预处理过程中具有普遍适用性;运用BP算法及SSA优化BP算法对小米米粉糊化各特征指标进行预测,从预测值与测试值间均方误差(mean squared error,MSE)可以看出,各指标MSE均下降,以峰值黏度(peak viscosity,PV)为例,其MSE从0.026 6降为0.017 5,可知运用SSA优化BP算法能够提高小米米粉糊化特征指标预测精度,降低MSE。本研究结论可以为高光谱成像结合计算机深度学习在小米米粉糊化特性预测方面应用提供理论支撑。 展开更多
关键词 小米米粉糊化特征指标 高光谱成像 数据预处理 麻雀搜索算法
在线阅读 下载PDF
高精度光学电压互感器技术及应用 被引量:4
18
作者 陈波 李俊一 +2 位作者 王军龙 于文鹏 魏晓邢 《电网与清洁能源》 北大核心 2017年第6期7-13,共7页
主要介绍了0.05级高精度光学电压互感器的技术方案、关键技术以及装置的实现。目前,该装置已经通过了国家高压电器质量监督检验中心的精度试验,准确级达到0.05/3P;光学电压互感器作为标准源已在广西钦州排岭220 k V智能变电站挂网应用,... 主要介绍了0.05级高精度光学电压互感器的技术方案、关键技术以及装置的实现。目前,该装置已经通过了国家高压电器质量监督检验中心的精度试验,准确级达到0.05/3P;光学电压互感器作为标准源已在广西钦州排岭220 k V智能变电站挂网应用,实现了对榄坪II线A相电子式电压互感器的在线校验,校验数据通过MMS网络向后台发布,结果表明,被校电子式电压互感器与标准光学电压互感器比值误差小于0.2%,相位误差小于10′,满足0.2级准确度要求。 展开更多
关键词 光学电压互感器 泡克尔斯效应 数据预处理算法 在线校验 MMS网络
在线阅读 下载PDF
基于海洋潜标观测数据压缩的数据预处理算法 被引量:2
19
作者 伍汉青 周伟 +1 位作者 杨群慧 季福武 《海洋技术学报》 2022年第4期1-9,共9页
海洋潜标通过搭载各种观测设备实现海面以下的海洋环境要素的长期观测,是海洋环境监测中最可靠、最准确的手段之一。本文针对潜标传感器观测数据的特点,提出了一种数据预处理算法,该算法通过数据筛选、数据差分和数据去重,完成对海洋传... 海洋潜标通过搭载各种观测设备实现海面以下的海洋环境要素的长期观测,是海洋环境监测中最可靠、最准确的手段之一。本文针对潜标传感器观测数据的特点,提出了一种数据预处理算法,该算法通过数据筛选、数据差分和数据去重,完成对海洋传感器数据的预处理。数据预处理算法的运算简便、消耗的临时空间资源少。Matlab平台仿真实验结果表明:对CTDDO传感器观测数据进行预处理后,动态Huffman算法的压缩效率提高了约86%、LZW算法的压缩效率提高了约72%、Mini-LZO算法的压缩效率最多提高约25%,并且数据预处理算法具备较强的通用性。数据预处理算法不仅可以大幅提高无损压缩算法对传感器观测数据的压缩效率,有利于有效节省数据存储空间、提高通信网络在单位时间内的吞吐传输能力;而且能够提高海洋潜标嵌入式系统的计算速度,有利于降低系统功耗,进而延长潜标的水下自主工作时间,具有广阔的应用前景。 展开更多
关键词 海洋潜标 数据压缩 无损压缩算法 数据预处理算法
在线阅读 下载PDF
遗传优化算法在基因数据分类中的应用 被引量:2
20
作者 孟范静 刘毅慧 +1 位作者 王洪国 成金勇 《生物信息学》 2008年第3期119-122,共4页
本文提出了一种基于遗传算法的基因微阵列数据特征提取方法。首先对原始数据进行标准化,然后利用方差分析方法对数据进行降低维数处理,最后利用遗传算法对数据进行优化。针对基因数据对遗传算子和适应度函数进行设置,优化数据集选取特... 本文提出了一种基于遗传算法的基因微阵列数据特征提取方法。首先对原始数据进行标准化,然后利用方差分析方法对数据进行降低维数处理,最后利用遗传算法对数据进行优化。针对基因数据对遗传算子和适应度函数进行设置,优化数据集选取特征基因,得到较小的特征子集。为了验证选取的特征,利用样本划分法通过判别分析建立分类器进行判定。实验论证此方法具有理想的分类效果,算法稳定、效率高。 展开更多
关键词 基因数据 数据预处理 特征选取 遗传算法 分类评价
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部