A method of fast data processing has been developed to rapidly obtain evolution of the electron density profile for a multichannel polarimeter-interferometer system(POLARIS)on J-TEXT. Compared with the Abel inversio...A method of fast data processing has been developed to rapidly obtain evolution of the electron density profile for a multichannel polarimeter-interferometer system(POLARIS)on J-TEXT. Compared with the Abel inversion method, evolution of the density profile analyzed by this method can quickly offer important information. This method has the advantage of fast calculation speed with the order of ten milliseconds per normal shot and it is capable of processing up to 1 MHz sampled data, which is helpful for studying density sawtooth instability and the disruption between shots. In the duration of a flat-top plasma current of usual ohmic discharges on J-TEXT, shape factor u is ranged from 4 to 5. When the disruption of discharge happens, the density profile becomes peaked and the shape factor u typically decreases to 1.展开更多
在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来快速判断用户的真实意...在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来快速判断用户的真实意图,过滤无用冗余信息后返回一个概率最大答案给用户。FastText是Facebook AI Research推出的文本分类和词训练工具,它的最大特点是模型简单并且在文本分类的准确率上,和现有的深度学习的方法效果相近,即在保证了准确率的情况下大大缩短了分类时间。展开更多
With user-generated content, anyone can De a content creator. This phenomenon has infinitely increased the amount of information circulated online, and it is beeoming harder to efficiently obtain required information....With user-generated content, anyone can De a content creator. This phenomenon has infinitely increased the amount of information circulated online, and it is beeoming harder to efficiently obtain required information. In this paper, we describe how natural language processing and text mining can be parallelized using Hadoop and Message Passing Interface. We propose a parallel web text mining platform that processes massive amounts data quickly and efficiently. Our web knowledge service platform is designed to collect information about the IT and telecommunications industries from the web and process this in-formation using natural language processing and data-mining techniques.展开更多
矢量数据智能分类是利用智能化技术将未知类别的矢量数据归类到已有类别体系中,目标是实现数据智能快速准确分类、缩短数据整合周期、提升数据治理效能。现有研究在一定程度上提升了数据分类的精度,但所选取的特征有限,且面对海量数据...矢量数据智能分类是利用智能化技术将未知类别的矢量数据归类到已有类别体系中,目标是实现数据智能快速准确分类、缩短数据整合周期、提升数据治理效能。现有研究在一定程度上提升了数据分类的精度,但所选取的特征有限,且面对海量数据时未充分顾及矢量数据的语义特征。因此,基于BERT(bidirectional encoder representations from Transformer)模型,本文提出一种基于属性文本语义解析的矢量数据分类方法Attribute-LE(local-enhanced)-BERT。通过构建局部特征增强模块,挖掘数据属性字段的语义特征;并融合多层加权池化模块,建立空间对象属性文本与数据类别之间的映射关系,实现待归类矢量数据所属类别的准确判定;为验证方法可行性,与已有常用模型进行比较分析。结果表明,相较于已有模型,在线、面数据集上,本文方法性能表现优秀,对与训练数据分类体系一致度高的类型可获得超过90%的预测准确率。展开更多
【目的】随着全球对可再生能源的依赖增加,风力发电作为其中的重要组成部分,正受到越来越多的关注。人工智能技术的快速发展,特别是大语言模型(large language models,LLM)的崛起,为风力发电领域带来了新的机遇和挑战。【方法】本文概...【目的】随着全球对可再生能源的依赖增加,风力发电作为其中的重要组成部分,正受到越来越多的关注。人工智能技术的快速发展,特别是大语言模型(large language models,LLM)的崛起,为风力发电领域带来了新的机遇和挑战。【方法】本文概述了风力发电的重要性以及人工智能对其发展的推动作用,并详细介绍了LLM的原理和发展现状。综述了LLM在风电领域的典型应用,包括智能问答系统和自动文档生成等文本信息处理应用,通过生成技术报告和诊断报告,提升信息管理效率。【结果】在数据分析与预测方面,LLM支持风力发电量预测、电力系统运行优化等,显著提高决策的精准性与实时性。在设备运维中,LLM结合图像识别技术,实现风电设备故障的智能检测与诊断,有效降低运维成本。展望了LLM在未来风电系统中的发展前景,重点包括加强数据安全和质量管理,提升模型的可解释性和可靠性,以及优化硬件算力以满足大规模模型的计算需求。【结论】本研究为大语言模型在风力发电领域的应用提供支撑。展开更多
基金supported by the National Magnetic Confinement Fusion Science Program of China(Nos.2014GB106000,2014GB106002,and2014GB106003)National Natural Science Foundation of China(Nos.11275234,11375237 and 11505238)Scientific Research Grant of Hefei Science Center of CAS(No.2015SRG-HSC010)
文摘A method of fast data processing has been developed to rapidly obtain evolution of the electron density profile for a multichannel polarimeter-interferometer system(POLARIS)on J-TEXT. Compared with the Abel inversion method, evolution of the density profile analyzed by this method can quickly offer important information. This method has the advantage of fast calculation speed with the order of ten milliseconds per normal shot and it is capable of processing up to 1 MHz sampled data, which is helpful for studying density sawtooth instability and the disruption between shots. In the duration of a flat-top plasma current of usual ohmic discharges on J-TEXT, shape factor u is ranged from 4 to 5. When the disruption of discharge happens, the density profile becomes peaked and the shape factor u typically decreases to 1.
文摘在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来快速判断用户的真实意图,过滤无用冗余信息后返回一个概率最大答案给用户。FastText是Facebook AI Research推出的文本分类和词训练工具,它的最大特点是模型简单并且在文本分类的准确率上,和现有的深度学习的方法效果相近,即在保证了准确率的情况下大大缩短了分类时间。
文摘With user-generated content, anyone can De a content creator. This phenomenon has infinitely increased the amount of information circulated online, and it is beeoming harder to efficiently obtain required information. In this paper, we describe how natural language processing and text mining can be parallelized using Hadoop and Message Passing Interface. We propose a parallel web text mining platform that processes massive amounts data quickly and efficiently. Our web knowledge service platform is designed to collect information about the IT and telecommunications industries from the web and process this in-formation using natural language processing and data-mining techniques.
文摘矢量数据智能分类是利用智能化技术将未知类别的矢量数据归类到已有类别体系中,目标是实现数据智能快速准确分类、缩短数据整合周期、提升数据治理效能。现有研究在一定程度上提升了数据分类的精度,但所选取的特征有限,且面对海量数据时未充分顾及矢量数据的语义特征。因此,基于BERT(bidirectional encoder representations from Transformer)模型,本文提出一种基于属性文本语义解析的矢量数据分类方法Attribute-LE(local-enhanced)-BERT。通过构建局部特征增强模块,挖掘数据属性字段的语义特征;并融合多层加权池化模块,建立空间对象属性文本与数据类别之间的映射关系,实现待归类矢量数据所属类别的准确判定;为验证方法可行性,与已有常用模型进行比较分析。结果表明,相较于已有模型,在线、面数据集上,本文方法性能表现优秀,对与训练数据分类体系一致度高的类型可获得超过90%的预测准确率。
文摘【目的】随着全球对可再生能源的依赖增加,风力发电作为其中的重要组成部分,正受到越来越多的关注。人工智能技术的快速发展,特别是大语言模型(large language models,LLM)的崛起,为风力发电领域带来了新的机遇和挑战。【方法】本文概述了风力发电的重要性以及人工智能对其发展的推动作用,并详细介绍了LLM的原理和发展现状。综述了LLM在风电领域的典型应用,包括智能问答系统和自动文档生成等文本信息处理应用,通过生成技术报告和诊断报告,提升信息管理效率。【结果】在数据分析与预测方面,LLM支持风力发电量预测、电力系统运行优化等,显著提高决策的精准性与实时性。在设备运维中,LLM结合图像识别技术,实现风电设备故障的智能检测与诊断,有效降低运维成本。展望了LLM在未来风电系统中的发展前景,重点包括加强数据安全和质量管理,提升模型的可解释性和可靠性,以及优化硬件算力以满足大规模模型的计算需求。【结论】本研究为大语言模型在风力发电领域的应用提供支撑。