期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
TLCNN:Tabular data-based lightweight convolutional neural network for electricity energy demand prediction
1
作者 Nazmul Huda Badhon Imrus Salehin +3 位作者 Md Tomal Ahmed Sajib Md Sakibul Hassan Rifat S.M.Noman Nazmun Nessa Moon 《Global Energy Interconnection》 2025年第6期1010-1029,共20页
Forecasting energy demand is essential for optimizing energy generation and effectively predicting power system needs.Recently,many researchers have developed various models on tabular datasets to enhance the effectiv... Forecasting energy demand is essential for optimizing energy generation and effectively predicting power system needs.Recently,many researchers have developed various models on tabular datasets to enhance the effectiveness of demand prediction,including neural networks,machine learning,deep learning,and advanced architectures such as CNN and LSTM.However,research on the CNN models has struggled to provide reliable outcomes due to insufficient dataset sizes,repeated investigations,and inappropriate baseline selection.To address these challenges,we propose a Tabular data-based Lightweight Convolutional Neural Network(TLCNN)model for predicting energy demand.It frames the problem as a regression task that effectively captures complex data trends for accurate forecasting.The BanE-16 dataset is preprocessed using normalization techniques for categorical and numerical data before training the model.The proposed approach dynamically selects relevant features through a two-dimensional convolutional structure that improves adaptability.The model’s performance is evaluated using MSE,MAE,and Accuracy metrics.Experimental results show that TLCNN achieves a 10.89%lower MSE than traditional ML algorithms,demonstrating superior predictive capability.Additionally,TLCNN’s lightweight structure enhances generalization while reducing computational costs,making it suitable for real-world energy forecasting tasks.This study contributes to energy informatics by introducing an optimized deep-learning framework that improves demand prediction by ensuring robustness and adaptability for tabular data. 展开更多
关键词 CNN tabular data ENERGY Deep learning ELECTRICITY
在线阅读 下载PDF
Tabular表达式的指称语义研究 被引量:2
2
作者 张鹏 刘磊 +1 位作者 刘华虓 金英 《软件学报》 EI CSCD 北大核心 2014年第6期1212-1224,共13页
Tabular表达式是一种采用表格化结构组织函数或关系的形式化描述工具,在需求工程领域中具有广泛的应用,为Tabular表达式建立形式的语义模型是非常必要的.针对Tabular表达式通用模型,给出了Tabular表达式的形式文法及指称语义.通过定义... Tabular表达式是一种采用表格化结构组织函数或关系的形式化描述工具,在需求工程领域中具有广泛的应用,为Tabular表达式建立形式的语义模型是非常必要的.针对Tabular表达式通用模型,给出了Tabular表达式的形式文法及指称语义.通过定义形式文法中各语法单元的语义指派方程,描述了Tabular表达式的指称语义,分别对传统类型Tabular表达式和新类型Tabular表达式中一些典型表类型的指称语义进行了描述,并与其他几种Tabular表达式的语义描述方法进行了比较.分析结果表明:该语义描述方法不仅准确描述了Tabular表达式的语义,而且不再受Tabular表达式模型和Tabular表达式类型的限制,打破了现有方法的局限性,是一种非常有效的方法. 展开更多
关键词 tabular表达式 指称语义 软件说明文档
在线阅读 下载PDF
面向Tabular库的数据模型及其查询问题 被引量:1
3
作者 黄冬梅 孙乐 +2 位作者 石少华 苏诚 赵丹枫 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第1期56-65,共10页
信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据... 信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据特点.然而使用无结构和半结构化文档组织和管理Excel等表单数据,存在着数据弱可控、弱可用、及访问效率差的问题.针对该类问题,本文以Excel文本为数据源,提出了一种新的面向Tabular库的关系数据模型并讨论了其上的查询及优化问题.首先,给出了Tabular表单数据的形式化定义,其次,设计PartiPath划分树实现表格的关系划分及结构转换,在关系模型的基础上,给出其数据模型及数据模式,再者,定义了表单数据上的基本查询问题及融合用户兴趣指数改进查询相似度指标,最后给出实验分析并作出总结. 展开更多
关键词 tabular 查询 数据模型 PartiPath划分树 关系模型
在线阅读 下载PDF
Tabular氧化铝的显微结构 被引量:5
4
作者 高振昕 《耐火材料》 CAS 北大核心 1994年第5期293-299,共7页
用光学显微镜、扫描电镜、能谱仪和衍射仪研究了Tabular氧化铝的显微结构。借用一些显微照片解释了刚玉和β-Al2O3结晶形貌的细节。特别描述了刚玉表面的台阶生长形貌。
关键词 tabular 氧化铝 显微结构 台阶生长 耐火材料
在线阅读 下载PDF
Tabular表达式中正规函数表操作的形式语义
5
作者 周文博 刘磊 +1 位作者 张鹏 吕帅 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第2期85-91,共7页
正规函数表是一类典型的Tabular表达式,被广泛应用于软件说明文档.文中对Tabular表达式中正规函数表操作的语义进行研究.首先给出了正规函数表的形式文法,讨论了规整性、完全性和不可交叉性等性质,说明了其求值过程;然后根据操作的影响... 正规函数表是一类典型的Tabular表达式,被广泛应用于软件说明文档.文中对Tabular表达式中正规函数表操作的语义进行研究.首先给出了正规函数表的形式文法,讨论了规整性、完全性和不可交叉性等性质,说明了其求值过程;然后根据操作的影响范围,以内部操作和外部操作为分类标准,分别对二元操作、替换操作、提取操作和扩展操作的语义进行刻画,讨论了各个操作的封闭性;最后通过电梯控制系统实例分析了相关操作的实际应用场景,说明了正规函数表操作的形式语义的合理性和可用性.实例结果表明,文中提出的正规函数表操作的语义描述与实际结果是一致的. 展开更多
关键词 正规函数表 tabular表达式 操作语义 软件文档 规格说明
在线阅读 下载PDF
TABULAR TECHNIQUES FOR OR-COINCIDENCE LOGIC 被引量:12
6
作者 Wang Pengjun Chen Xiexiong 《Journal of Electronics(China)》 2006年第2期269-273,共5页
The map folding method for the conversion between Boolean expression and COC expansions is analyzed. Based on it, the tabular techniques are proposed for the conversion between Boolean expression and COC expansion and... The map folding method for the conversion between Boolean expression and COC expansions is analyzed. Based on it, the tabular techniques are proposed for the conversion between Boolean expression and COC expansion and for the derivation of GOC expansions with fixed polarities. The Fast Tabular Technique (FTT) for the conversion from the Boolean expression to the GOC expansion with the required polarity is also proposed. The simulative result shows this FTT is faster than others in references because of its inherent parallelism. 展开更多
关键词 tabular technique OR-coincidence logic Fixed polarity OR-coincidence expansion
在线阅读 下载PDF
Effect of Mg/Al Ratios on Hydration Mechanism of Tabular Alumina Carbon Composites Reinforced by Al4C3 in situ Reaction 被引量:2
7
作者 杨依帆 JIANG Mingxue +4 位作者 YANG Ding'ao YUAN Shouqian ZHAO Jizeng ZHAO Wei YANG Mengyao 《Journal of Wuhan University of Technology(Materials Science)》 SCIE EI CAS 2017年第4期800-805,共6页
Hydration mechanism of tabular alumina carbon composites reinforced by Al4C3 in situ reaction with Mg and Al was researched in water steam using super automatic thermostatic water bath from 25 ℃ to 85 ℃. It is shown... Hydration mechanism of tabular alumina carbon composites reinforced by Al4C3 in situ reaction with Mg and Al was researched in water steam using super automatic thermostatic water bath from 25 ℃ to 85 ℃. It is shown that hydration mechanism of the composites is chemical reaction control at 44.3 ℃-84 ℃ in H2O(g). The hydration was controlled by diffusion from 24.7 ℃ to 33 ℃. The ratio of added Mg/Al influences the HMOR of the composites.The mechanism of HMOR of the composites with different ratios of Mg/Al can be discovered by means of SEM analysis. The active Mg/Al powder and flake graphite inside give the composites outstanding hot strength resulting from the interlocking structure of Al4C3 crystals at high temperature. Besides, the matrix changes into the Al4C3 with high refractoriness. The method of preventing the hydration of tabular alumina carbon composites reinforced by Al4C3 in situ reaction was immersed in the wax at suitable temperature or storing them below 33 ℃ in a dry place or storing them with paraffin-coating. 展开更多
关键词 hydration mechanism tabular alumina carbon Al4C3 Mg/Al ratios
原文传递
Tabular氧化铝的再热沿晶开裂 被引量:1
8
作者 高振昕 《耐火材料》 CAS 北大核心 1995年第3期165-169,共5页
AlcoaTabular氧化铝部分晶体异常长大,达40~600μm。当再热处理时,这些晶体将发生沿晶开裂现象。借助于OM和SEM研究了裂纹的走向和尺寸。
关键词 氧化铝 再热处理 沿晶开裂 颗粒 耐火材料
在线阅读 下载PDF
Effects of Tabular Corundum Types on Properties of Corundum-spinel Castables
9
作者 ZHAO Hongbo HUANG Jin +3 位作者 YU Tongshu CHEN Lu ZHANG Hui LU Xiangyang 《China's Refractories》 CAS 2017年第4期50-52,共3页
The corundum - spinel castables were prepared by six kinds of tabular corundum, as aggregates, respective- ly, and their linear change rate on heating, apparent porosity, bulk density, cold modulus of rupture, coht cr... The corundum - spinel castables were prepared by six kinds of tabular corundum, as aggregates, respective- ly, and their linear change rate on heating, apparent porosity, bulk density, cold modulus of rupture, coht crushing strength, hot modulus of rupture and thermal shock resistance were compared and studied. The results show that: 1) the six tabular corundum materials have similar main chemical composition but their physical properties vary for the different technical procedures which result in different properties of castables ; 2 ) the optimal properties of corundum - spinel castables corre- spotut to different tabular corundum types, so the corundum type shall be selected according to the application of the castables. 展开更多
关键词 tabular corundum corundum - spinel castables PROPERTIES
在线阅读 下载PDF
Geology and Mineral Deposits of Saraikistan (South Punjab, Koh Sulaiman Range) of Pakistan: A Tabular Review of Recently Discovered Biotas from Pakistan and Paleobiogeographic Link: Phylogeny and Hypodigm of Poripuchian Titanosaurs from Indo-Pakistan
10
作者 Muhammad Sadiq Malkani 《Open Journal of Geology》 2023年第8期900-958,共59页
Saraikistan (South Punjab and surrounding) area of Pakistan is located in the central Pakistan. This area represents Triassic-Jurassic to Recent sedimentary marine and terrestrial strata. Most of the Mesozoic and Earl... Saraikistan (South Punjab and surrounding) area of Pakistan is located in the central Pakistan. This area represents Triassic-Jurassic to Recent sedimentary marine and terrestrial strata. Most of the Mesozoic and Early Cenozoic are represented by marine strata with rare terrestrial deposits, while the Late Cenozoic is represented by continental fluvial deposits. This area hosts significant mineral deposits and their development can play a significant role in the development of Saraikistan region and ultimately for Pakistan. The data of recently discovered biotas from Cambrian to Miocene age are tabulated for quick view. Mesozoic biotas show a prominent paleobiogeographic link with Gondwana and Cenozoic show Eurasian. Phylogeny and hypodigm of Poripuchian titanosaurs from India and Pakistan are hinted at here. 展开更多
关键词 GEOLOGY Minerals Cement Dams Biota tabular Data Paleobiogeography Saraikistan South Punjab Sulaiman Range Pakistan Titanosaurs Indo-Pakistan
在线阅读 下载PDF
Synthesis of Ag_(2)S nano-sized clusters and their chemical sensitizations in AgCl cubic and {100} tabular microcrystal imaging systems 被引量:4
11
作者 LI Zhi ZHENG Tong +2 位作者 CHEN Lijuan PENG Bixian YANG Li 《Science China Chemistry》 SCIE EI CAS 2005年第6期516-522,共7页
In recent years much attention has been devoted to AgCl emulsion owing to its se-rial advantages and inimitable potential.But in the research of this emulsion a thorny problem remains unsolved till now,which is the im... In recent years much attention has been devoted to AgCl emulsion owing to its se-rial advantages and inimitable potential.But in the research of this emulsion a thorny problem remains unsolved till now,which is the improvement in sensitivity is always accompanied with high fog density.In this work 5 nm Ag_(2)S particles were prepared and used as novel sensitizers in AgCl cubic and{100}tabular microcrystal emulsions.The novel sensitizer shows an effective sensitizing ability for silver chloride emulsion,and it is superior to the traditional Na_(2)S_(2)O_(3) sensi-tizer because by using it comparatively high sensitivity can be obtained with lower fog density.So the above sensitizing problem is going to be effectively solved.To discover the evolution mechanism of the sensitizer clusters and explain their excellent sensitizing properties,diffuse reflectance spectroscopy(DRS)was used as a probe on the AgCl microcrystal surface. 展开更多
关键词 silver sulfide NANO-SIZED silver chloride{100}tabular microcrystal chemical sensitization.
原文传递
针对多标记表格数据的半监督学习方法
12
作者 葛泽庆 黄圣君 《计算机科学》 北大核心 2026年第3期151-157,共7页
表格数据在医学、金融和制造业等领域具有广泛应用,其多标记分类任务对揭示现实世界中复杂的关联特性至关重要。然而,获取大规模标记数据集往往成本高昂,这给研究带来了挑战。虽然半监督学习利用未标记样本在图像和文本数据中取得了成功... 表格数据在医学、金融和制造业等领域具有广泛应用,其多标记分类任务对揭示现实世界中复杂的关联特性至关重要。然而,获取大规模标记数据集往往成本高昂,这给研究带来了挑战。虽然半监督学习利用未标记样本在图像和文本数据中取得了成功,但由于表格数据缺乏固有的空间或语义结构,使得传统方法效率较低。为了应对这些挑战,提出了一种针对多标记表格数据的半监督学习框架。该方法引入了一种结构保留的数据增强方法,在特征表示空间内添加高斯噪声保留原始数据结构,与基于一致性的正则化技术,在样本及其扰动版本之间进行正则化,以增强泛化能力。此外,还开发了一种基于注意力机制的机制,有选择地从标记数据中聚合邻域信息,从而使模型能够有效地利用局部特征相关性。在10个公共多标记表格数据集上进行了广泛的实验,结果证明了该方法的有效性。 展开更多
关键词 表格数据 多标记分类 半监督学习 数据增强 注意力机制
在线阅读 下载PDF
基于车流组织理论的集装箱班列客车化开行方案优化研究
13
作者 于汝滨 任冲 闫海峰 《铁道经济研究》 2026年第1期25-35,69,共12页
“十四五”期间铁路集装箱运输需求持续攀升,市场对集装箱班列运输的时效性与稳定性提出更高要求,铁路行业推出集装箱班列客车化运输新模式,这种“定时、定点、定线、定价、定车次”的客车化开行模式,可减少甚至消除改编作业环节,压缩... “十四五”期间铁路集装箱运输需求持续攀升,市场对集装箱班列运输的时效性与稳定性提出更高要求,铁路行业推出集装箱班列客车化运输新模式,这种“定时、定点、定线、定价、定车次”的客车化开行模式,可减少甚至消除改编作业环节,压缩车流等待时间,显著提升铁路“门到门”货运效率,是“十五五”时期增强铁路货运竞争力、推动“公转铁”结构调整的关键举措。目前集装箱班列客车化开行方案优化研究仍处起步阶段,尚未实现对客车化班列总时效的整体优化,导致实际运营缺乏理论支撑,货运时效难以匹配市场需求。因此,基于车流组织和旅客列车开行方案优化问题共性,以实现集装箱箱流客流化运输为目标,开展数学模型与算法研究。研究发现:客流最短径路出行、可完全送达、直达流无换乘等前提假设,可有效解决“客流可拆与车流不可拆”“长途客车可带短途客流与车流接续归并”2项阻碍客流分配向车流组织转换的基本矛盾,从而将箱流类比于客流进行数学描述与优化。参照旅客列车开行方案的多目标优化思路,以客流空耗总时间最小化为目标函数,以客车双向运行、起讫点唯一配对、不超过车站始发能力、满足直通客流要求及中间节点客流守恒为约束条件,构建“基于车流组织理论的旅客列车开行方案优化阶跃函数模型”;基于表格计算法思路设计求解算法,借助Matlab实现模型的计算机自动求解;通过求解阶跃函数模型,可得到整体时效最优的集装箱班列客车化开行方案;以既有国铁路网中成都、武汉、上海等主要集装箱集散地及衔接路网为对象设计算例,代入铁路运营实际数据求解后,结果验证了模型与算法的有效性。基于车流组织与旅客列车开行方案优化方法具有互通性,进而明确集装箱班列客车化开行的前提在于集装箱箱流的客流化,通过数学建模达成箱流类比客流优化的核心目标,有效破解集装箱班列客车化开行方案优化的新问题;同时,针对客车化集装箱班列运行时效整体优化与开行方案高效求解,为班列客车化等铁路客货列车协同优化问题提供了全新研究方法,更为“十五五”铁路货运向现代物流转型提供关键技术支撑。 展开更多
关键词 集装箱班列 车流组织 旅客列车开行方案 阶跃函数 表格计算法
在线阅读 下载PDF
Effects of Tabular Stratified CO_(2)/O_(2)Jets on Dynamic and NO_(x)Emission Characteristics of a Model Gas Turbine Combustor 被引量:1
14
作者 TAO Chengfei ZHOU Hao 《Journal of Thermal Science》 SCIE EI CAS CSCD 2021年第4期1160-1173,共14页
The effects of tabular stratified CO_(2)/O_(2)jet in cross flow on thermoacoustic instability and NO_(x)emission were experimentally studied.To explore the dependence of injection positions on flame stability,two fact... The effects of tabular stratified CO_(2)/O_(2)jet in cross flow on thermoacoustic instability and NO_(x)emission were experimentally studied.To explore the dependence of injection positions on flame stability,two factors were taken:the injection height and the injection direction of CO_(2)/O_(2)gas.Results show that the injection positions seriously affect the control effectiveness.The optimum acoustic amplitude-damped ratio of thermoacoustic instability can reach 76.61%with the first layer of horizontal direction.The sound pressure amplitude declined from 56 Pa to 13.1 Pa.The concentration-damped ratio of NO_(x)emission can achieve 66.67%with the first layer of vertical direction.The concentration of NO_(x)emission declined from 50.4 mg/m^(3)to 16.8mg/m^(3)as the jet in cross flow rate increased.Higher oxygen ratio of stratified CO_(2)/O_(2)jets can produce lower NO_(x)emission but higher combustion instability.The descending gradient of NO_(x)emissions is different among different injection positions.Frequency shifting of the sound pressure and flame CH*chemiluminescence emerged.The oscillation frequency declined as the flow rate of CO_(2)/O_(2)jets increased.The unsteady long and compact flame was dispersed after CO_(2)/O_(2)injection.The macrostructure of flame was characterized as flatter and short under jet in cross flow.The variation curves of the flame length and top view area are similar to the shape of half saddle lines.This research proved the optimal control of thermoacoustic instability and NO_(x)emissions with a passive method,which could be conducive to the realization of clean and secure combustion in industrial lean premixed combustors. 展开更多
关键词 CO_(2)/O_(2) combustion instability jet in cross flow NO_(x)emission tabular injector
原文传递
信用风险不平衡数据的表格生成对抗网络优化与分类
15
作者 王轶群 王笑 高燕程 《计算机科学与探索》 北大核心 2026年第2期561-573,共13页
人工智能在信用风险评估中能有效识别风险并提升决策效率,然而,现有信用风险数据普遍存在类别不平衡问题,导致模型在预测时偏向多数类,影响评估的准确性和可靠性。针对数据不平衡问题,提出一种融合变分自编码器(VAE)和条件表格生成对抗... 人工智能在信用风险评估中能有效识别风险并提升决策效率,然而,现有信用风险数据普遍存在类别不平衡问题,导致模型在预测时偏向多数类,影响评估的准确性和可靠性。针对数据不平衡问题,提出一种融合变分自编码器(VAE)和条件表格生成对抗网络(CTGAN)的混合生成模型(VCTGAN),用于合成高质量平衡数据集。通过VAE中的隐变量学习真实数据的关键特征和潜在分布,生成结构化隐变量作为原始CTGAN的输入;在数据生成器中引入自注意力机制用于更好地捕捉不平衡数据的突出特征;在判别器中加入对比损失模块来增强生成数据的类别间差异,达到提高生成数据质量的目的。通过在Taiwan Credit和Give Me Some Credit两个基准数据集上的系统实验验证,分别取得了89.91%和96.89%的最佳分类准确率,结果表明这种改进方法在处理信用数据不平衡方面明显优于传统方法。消融实验进一步验证了各组件对性能的贡献,证实了所提方法的合理性和有效性。它不仅生成高质量的平衡数据集,而且提高模型识别少数类别的能力,为解决金融领域的数据不平衡问题提供了新的技术方案。 展开更多
关键词 条件表格生成对抗网络(CTGAN) 生成模型 不平衡数据集 机器学习 信用风险评估
在线阅读 下载PDF
基于InSAR技术和TabPFN模型的三峡库区巴东—秭归段滑坡易发性评价
16
作者 谌华 季苏杰 +2 位作者 刘淼 张慧宇 涂宽 《地震工程学报》 北大核心 2026年第2期251-264,296,共15页
依托表格先验数据拟合网络(TabPFN)模型,以高程、坡度、坡向、地形湿度指数、河流强度指数、曲率、岩性、归一化植被指数(NDVI)、道路距离、库水距离、断层、地表形变速率、土壤类型及土地利用类型这14个因子为依据,对长江三峡库区巴东... 依托表格先验数据拟合网络(TabPFN)模型,以高程、坡度、坡向、地形湿度指数、河流强度指数、曲率、岩性、归一化植被指数(NDVI)、道路距离、库水距离、断层、地表形变速率、土壤类型及土地利用类型这14个因子为依据,对长江三峡库区巴东至秭归段的滑坡易发性开展评价。结果显示,TabPFN模型在测试集上的受试者工作特征(ROC)曲线下的面积(AUC)值达0.889,且准确率、精确率、召回率与F1分数均突破0.80,展现出优异的预测性能。沙普利值可加解释(SHAP)分析进一步揭示,岩性与高程是滑坡发生的关键影响因子,地形湿度指数、植被指数及土壤类型等因子也对滑坡易发性有显著贡献。从空间分布维度来看,滑坡高风险区主要集聚于库区主航道及次级河道周边,且与断层发育区、地表形变异常区呈现高度重合态势。 展开更多
关键词 滑坡易发性 表格先验数据拟合网络模型 合成孔径雷达干涉测量 SHAP分析
在线阅读 下载PDF
A comprehensive review of tools for exploratory analysis of tabular industrial datasets
17
作者 Aindrila Ghosh Mona Nashaat +2 位作者 James Miller Shaikh Quader Chad Marston 《Visual Informatics》 EI 2018年第4期235-253,共19页
Exploratory data analysis plays a major role in obtaining insights from data.Over the last two decades,researchers have proposed several visual data exploration tools that can assist with each step of the analysis pro... Exploratory data analysis plays a major role in obtaining insights from data.Over the last two decades,researchers have proposed several visual data exploration tools that can assist with each step of the analysis process.Nevertheless,in recent years,data analysis requirements have changed significantly.With constantly increasing size and types of data to be analyzed,scalability and analysis duration are now among the primary concerns of researchers.Moreover,in order to minimize the analysis cost,businesses are in need of data analysis tools that can be used with limited analytical knowledge.To address these challenges,traditional data exploration tools have evolved within the last few years.In this paper,with an in-depth analysis of an industrial tabular dataset,we identify a set of additional exploratory requirements for large datasets.Later,we present a comprehensive survey of the recent advancements in the emerging field of exploratory data analysis.We investigate 50 academic and non-academic visual data exploration tools with respect to their utility in the six fundamental steps of the exploratory data analysis process.We also examine the extent to which these modern data exploration tools fulfill the additional requirements for analyzing large datasets.Finally,we identify and present a set of research opportunities in the field of visual exploratory data analysis. 展开更多
关键词 Exploratory data analysis Industrial tabular data Interactive visualization Systematic literature review Research opportunities
原文传递
ShinglingPFN:基于局部上下文学习的网络货运价格预测模型
18
作者 鲁鹏飞 章平 +2 位作者 吴军 吴夏 刘涛 《湖北民族大学学报(自然科学版)》 2026年第1期41-48,共8页
为解决网络货运平台价格预测不准确导致的成交率下降问题,提出基于Shingling检索的表格先验数据拟合网络(tabular prior-data fitted network,TabPFN)的局部上下文学习(local context learning with TabPFN based on shingling retrieva... 为解决网络货运平台价格预测不准确导致的成交率下降问题,提出基于Shingling检索的表格先验数据拟合网络(tabular prior-data fitted network,TabPFN)的局部上下文学习(local context learning with TabPFN based on shingling retrieval,ShinglingPFN)模型。首先,该模型运用w-Shingling检索算法,从历史订单数据中匹配出与预测订单最相似的订单,构建局部关联的上下文数据。然后,加载并初始化预训练的TabPFN模型实例,将筛选出的订单数据输入模型,让TabPFN基于这些上下文信息学习货运特征与运费的关联模式。最后,输出该货运样本的运费预测结果。结果表明,ShinglingPFN模型相比随机森林(random forest,RF)模型减少了30.98%的平均绝对误差(mean absolute error,MAE)。通过全局敏感性分析,进一步增强了模型的可解释性。ShinglingPFN模型可为平台优化定价策略提供决策支撑。 展开更多
关键词 表格数据 深度学习 TabPFN w-Shingling 信息检索 网络货运 价格预测
在线阅读 下载PDF
矿物岩石地球化学表格数据的存储和分析:从本地到云端
19
作者 吕洋 何灿 +1 位作者 赵健铭 张舟 《矿物岩石地球化学通报》 北大核心 2025年第3期542-556,I0002,共16页
随着分析测试仪器的迅速发展,地球化学数据的规模急剧增大。大型数据集的应用成为推动地球化学研究进步的新动力。目前,有机地球化学、矿床地球化学、水文地球化学、大气地球化学、矿物岩石地球化学等细分方向均涌现出一批数据驱动型研... 随着分析测试仪器的迅速发展,地球化学数据的规模急剧增大。大型数据集的应用成为推动地球化学研究进步的新动力。目前,有机地球化学、矿床地球化学、水文地球化学、大气地球化学、矿物岩石地球化学等细分方向均涌现出一批数据驱动型研究新成果。矿物岩石地球化学作为地球化学的一个重要分支,其表格数据集的存储和分析,对地球化学数据驱动型研究具有重要意义。现阶段,矿物岩石地球化学领域的数据存储正向着共享、规范、高效、可再利用的方向发展,其存储架构正在从传统的本地文件系统迁移至云端的分布式数据库存储。目前,需要构建一个具备严格数据治理和数据安全协议的数据共享平台,促进领域数据的标准化管理。数据分析沿着从本地到云端的路径,正向着智能化的方向发展。 展开更多
关键词 矿物岩石地球化学 表格数据 数据存储 数据分析 云计算
原文传递
基于CTGAN的自动驾驶车辆交通事故关键诱因识别
20
作者 张志清 于晓正 +2 位作者 朱雷鹏 孙玉凤 李祎昕 《华南理工大学学报(自然科学版)》 北大核心 2025年第10期14-28,共15页
明晰自动驾驶车辆交通事故机理是有效防控安全风险的重要前提。自动驾驶车辆交通事故诱因分析通常基于小样本和不平衡数据进行建模,但这类模型对于少数类预测精度低。基于数据增强的分析框架可以提高模型对于少数类的预测精度。通过条... 明晰自动驾驶车辆交通事故机理是有效防控安全风险的重要前提。自动驾驶车辆交通事故诱因分析通常基于小样本和不平衡数据进行建模,但这类模型对于少数类预测精度低。基于数据增强的分析框架可以提高模型对于少数类的预测精度。通过条件表格生成对抗网络(CTGAN)、联合生成对抗网络(CopulaGAN)以及合成少数过采样(SMOTE)、自适应过采样(ADASYN)技术增加样本量,平衡数据集,对比不同方法的合成数据质量;基于合成数据,对逻辑回归(LR)、决策树(DT)、随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)5种分类算法进行评估,采用召回率、特异性、加权F_1分数及曲线下面积(AUC)等指标确定最优组合;最后结合沙普利可加解释(SHAP)框架量化事故关键诱因重要度。结果表明:CTGAN生成数据的边际分布得分(0.96)和相关性得分(0.92)最高,合成数据的平均质量为0.94,显著优于其他方法;CTGAN与随机森林算法结合时,模型在召回率(0.82)、特异性(0.84)、AUC(0.86)等指标上均表现优异,在包含10%标签噪声的测试集中仍保持鲁棒性(召回率提升至0.88),进一步验证了其在复杂场景中的适用性。关键诱因分析表明,路面状况(潮湿状态显著增加受伤风险)、夜间行车(低光照导致传感器性能下降)、交叉口及街道化程度(复杂场景增加检测延迟)是导致事故的核心因素。该研究为自动驾驶测试场景搭建及道路基础设施改造提供了关键依据。 展开更多
关键词 自动驾驶车辆 小样本量 数据不平衡 条件表格生成对抗网络 事故预测
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部