期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
矿物岩石地球化学表格数据的存储和分析:从本地到云端
1
作者 吕洋 何灿 +1 位作者 赵健铭 张舟 《矿物岩石地球化学通报》 北大核心 2025年第3期542-556,I0002,共16页
随着分析测试仪器的迅速发展,地球化学数据的规模急剧增大。大型数据集的应用成为推动地球化学研究进步的新动力。目前,有机地球化学、矿床地球化学、水文地球化学、大气地球化学、矿物岩石地球化学等细分方向均涌现出一批数据驱动型研... 随着分析测试仪器的迅速发展,地球化学数据的规模急剧增大。大型数据集的应用成为推动地球化学研究进步的新动力。目前,有机地球化学、矿床地球化学、水文地球化学、大气地球化学、矿物岩石地球化学等细分方向均涌现出一批数据驱动型研究新成果。矿物岩石地球化学作为地球化学的一个重要分支,其表格数据集的存储和分析,对地球化学数据驱动型研究具有重要意义。现阶段,矿物岩石地球化学领域的数据存储正向着共享、规范、高效、可再利用的方向发展,其存储架构正在从传统的本地文件系统迁移至云端的分布式数据库存储。目前,需要构建一个具备严格数据治理和数据安全协议的数据共享平台,促进领域数据的标准化管理。数据分析沿着从本地到云端的路径,正向着智能化的方向发展。 展开更多
关键词 矿物岩石地球化学 表格数据 数据存储 数据分析 云计算
原文传递
Visual Basic中Data Report的报表设计 被引量:4
2
作者 耿玉水 鲁芹 +2 位作者 董云峰 潘岩 王新刚 《计算机应用与软件》 CSCD 北大核心 2005年第2期139-141,共3页
文章专门讨论关于MIS系统中对报表的静态和动态打印 ,主要使用当今较为广泛应用的VB开发工具 ,为MIS的开发和应用提供了有效的应用工具。该文详细介绍了基于VB中的DataReport的报表打印的设计方法和编程要点等。
关键词 VISUAL Basic 程序设计 报表设计 dataReport 管理信息系统
在线阅读 下载PDF
融合nmODE的术后肺部并发症预测模型
3
作者 熊立鹏 徐修远 +2 位作者 牛颢 陈楠 章毅 《智能系统学报》 北大核心 2025年第1期198-205,共8页
为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码... 为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation,nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting,XGBoost)树结构对数据进行编码,并提取其特征重要性。然后,使用长短时记忆神经网络对数据的相关特征依赖性进行分析,并提取处理后的特征。最后,利用nmODE的记忆和学习能力,对提取的特征进行深入分析,并得出最终的预测结果。通过实验评估,在肺部术后并发症数据集中,证明了提出模型的效果优于现有模型,同时可以为预测肺部手术后并发症的发生提供更准确的结果。 展开更多
关键词 疾病预测 异构表格数据 神经记忆常微分方程 极限梯度提升 长短时记忆神经网络 合成少数过采样技术 类别不平衡 病人预后
在线阅读 下载PDF
基于合成数据预训练基础模型的表格数据聚类方法
4
作者 李培文 李飞江 +1 位作者 王婕婷 钱宇华 《计算机研究与发展》 北大核心 2025年第9期2139-2151,共13页
随着数据采集与数据存储技术的飞速发展,各行业收集并存储了大量无标记的表格数据.聚类分析是挖掘这类数据潜在分组结构的重要方法.目前,处理表格数据的聚类方法多数仍然是传统聚类算法.深度学习技术和大模型技术主要用于处理非结构化... 随着数据采集与数据存储技术的飞速发展,各行业收集并存储了大量无标记的表格数据.聚类分析是挖掘这类数据潜在分组结构的重要方法.目前,处理表格数据的聚类方法多数仍然是传统聚类算法.深度学习技术和大模型技术主要用于处理非结构化的图像、文本、语音等数据类型,其强大的表示能力和推理能力在结构化的表格数据处理中仍难以发挥优势. 2025年,《Nature》刊发的TabPFN是一种可用于高效处理分类和回归任务的表格数据基础模型,为表格数据学习提供了新的基础.受此启发,提出了一种基于合成数据预训练基础模型的表格数据聚类方法,主要包括预训练阶段和迭代推理阶段.其中,预训练阶段基于传统数据聚类算法和TabPFN模型获得无标记表格数据的初始伪标签,迭代推理阶段基于微调后的TabPFN模型循环更新伪标签以得到聚类结果.在基准数据集上的大量实验分析表明,改进方法显著提高了7种代表性聚类算法的性能. 展开更多
关键词 聚类分析 表格数据学习 基础模型 迭代推理 无监督学习
在线阅读 下载PDF
基于加速扩散模型的缺失值插补算法
5
作者 王圣举 张赞 《浙江大学学报(工学版)》 北大核心 2025年第7期1471-1480,1503,共11页
为了解决表格数据中数据缺失对后续任务产生的不利影响,提出使用扩散模型进行缺失值插补的方法.针对原始扩散模型在生成过程中耗时过长的问题,设计基于加速扩散模型的数据插补方法(PNDM_Tab).扩散模型的前向过程通过高斯加噪方法实现,... 为了解决表格数据中数据缺失对后续任务产生的不利影响,提出使用扩散模型进行缺失值插补的方法.针对原始扩散模型在生成过程中耗时过长的问题,设计基于加速扩散模型的数据插补方法(PNDM_Tab).扩散模型的前向过程通过高斯加噪方法实现,采用基于扩散模型的伪数值方法进行反向过程加速.使用U-Net与注意力机制相结合的网络结构从数据中高效提取显著特征,实现噪声的准确预测.为了使模型在训练阶段有监督目标,使用随机掩码处理训练数据以生成新的缺失数据.在9个数据集中的插补方法对比实验结果表明:相较其他插补方法,PNDM_Tab在6个数据集中的均方根误差最低.实验结果证明,相较于原始的扩散模型,反向过程使用扩散模型的伪数值方法能够在减少采样步数的同时保持生成性能不变. 展开更多
关键词 表格数据 扩散模型 数据插补 注意力机制 深度学习
在线阅读 下载PDF
基于多模态数据对比学习的重度抑郁症表征学习方法
6
作者 顾恒 马迪 +2 位作者 马越 邵伟 张礼 《陕西师范大学学报(自然科学版)》 北大核心 2025年第1期12-21,共10页
影像基因组学认为神经影像与基因之间存在着一定程度的相关性,利用遗传变异与影像数据进行疾病分析愈发受研究人员重视。在实践中,临床医生拥有的数据规模往往较小,但仍然希望使用深度学习来解决现实问题。考虑到不断扩大的数据规模与... 影像基因组学认为神经影像与基因之间存在着一定程度的相关性,利用遗传变异与影像数据进行疾病分析愈发受研究人员重视。在实践中,临床医生拥有的数据规模往往较小,但仍然希望使用深度学习来解决现实问题。考虑到不断扩大的数据规模与昂贵的标注成本,构建能够利用多模态数据的无监督学习方法十分必要。为了满足上述需求,提出了一种基于影像与基因多模态表格数据对比学习的表征学习方法(multimodal tabular data with contrastive learning,MTCL),该模型利用了静息态功能磁共振成像(rs-fMRI)和单核苷酸多态性(single nucleotide polymorphisms,SNP)数据,无需数据的任何标签信息。为了增强可解释性,模型先通过特征提取模块将rs-fMRI和SNP数据转换为表格类型结构,再通过多模态表格数据对比学习模块对多模态数据进行融合,并获得融合后的数据表征。在重度抑郁症(major depression disorder,MDD)数据上,文中提出的方法能够有效提升MDD诊断性能。此外,MTCL方法结合了模型归因方法挖掘与MDD相关的影像和遗传生物标记物,提高了模型的可解释性,有助于研究人员对疾病发病机制的理解。 展开更多
关键词 对比学习 多模态数据 模型归因 重度抑郁症 诊断模型
在线阅读 下载PDF
面向Tabular库的数据模型及其查询问题 被引量:1
7
作者 黄冬梅 孙乐 +2 位作者 石少华 苏诚 赵丹枫 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第1期56-65,共10页
信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据... 信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据特点.然而使用无结构和半结构化文档组织和管理Excel等表单数据,存在着数据弱可控、弱可用、及访问效率差的问题.针对该类问题,本文以Excel文本为数据源,提出了一种新的面向Tabular库的关系数据模型并讨论了其上的查询及优化问题.首先,给出了Tabular表单数据的形式化定义,其次,设计PartiPath划分树实现表格的关系划分及结构转换,在关系模型的基础上,给出其数据模型及数据模式,再者,定义了表单数据上的基本查询问题及融合用户兴趣指数改进查询相似度指标,最后给出实验分析并作出总结. 展开更多
关键词 tabular 查询 数据模型 PartiPath划分树 关系模型
在线阅读 下载PDF
基于权力信号的跨表格迁移学习方法研究
8
作者 张广发 陈加乐 方金云 《高技术通讯》 北大核心 2025年第5期451-460,共10页
为了有效监督和审计政府行使公权力,本文提出了一种基于权力信号的跨表格迁移学习方法,目的是从政务信息系统的表格数据(简称政务表格数据)中自动检测出权力滥用问题。权力信号是公权力行使过程中的关键特征,由关键人、决策、资金、项... 为了有效监督和审计政府行使公权力,本文提出了一种基于权力信号的跨表格迁移学习方法,目的是从政务信息系统的表格数据(简称政务表格数据)中自动检测出权力滥用问题。权力信号是公权力行使过程中的关键特征,由关键人、决策、资金、项目和物资5个要素构成。这些权力信号分布在不同的政务表格数据中,政务表格数据结构多样,对权力信号跨表格学习带来挑战。本文设计了一种基于权力信号的跨表格迁移学习框架PowerTab(power tabular transformer),旨在引导模型在政务表格数据上学习通用的权力信号表征,并使用迁移学习将其应用到目标任务的检测模型中。该框架实现了一种在政务表格数据中提取词元级权力特征的方法,使得检测模型具有零样本学习能力。在5个数据集上的实验结果表明本文方法优于基线方法,为政务表格数据的大数据监督提供了一种有效的手段。 展开更多
关键词 大数据监督 政务数据 权力信号 表格学习 迁移学习
在线阅读 下载PDF
表格数据生成技术综述
9
作者 王永鑫 徐鑫 朱鸿斌 《计算机科学》 北大核心 2025年第10期3-12,共10页
表格数据因在金融、医疗等关键领域广泛应用而具有重要价值。然而,对于表格数据的有效利用,常受到数据稀缺、类别不平衡及隐私法规的严格制约。为应对这些挑战,通过生成模型合成在统计特性上与真实数据高度相似的样本,已成为一种新兴的... 表格数据因在金融、医疗等关键领域广泛应用而具有重要价值。然而,对于表格数据的有效利用,常受到数据稀缺、类别不平衡及隐私法规的严格制约。为应对这些挑战,通过生成模型合成在统计特性上与真实数据高度相似的样本,已成为一种新兴的解决方案,旨在增强数据可用性并保护用户隐私。该领域的技术发展路径从传统的深度学习模型逐步演进至前沿范式。早期的探索以变分自编码器和生成对抗网络为代表,但这些方法常面临训练不稳定和模式坍塌等瓶颈,影响了生成数据的质量。为克服这些难题,扩散模型应运而生,其通过渐进式的去噪过程,在生成高保真度和多样性的样本方面展现出显著优势。尽管如此,这些模型的核心仍是模仿统计分布,缺乏对现实世界常识的理解。为此,最新的研究转向基于大型语言模型的方法,利用其丰富的世界知识,旨在生成不仅统计真实,而且在逻辑与语义上也更合理的合成表格数据。对该领域的系统性回顾,旨在为研究者和从业者提供全面的技术认知,并为不同应用场景下选择最合适的技术路径提供决策参考。 展开更多
关键词 表格数据生成 大语言模型 生成方法
在线阅读 下载PDF
Geology and Mineral Deposits of Saraikistan (South Punjab, Koh Sulaiman Range) of Pakistan: A Tabular Review of Recently Discovered Biotas from Pakistan and Paleobiogeographic Link: Phylogeny and Hypodigm of Poripuchian Titanosaurs from Indo-Pakistan
10
作者 Muhammad Sadiq Malkani 《Open Journal of Geology》 2023年第8期900-958,共59页
Saraikistan (South Punjab and surrounding) area of Pakistan is located in the central Pakistan. This area represents Triassic-Jurassic to Recent sedimentary marine and terrestrial strata. Most of the Mesozoic and Earl... Saraikistan (South Punjab and surrounding) area of Pakistan is located in the central Pakistan. This area represents Triassic-Jurassic to Recent sedimentary marine and terrestrial strata. Most of the Mesozoic and Early Cenozoic are represented by marine strata with rare terrestrial deposits, while the Late Cenozoic is represented by continental fluvial deposits. This area hosts significant mineral deposits and their development can play a significant role in the development of Saraikistan region and ultimately for Pakistan. The data of recently discovered biotas from Cambrian to Miocene age are tabulated for quick view. Mesozoic biotas show a prominent paleobiogeographic link with Gondwana and Cenozoic show Eurasian. Phylogeny and hypodigm of Poripuchian titanosaurs from India and Pakistan are hinted at here. 展开更多
关键词 GEOLOGY Minerals Cement Dams Biota tabular data Paleobiogeography Saraikistan South Punjab Sulaiman Range Pakistan Titanosaurs Indo-Pakistan
在线阅读 下载PDF
基于邻域分布的去噪扩散概率模型 被引量:1
11
作者 石洪波 万博闻 张赢 《模式识别与人工智能》 EI CSCD 北大核心 2024年第4期352-367,共16页
样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vici... 样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vicinal Distribution Based Denoising Diffusion Probabilistic Model,VD-DDPM)及相应算法.首先,分析样本有限表格型数据的特征,通过先验知识选择弱相关特征,并构建样本的邻域分布.然后,利用邻域分布采样数据构建VD-DDPM模型,并使用VD-DDPM数据生成算法生成符合原始数据分布且具有多样性的数据集.在多个数据集上针对数据生成质量、下游模型性能等进行实验,验证VD-DDPM的有效性. 展开更多
关键词 数据增强 邻域风险最小化 邻域分布 扩散模型 表格型数据
在线阅读 下载PDF
基于时频融合特征的肺动脉高压心音分类模型 被引量:3
12
作者 王彦麟 孙静 +3 位作者 杨宏波 郭涛 潘家华 王威廉 《计算机科学》 CSCD 北大核心 2024年第S01期375-381,共7页
先心病相关肺动脉高压是一种严重的心血管疾病,致死率高,对其进行早期筛查与识别对于治愈尤为重要。目前临床是通过右心导管术确诊,此为有创检查,不便于在大规模筛查中采用,研究一种无创便捷的识别方法迫在眉睫。文中建立了一种时频融... 先心病相关肺动脉高压是一种严重的心血管疾病,致死率高,对其进行早期筛查与识别对于治愈尤为重要。目前临床是通过右心导管术确诊,此为有创检查,不便于在大规模筛查中采用,研究一种无创便捷的识别方法迫在眉睫。文中建立了一种时频融合的心音分类模型。首先对心音信号进行预处理,然后使用融合滤波器组对信号进行转换并求取动态时频特征,最后将得到的融合特征参数输入表格式先验数据拟合网络(TabPFN)中进行分类识别。实验结果表明,该算法在正常、CHD-PAH和CHD中的平均准确率、精确率、灵敏度、特异度和F1分别为92.21%,92.15%,92.15%,96.11%,92.14%。对于先心病相关肺动脉高压的早期筛查与识别具有重要意义。 展开更多
关键词 心音 先心病相关肺动脉高压 动态特征提取 时频特征融合 表格式先验数据拟合网络
在线阅读 下载PDF
数据整理脚本语义的可视化
13
作者 罗中粟 熊凯 +3 位作者 傅四维 王永恒 鲍虎军 巫英才 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第7期1096-1105,共10页
理解数据整理脚本的语义是数据工作者的常见需求.然而,数据整理操作的类型及其代码的实现方式复杂多样,使得数据工作者在理解脚本语义时费时费力.通过收集数据工作者在理解数据整理脚本语义上的具体需求,设计并实现了一个基于概览和细... 理解数据整理脚本的语义是数据工作者的常见需求.然而,数据整理操作的类型及其代码的实现方式复杂多样,使得数据工作者在理解脚本语义时费时费力.通过收集数据工作者在理解数据整理脚本语义上的具体需求,设计并实现了一个基于概览和细节模式的交互式可视分析系统ChangeVis,帮助数据工作者理解表格在数据整理过程中的变化.ChangeVis包含概览视图,语义视图,统计视图和数据视图4个视图,分别可视化代码块中的表结构变化、行列信息变化、单元格数据变化以及执行的数据转换操作的语义.通过案例分析和用户实验,验证了ChangeVis系统在帮助数据工作者理解数据整理脚本语义的可用性和有效性. 展开更多
关键词 数据整理 程序可视化 可视化设计 表格数据可视化
在线阅读 下载PDF
基于半监督学习的未知异常检测方法 被引量:2
14
作者 程渝栋 周昉 《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1670-1680,共11页
异常检测旨在识别偏离预期行为模式的数据.虽然半监督异常检测方法可以充分利用有限的标签数据作为先验知识来提高检测准确性,但是收集到的标记异常(即已知异常)很难覆盖所有类型的异常并且在现实场景中往往存在着一些新型的异常(即未... 异常检测旨在识别偏离预期行为模式的数据.虽然半监督异常检测方法可以充分利用有限的标签数据作为先验知识来提高检测准确性,但是收集到的标记异常(即已知异常)很难覆盖所有类型的异常并且在现实场景中往往存在着一些新型的异常(即未知异常),这些异常可能与已知异常表现出不同的特性,因此难以被现有的半监督异常检测方法识别.针对该问题,提出了一种基于半监督学习的未知异常检测(semi-supervised unknown anomaly detection,SSUAD)方法,旨在同时识别已知异常和未知异常.该方法利用闭集分类器对已知异常和正常分类,利用未知异常检测器检测未知异常.此外,还考虑了异常场景中异常和正常极端不平衡的情况,设计了有效的数据增强方法来扩充异常样本的数量.在UNSW-NB15和KDDCUP99数据集以及一个真实数据集SQB上进行了实验,实验结果表明,相较于现有的异常检测方法,SSUAD在异常检测性能指标AUC-ROC(area under receiver operating characteristic curve)和AUC-PR(area under precision-recall curve)上都有明显的提升.证明了SSUAD的有效性和合理性. 展开更多
关键词 异常检测 分布外检测 半监督学习 未知异常 表格数据
在线阅读 下载PDF
术后风险预测任务的结构化数据生成方法
15
作者 罗晓辉 周瑞豪 +3 位作者 张伟义 舒红平 王亚强 郝学超 《计算机与数字工程》 2024年第1期51-59,共9页
近年来,医学领域越来越重视使用多中心数据共享的方式来提高模型的泛化能力。然而,共享医疗数据有隐私暴露的风险。类别不平衡也是使用术前结构化数据预测术后风险的一个挑战,它严重影响了模型的预测性能。这两个问题限制了术前数据的... 近年来,医学领域越来越重视使用多中心数据共享的方式来提高模型的泛化能力。然而,共享医疗数据有隐私暴露的风险。类别不平衡也是使用术前结构化数据预测术后风险的一个挑战,它严重影响了模型的预测性能。这两个问题限制了术前数据的共享以及分类器在术后风险预测的效果。为了解决这些问题,论文提出了一种新的方法,使用生成对抗网络生成与真实数据相似的数据,用于训练分类模型和数据共享。实验证明生成对抗网络能生成高质量的数据。生成数据在特征分布上与真实数据高度相似,且用于术后风险预测后能有效提升术后风险预测的效果。此外,实验还验证了生成数据的隐私性,这为学术研究中的数据共享提供了新的可能性。 展开更多
关键词 数据不平衡 生成对抗网络 术后并发症预测 表格数据 数据共享
在线阅读 下载PDF
基于改进TabNet的糖尿病预测模型
16
作者 徐绍钦 彭博 +1 位作者 龙伍丹 丁丹妮 《计算机应用》 CSCD 北大核心 2024年第S2期364-369,共6页
针对糖尿病数据特征冗余、类别数不平衡导致的预测困难问题,提出一种基于改进TabNet的糖尿病预测模型dTabNet(dual TabNet)。首先,通过dTabNet得到量化的特征全局贡献指标,同时构造3层全连接层替代特征转换器和注意力转换器中的单层全... 针对糖尿病数据特征冗余、类别数不平衡导致的预测困难问题,提出一种基于改进TabNet的糖尿病预测模型dTabNet(dual TabNet)。首先,通过dTabNet得到量化的特征全局贡献指标,同时构造3层全连接层替代特征转换器和注意力转换器中的单层全连接层,以增强对数据的表示能力;其次,设计特征选择模块,以去除糖尿病数据集中的冗余和无关特征,从而提高学习的效率;最后,根据特征选择模块输出的特征子集预测糖尿病。此外,引入Focal loss函数优化损失函数,以解决糖尿病数据类别数不平衡的问题;之后,利用贝叶斯优化算法对dTabNet进行超参数优化。在预处理后的真实糖尿病检测数据集上评估所提模型。实验结果表明,dTabNet针对糖尿病预测的准确率达到了90.9%,曲线下面积(AUC)值达到了94.7%,相较于TabNet的准确率和AUC值分别提高了4.0和2.2个百分点。这表明所提模型在数据冗余、类别数量不平衡的糖尿病数据上能有效地完成糖尿病预测。 展开更多
关键词 糖尿病预测 TabNet 特征选择 类别数量不平衡 表格数据 贝叶斯优化
在线阅读 下载PDF
基于掩码建模和对比学习的故障诊断方法 被引量:1
17
作者 程祺珺 杨瑞峰 郭晨霞 《电子测量技术》 北大核心 2024年第22期129-135,共7页
尽管大多数故障诊断研究以图像、音频等作为研究的数据类型,但表格型数据的故障诊断研究仍然具有重要意义。在表格型故障诊断领域,以前的相关工作大多集中在传统的监督学习方法并且对跨工况故障诊断任务的基准评估有所不足。本文介绍一... 尽管大多数故障诊断研究以图像、音频等作为研究的数据类型,但表格型数据的故障诊断研究仍然具有重要意义。在表格型故障诊断领域,以前的相关工作大多集中在传统的监督学习方法并且对跨工况故障诊断任务的基准评估有所不足。本文介绍一种用于表格型数据跨工况故障诊断任务的自监督学习方法,该方法将对比学习思想和表格掩码建模策略应用于以Transformer为骨干的自编码器架构。在凯斯西储大学轴承数据集的诊断实例上的结果显示,本文的方法经过适当微调后可以在目标任务中普遍优于监督学习基线方法的诊断精度。与自监督学习基线方法相比,对比学习策略和表格掩码建模策略的引入分别使得自编码器在3个目标任务中的平均诊断精度提高了0.74%和3.35%。此外,为了验证所提出的方法的合理性,本文进一步分析和讨论了该方法的保真度和效用。 展开更多
关键词 自编码器 故障诊断 表格数据 对比学习 表格掩码建模
原文传递
逐层Transformer在类别不均衡数据的应用 被引量:2
18
作者 杨晶东 李熠伟 +3 位作者 江彪 姜泉 韩曼 宋梦歌 《计算机应用研究》 CSCD 北大核心 2023年第10期3047-3052,共6页
为解决临床医学量表数据类别不均衡容易对模型产生影响,以及在处理量表数据任务时深度学习框架性能难以媲美传统机器学习方法问题,提出了一种基于级联欠采样的Transformer网络模型(layer by layer Transformer,LLT)。LLT通过级联欠采样... 为解决临床医学量表数据类别不均衡容易对模型产生影响,以及在处理量表数据任务时深度学习框架性能难以媲美传统机器学习方法问题,提出了一种基于级联欠采样的Transformer网络模型(layer by layer Transformer,LLT)。LLT通过级联欠采样方法对多数类数据逐层删减,实现数据类别平衡,降低数据类别不均衡对分类器的影响,并利用注意力机制对输入数据的特征进行相关性评估实现特征选择,细化特征提取能力,改善模型性能。采用类风湿关节炎(RA)数据作为测试样本,实验证明,在不改变样本分布的情况下,提出的级联欠采样方法对少数类别的识别率增加了6.1%,与常用的NEARMISS和ADASYN相比,分别高出1.4%和10.4%;LLT在RA量表数据的准确率和F 1-score指标上达到了72.6%和71.5%,AUC值为0.89,mAP值为0.79,性能超过目前RF、XGBoost和GBDT等主流量表数据分类模型。最后对模型过程进行可视化,分析了影响RA的特征,对RA临床诊断具有较好的指导意义。 展开更多
关键词 量表数据分类 类别不均衡 级联欠采样 TRANSFORMER
在线阅读 下载PDF
TDS协议分析与漏洞检测 被引量:3
19
作者 郭丽红 吴海涛 《计算机工程》 CAS CSCD 北大核心 2009年第18期127-129,共3页
对应用于Microsoft SQL Server2000的未公开协议TDS8.0进行研究分析,通过批量发送和接收TDS数据包,分析TDS协议的通信规则和各种类型的TDS包结构,总结整个TDS协议的报文结构。在协议分析的基础上,研究Microsoft SQL Server 2000体系结... 对应用于Microsoft SQL Server2000的未公开协议TDS8.0进行研究分析,通过批量发送和接收TDS数据包,分析TDS协议的通信规则和各种类型的TDS包结构,总结整个TDS协议的报文结构。在协议分析的基础上,研究Microsoft SQL Server 2000体系结构和存在的安全漏洞,编写漏洞测试程序,验证TDS8.0协议并找出其中存在的安全问题。 展开更多
关键词 表格数据流协议 协议分析 漏洞检测
在线阅读 下载PDF
基于PowerBuilder的动态报表设计 被引量:4
20
作者 许芸 《计算机工程与应用》 CSCD 北大核心 2002年第12期135-137,共3页
在开发MIS系统时需要创建大量报表,这些报表具有不确定性,其格式、内容和数量经常根据需求发生变化。文章提出了一种新的动态报表生成技术,即采用空模版与报表描述文件组合和动态合成方法,根据用户的需求,快速方便地增加、修改报表。该... 在开发MIS系统时需要创建大量报表,这些报表具有不确定性,其格式、内容和数量经常根据需求发生变化。文章提出了一种新的动态报表生成技术,即采用空模版与报表描述文件组合和动态合成方法,根据用户的需求,快速方便地增加、修改报表。该技术为MIS的开发和应用提供了有效的解决工具。该文详细介绍了基于PowerBuilder动态报表设计的方法和编程要点等。 展开更多
关键词 POWERBUILDER 动态报表设计 数据窗口 窗口控件 管理信息系统
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部