关于数据生成技术在医疗大模型中的应用分析

导出

摘要近年来,医疗大模型一直是学术界广泛研究的领域,该领域涵盖了多种技术,其中机器学习是实现医疗大模型的关键技术之一,机器学习的目的是让计算机从数据中学习规律和模式,通过对数据的学习为人工智能赋予准确有效的预测能力.机器学习在训练模型时,会假定训练数据集内的不同类别数量近似相等且分布均匀,但在医疗临床工作中,收集到的医疗数据集中经常出现某些类别的样本数量远少于其他类别的情况,经过这类数据集训练得到的模型在预测时会偏向数量较多的类别,对数量较少的类别预测不够准确,学者将这种现象称为数据不平衡.目前,数据生成技术在故障检测、信用评估等领域的不平衡数据集中都有着广泛应用,但随着信息技术的飞速发展,数据量和维度不断增加,现有的数据生成方法需要耗费大量的计算资源和时间,对高维数据集的适应性也较差.通过从特征选择和数据填补的角度对数据不平衡处理方法进行研究,以达到提高分类模型性能的目的.

作者王毅峰

机构地区重庆医科大学附属儿童医院

出处《IT经理世界》 2025年第5期56-58,共3页

关键词数据生成数据不平衡医疗大模型数据填补

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1马傲,葛小玲.人工智能大模型在医疗健康领域应用的研究[J].中国现代医生,2024,62(33):89-95. 被引量：13

二级参考文献3

1Yujie You,Xin Lai,Yi Pan,Huiru Zheng,Julio Vera,Suran Liu,Senyi Deng,Le Zhang.Artificial intelligence in cancer target identification and drug discovery[J].Signal Transduction and Targeted Therapy,2022,7(6):1951-1974. 被引量：15
2朱荣生,冯紫雯,陈琪,陈劲.人工智能的国际安全挑战及其治理[J].中国科技论坛,2023(3):160-167. 被引量：11
3马武仁,弓孟春,戴辉,黄婧,王斌斌,史文钊.以ChatGPT为代表的大语言模型在临床医学中的应用综述[J].医学信息学杂志,2023,44(7):9-17. 被引量：54

共引文献12

1王力,谭浩,王军永,万兆伟,梅杰,余苏珍.ChatGPT在临床诊疗情境中的应用前景与潜在风险[J].卫生软科学,2025,39(1):17-23. 被引量：4
2田雪晴,李泉江,游茂,肖月,邱英鹏.我国医疗机构大语言模型建设现状调查与分析[J].中国卫生信息管理杂志,2025,22(1):38-44. 被引量：3
3陈昌茂,张瑶,谭韦池,曹晓均,丘岚.基于DeepSeek大语言模型的医院智能数据分类分级探索及应用[J].中国数字医学,2025,20(6):30-36. 被引量：6
4胡声丹,李萍,谈美乐,李莹.基于GenAI的医学人工智能基础课程教学改革探索[J].中国医学教育技术,2025,39(4):511-518. 被引量：2
5熊浩,邓维姝.基于DeepSeek的智能减重管理系统设计与应用[J].中国卫生质量管理,2025,32(8):77-82.
6孙柏林.DeepSeek引发AI+变革浪潮[J].计算机仿真,2025,42(7):1-5.
7赵文嘉,马会来,胡文上,高燕芳,李颉,李梓菡,刘欣雨,邴瑜,胡跃华,徐成东.人工智能在我国医疗卫生机构传染病防控中的应用现状、问题及展望[J].中华预防医学杂志,2025,59(8):1328-1339.
8张瑞.DeepSeek本地化部署情境下医疗机构应用人工智能技术的风险及规制研究[J].健康发展与政策研究,2025,28(5):493-500.
9步晓亮,贺雅琛,陈永波,张连杰.面向人工智能大模型安全的密码防护体系研究[J].软件,2025,46(10):178-180.
10薛晓明,沈瑾秋,陆丽娜.江苏加快发展生物大模型研究[J].江南论坛,2025(12):32-35.

1米伟娟,李娜,李微,曹智一.基于分布式数据库的船舶大数据平台动态页面数据生成技术[J].舰船科学技术,2020(6):157-159. 被引量：7
2吴泽宇,付艺伟,陈佳晓,马健文,吴文睿,邓明华.扩散模型及其在生物信息学中的应用[J].中国科学:数学,2025,55(7):1505-1526.
3杨芳,陈廉曹,郑孝杰,姜良巧,张衍,卢汪俊.基于波动互相关的配电网电压异常数据填补方法分析[J].集成电路应用,2025,42(2):430-432.
4李天虎,何志琴,何力,张蔚,黄忠锋.融合图像增强和自注意力机制的活动性肺结核CT影像数据生成[J].中国图象图形学报,2025,30(7):2558-2569.
5于艳朋,惠向晖.基于泛化中心聚类的时间序列缺失数据填补方法[J].吉林大学学报(理学版),2025,63(4):1137-1142.
6李艾雯,成金礼,陈丹,陈鑫怡,毛雅若,李启权.基于数据填补的四川盆地耕地表层土壤无机碳时空变化特征[J].中国农业科学,2025,58(14):2838-2853.
7布一帆,邹有云,杜文杰,邓杰,葛鑫磊,马剑强.基于哈特曼波前探测的显微物镜像差检测方法研究[J].光电工程,2025,52(7):123-132.
8赵琳,杨祎琪,刘利丹,应文,李云霞,申忠伟,饶志国.湖南地区表土孢粉组合特征及其在古植被重建中的应用[J].中国科学:地球科学,2025,55(7):2463-2479.

IT经理世界

2025年第5期

浏览历史

内容加载中请稍等...

关于数据生成技术在医疗大模型中的应用分析

参考文献1

二级参考文献3

共引文献12

相关作者

相关机构

相关主题

浏览历史