多模态大语言模型(MLLMs)的出现给医疗领域带来了新机遇,但其所依赖的大量敏感数据也带来了严峻的数据治理与患者伦理问题。本研究系统梳理了2020年1月1日至2025年8月31日中国知网、PubMed和Web of Science等中英文数据库的相关文献,围...多模态大语言模型(MLLMs)的出现给医疗领域带来了新机遇,但其所依赖的大量敏感数据也带来了严峻的数据治理与患者伦理问题。本研究系统梳理了2020年1月1日至2025年8月31日中国知网、PubMed和Web of Science等中英文数据库的相关文献,围绕医疗MLLMs数据治理在融合、质量控制、透明度与幻觉等方面的技术难题,患者知情同意、隐私保护、算法偏见等伦理困境,以及现有应对策略进行了综合性分析。研究表明,多源异构医疗数据标准化与质控难度较大,数据孤岛现象普遍存在;多模态融合训练易放大算法偏见,模型的“黑箱”决策和“幻觉”问题均降低了其可信度;患者参与治理不足与责任界定不清也是关键问题。同时,跨模态关联加大了隐私泄露的风险。为应对上述挑战,需要构建可信数据基础设施、多方协同治理及问责机制、推广可解释AI,同时使用隐私增强技术、动态知情同意机制保障患者权益,构建以患者为中心、技术为依托、伦理为准绳的MLLMs健康生态。展开更多
文摘多模态大语言模型(MLLMs)的出现给医疗领域带来了新机遇,但其所依赖的大量敏感数据也带来了严峻的数据治理与患者伦理问题。本研究系统梳理了2020年1月1日至2025年8月31日中国知网、PubMed和Web of Science等中英文数据库的相关文献,围绕医疗MLLMs数据治理在融合、质量控制、透明度与幻觉等方面的技术难题,患者知情同意、隐私保护、算法偏见等伦理困境,以及现有应对策略进行了综合性分析。研究表明,多源异构医疗数据标准化与质控难度较大,数据孤岛现象普遍存在;多模态融合训练易放大算法偏见,模型的“黑箱”决策和“幻觉”问题均降低了其可信度;患者参与治理不足与责任界定不清也是关键问题。同时,跨模态关联加大了隐私泄露的风险。为应对上述挑战,需要构建可信数据基础设施、多方协同治理及问责机制、推广可解释AI,同时使用隐私增强技术、动态知情同意机制保障患者权益,构建以患者为中心、技术为依托、伦理为准绳的MLLMs健康生态。