大数据技术在地球科学中的应用已成为国家战略重点,《“十四五”大数据产业发展规划》等政策为多源异构数据整合提供了支撑。大语言模型(LLM)是一种基于深度学习技术的人工智能模型。然而,通用大语言模型(如GPT-4、Deepseek-R1)在专业...大数据技术在地球科学中的应用已成为国家战略重点,《“十四五”大数据产业发展规划》等政策为多源异构数据整合提供了支撑。大语言模型(LLM)是一种基于深度学习技术的人工智能模型。然而,通用大语言模型(如GPT-4、Deepseek-R1)在专业领域存在局限性,因训练语料缺乏地球科学细分知识,导致回答笼统或错误(即“幻觉”)(Singhal et al.,2025),Zhou Zhi等(2024)在医疗领域通过Med-PaLM2构建垂直知识库,He Yong等(2024)法律领域基于LawGPT实现法规精准检索。在地球科学领域尚未形成系统的本地化知识问答方案。展开更多
文摘大数据技术在地球科学中的应用已成为国家战略重点,《“十四五”大数据产业发展规划》等政策为多源异构数据整合提供了支撑。大语言模型(LLM)是一种基于深度学习技术的人工智能模型。然而,通用大语言模型(如GPT-4、Deepseek-R1)在专业领域存在局限性,因训练语料缺乏地球科学细分知识,导致回答笼统或错误(即“幻觉”)(Singhal et al.,2025),Zhou Zhi等(2024)在医疗领域通过Med-PaLM2构建垂直知识库,He Yong等(2024)法律领域基于LawGPT实现法规精准检索。在地球科学领域尚未形成系统的本地化知识问答方案。