期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Geo-Text-700测试集的GIS领域国产大语言模型的性能评测
1
作者 侯家熙 袁莹 +1 位作者 黄宗财 李晖 《厦门理工学院学报》 2025年第5期40-47,共8页
针对国产大语言模型(large language models,LLMs)在地理信息科学(geographic information science,GIS)领域缺乏系统性评估基准问题,构建Geo-Text-700测试集的GIS领域定制化测评体系,基于优劣解距离层次分析法(technique for order pre... 针对国产大语言模型(large language models,LLMs)在地理信息科学(geographic information science,GIS)领域缺乏系统性评估基准问题,构建Geo-Text-700测试集的GIS领域定制化测评体系,基于优劣解距离层次分析法(technique for order preference by similarity to ideal solution,TOPSIS)对10个主流国产模型进行多维度评估。测评结果显示:模型表现呈现显著题型分化,客观题平均得分为68.4(标准差±5.2),较主观题低21.7%(P<0.05);Doubao-pro-32k综合得分最优(87.3),客观题优势显著(单选86,填空77);hunyuan-turbo在主观题(简答88.1,编程90.83)方面展现高阶任务潜力;领域知识盲区突出,如GIS拓扑规则题错误率为43.6%。 展开更多
关键词 地理信息科学(GIS) 大语言模型 评测体系 geo-text-700测试集 TOPSIS-AHP法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部