8月29日,2024中国国际大数据产业博览会(简称数博会)第二天,中国科学院地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”),目前在月球撞击坑年代和形态判别上的准确率已达到80%以上。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训练。
中国科学院院士、中国月球探测工程首任首席科学家欧阳自远表示,随着人类深空探测活动的快速推进,探测数据呈井喷式增长。科学大数据已然成为推动科技创新的强大引擎,目前在数据管理方面,我国已取得先发优势,在数据应用方面必须充分发挥现有的人工智能技术优势。基于阿里云通义模型构建的月球专业大模型,将大大加速海量数据的处理,帮助科研工作者挖掘新的科学发现。
据介绍,目前月球专业大模型的最佳落地场景是月球撞击坑识别。人类对月球地质演化的研究除了探测返回的样品,主要依靠撞击坑识别等月球地质对象的研究。撞击坑的大小、深浅、形状等特征,是研究月球地质演化的重要依据。据统计,目前月球上直径一公里以上的月球撞击坑数量已超100万个,直径一公里以下的撞击坑数量至今无法确定。如果完全依赖人工,完成所有月球撞击坑的识别是“几乎无法实现的”。
月球专业大模型的应用极大提高了科研效率,科研工作者只需输入月球撞击坑图像和相关问题,月球专业大模型即可调用通义视觉、多模态模型,从17种多模态数据中(包括光谱、高程、重力等数据)判定该图像对应的模态类型;通过检索知识库、调用通义语言模型,月球专业大模型可回答该撞击坑的形态、大小、年代等相关问题,并给出推理过程。
中国科学院地化所研究员刘建忠介绍,在月球撞击坑识别上,月球专业大模型的准确率已达到80%以上。“通过对海量数据的准确把握,大模型不仅可以对撞击坑进行分类,还可以解决一些目前仍未解决的科学问题。”
接下来,月球专业大模型将嵌入“数字月球云平台”,推动“月球云平台”智慧化升级。“数字月球云平台”由中国科学院地化所牵头建设完成,是国际上月球探测数据最全,集科学研究、工程应用以及科普教育为一体的云平台,将与FAST等大科学装置一同成为科研基础设施的重要组成部分,助力我国月球与行星科研创新加速。