随着深空探测技术的快速发展,月球探测数据呈现井喷式增长。“现在全世界有关月球和行星的探测数据,超过2个PB。”月球上有密密麻麻的撞击坑,这些撞击坑对月球本身演化产生重要影响,但由于撞击坑数量众多、形态复杂多变,研究起来非常复杂。
现在统计最多的是直径大于一公里的撞击坑,最新统计文件(文件行业分析报告)数据统计100多万个。随着撞击坑直径变小,它的数量呈指数级别增长。要把每一类撞击坑都识别或统计出来,如果全部依靠人工,不太可能实现。
如今飞速发展的人工智能大模型为这一问题提供了解决方案。去年以来,阿里云与中国科学院地球化学研究所充分交流,历时近一年打磨,把多模态大模型拓展到了月球研究领域。
陨石撞击坑是我们双方合作的第一个试点。现在看,在月球撞击坑年代和形态判别上,月球科学多模态专业大模型的准确率最高能够达到80%以上,超出了我们预期。随着双方合作的深化,未来多模态大模型还可以拓展到月球更多地质地貌的分析研究上去。
利用大模型,可以大幅度提高撞击坑识别效率,降低研究成本,在这个项目上,地化所提供了很多月球和行星方面的教材和文献,接近2万多个PDF文档,大概有50多个TB。阿里云对这些文档进行数据处理后,变成了训练“大模型”的知识中心。