DeepSeek出来后,《自然杂志》在一个星期内发了五篇文章讲它,探讨它能不能推动科技的发展。个人觉得‘赋能’这个词低估了人工智能对科学的颠覆。那么,人工智能是否要代替人类研究?要增强模型的可解释性和透明度,共同制定标准和规范,还应促进资源共享,加强跨学科、跨行业的交流合作,来开发开源的、开放的科学创新模式。
人工智能会越来越多地被用于取得重大的科学突破。在科学领域会看到巨大突破,因为人工智能能够分析大量的、海量的数据,这是前所未有的一种方式,是我们以前用老式的计算技术没有办法做到的,AI可以帮助我们来进行图像处理、数据统计分析,新的生成式AI可以帮助我们进行推理,可以帮助我们发现以前发现不了的东西。AI4S非常具有挑战性,但是和AI+X相比,它实际上是相对容易的,取得成果是比较确定的。“因为AI4S的对象是自然科学,这个东西有不变的东西,这实际上是最适合人工智能来做的。
大模型为什么有这么强大的能力?这个模型怎么来的?预训练大模型需要大量的数据,整个互联网所有的数据收集,需要大量的算法,千卡、万卡级别训练大模型。后训练只需要非常少的算力、非常少的数据就可以完成。最新成果发现,其实在后训练可能不需要数据,基于强化学习,这个模型也能自我学习、自我迭代。现在科学意义上的人工智能并不存在,需要从各个学科进行交叉科学的理解来推进人工智能科学本身的塑造,这样才真正形成了正向的循环。
另一方面,互联网(互联网行业分析报告)人工智能的飞速发展对能源系统带来许多挑战。我们看到计算的需求、能源的需求都在持续增长,尤其现在随着集中式大型语言模型的兴起,人均二氧化碳排放量正在急剧上升,训练大型模型需要很多能源,这对于环境是有害的。要加大投资对于分布式智能的研究和工业应用。