在全球人工智能领域,中外技术实力的对比一直是相关行业关注的焦点。近年来,我国AI技术在多个关键领域取得了显著的突破。尤其在大模型技术的研发和应用方面,逐步缩小了与国际领先水平的差距,在数量、性能、创新技术以及国际竞争力等方面,都展现出了强大的实力和潜力。
在ChatGPT出现后不到一年的时间里,我国就出现了130多个大模型。截至目前,10亿参数规模以上大模型数量更是超过了100个,远超美国大模型数量。性能方面,我国后来居上,比如阿里云通义千问大模型发布的Qwen2-72B模型,在性能上不仅超过了文心4.0、豆包pro、混元pro等国内的闭源大模型,也超越了美国最强的开源模型Llama3-70B。在权威模型测评榜单OpenCompass中,Qwen开源大模型凭借卓越的性能和开放性,迅速成为全球下载量最大的中文语言模型,为行业生态发展提供了广泛的技术支持和应用场景。
近年来,国内AI大模型在创新技术与架构方面取得了显著进展,为全球AI领域的发展注入了新活力。DeepSeek作为我国企业幻方量化推出的创新性大模型,在自然语言处理和多模态生成领域取得了亮眼成绩,在主流的大模型榜单中,DeepSeek-V3在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲,展现出了与国际顶尖模型相媲美的能力。
国际竞争力方面,国内AI大模型在国际评测中屡获佳绩,我国团队在国际权威AI榜单和赛事中的表现不断刷新纪录,如阿里云Qwen-VL在MME、Seed-Bench和TouchStone三个多模态大语言模型评测中获得第一,展示了不俗的竞争力。
此外,在具身智能和世界模型的研究领域,我国同样取得了引发全世界关注的重要进展。具身智能强调AI互联网(互联网行业分析报告)从数字世界走向物理世界的能力,为人工智能赋予更强的感知和交互能力;而世界模型则聚焦于因果推理,为AI提供更高级别的认知与逻辑推理能力。这些技术的突破,将进一步巩固我国AI技术在国际竞争中的领先地位。