全国统一热线:400-650-6508

上海打造大模型产业高密度创新“苗圃”

2024年04月04日    http://www.baogaoku.com   【字体:    

2022年,ChatGPT横空出世,大模型开始走入大众视野,成为全球互联网互联网行业分析报告焦点。2023年2月,Meta公司发布LLaMa并催生发展出开源社区,大模型从“只会聊天的工具”,变成了有可能会进入到“严肃生产领域”的生产力。迈入2024年,Sora的出世、Claude 3.0展现出的强大推理能力,以及马斯克刚刚开源的Grok,都代表着整个行业处在“方兴未艾”的赛道,大模型行业的发展有两个非常重要的驱动力量。一个是源于所有研究者和从业者对于技术理想的追求,不断突破边界,寻求越来越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同时产业界也看到了大模型带来产业革命的可能性,无数企业投入巨大资源到这个赛道中。两股力量交织在一起,形成了我们今天看到的大模型产业‘波澜壮阔’的局面。

而在国内,大模型产业的发展同样突飞猛进。去年3月份,百度发布“文心一言”,此后,阿里巴巴的“通义千问”、科大讯飞星火大模型、腾讯混元大模型陆续发布上线。互联网大厂之外,华为、京东、字节跳动、商汤科技,乃至三大电信运营商、各科研院所和高校的大模型产品也不断推出。有统计数据显示,中国研发大模型的公司已有100多家,迈入“百模大战”阶段。

同时,大模型行业也在不断涌现出新的课题。发展大模型产业,算力是门槛。随着大模型参数的增加,对算力的需求几乎是几何级增长的。另外,包括ChatGPT在内,大模型还带来了“一本正经地胡说八道”、“深度伪造”等伦理问题,需要各方加强治理。

此外,当前主流的大模型都是建立在Transformer架构堆叠的基础上,但这一架构对计算资源的消耗特别大。腾讯混元大模型算法负责人康战辉表示,当下越来越多的企业看到了MoE(即:混合专家模型)展现出来的优良特性,未来可能还会有更加高效的架构出来。有行业人士将2024年比作大模型应用的“元年”,认为行业的竞争焦点正在从基础模型到应用迁移。从目前来看,大模型确实已经落地到各行各业,生根发芽。

“大模型+科学”可以产生哪些化学反应?上海人工智能实验室青年科学家白磊介绍,实验室发布“风乌”大模型,可用以预测气象。由于大气系统的复杂性,全球中期天气预报的有效性每10年才提高1天。此前,全球范围内最好的物理模型有效预报时长最大为8.5天,而“风乌”达到了10.75天,且预测时间仅需30秒。

机器人与大模型的结合领域“具身智能”也是热点。“传统的机器人需要编程,需要写固定的代码,造成之前的人机交流非常僵硬。现在,我们告诉机器人它的手臂快碰到天花板了,在没有任何方向性指示的情况下,它能够理解,且做出正确反应。这在传统的机器人编程中,是不可想象的。我们期待,大模型能给机器人一颗通用的大脑。

网站导航
第一步 联系千讯报告库
第二步 双方签订服务合同
第三步 按照合同约定付款
第四步 交付报告
第五步 售后服务(一年)
全国统一热线:400-650-6508
       010-58672576 / 81
联系人:朱经理 韩小姐 刘小姐
邮  箱:qx@qx365.com