人工智能作为新一轮科技革命和行业变革的核心驱动力,正深刻改变着世界,推动经济社会向数字化、智能化、网络(网络行业分析报告)化加速跃进。今年年初,OpenAI发布文生视频模型Sora,从时长、画面、逻辑等多角度刷新行业指标,从而推动人工智能大模型应用向文生图、文生视频和代码生成等领域演进。
在此背景下,国内人工智能产业呈现井喷式增长,以大模型赛道为例,近期再次迎来多位重量级“玩家”。5月中旬,字节跳动在火山引擎原动力大会上发布了豆包大模型;仅隔半月,腾讯宣布混元大模型全面升级,并上线了大模型App腾讯元宝;紧接着,快手也对外开放了自研大模型产品“可图”……
顶层设计推动人工智能产业发展,随着政策推动,AI产业有望迎来新的发展机遇。据IDC预计,2026年中国AI市场将实现264.4亿美元的市场规模,2021年至2026五年复合增长率(CAGR)将超20%。
国产大模型未来大有可为,但也要清醒意识到,大模型目前尚未成为“刚需”。为了获得更多市场,许多公司宣布旗下产品降价甚至免费。5月份,阿里云宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅高达97%。作为行业风向标之一的百度宣布,文心大模型中的两大主力模型ERNIE Speed和ERNIE Lite免费。同时,腾讯在公布混元大模型全面升级的同时,也宣布主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。
国内大模型产品普遍采取低价甚至免费的策略,表面上看似乎是在复刻互联网行业初期的用户争夺战,实则蕴含着更为深远的战略意图。一方面,通过低价、免费开放,企业能够迅速积累用户,增加用户黏性,构建起庞大的数据反馈循环,这对于优化模型性能至关重要。
另一方面,降低使用成本,扩大使用规模,也反映了企业对于大模型长期价值的信心,愿意牺牲短期利润,换取技术迭代和市场占有的先机。然而,如何实现产品收入和算力成本支出间的均衡,避免重蹈“烧钱大战”覆辙,是所有参与者必须面对的挑战。
未来公共云的技术红利和规模效应,将带来巨大的成本和性能优势,在极致弹性的AI算力调度系统和分布式推理引擎的加速下,会大幅度压缩模型背后的推理成本,并加快模型的推理速度,进而降低成本。