中国商报(记者 赵熠如 文/图)4月9日,阿里云在北京召开AI势能大会。阿里云通义大模型业务总经理徐栋在大会上表示,大模型开源对于吸引优秀人才、提升阿里云业务销售收入、提升模型能力来说有很多好处。同时,他提出,“多快好省”、全模态融合、推理能力是大模型产业落地的关键方向。

阿里云通义大模型业务总经理徐栋。
“首先,模型开源对于人才招聘以及品牌技术重塑很有利。Meta、Google开源的策略是吸引更多优秀的人才,DeepSeek开源很久后,其优秀人才的密度也非常高。所以,模型开源对人才建设是很有帮助的。第二,模型和云服务是一个‘硬币’的正反面。通义大模型开源后,对阿里云销售的提升作用是显而易见的。我们通过开源的方式,降低了所有国内外开发者使用模型的门槛。在使用模型的过程中,开发者自然而然会选择最大的云厂商。第三,开源之后,我们得到开发者社区里面的很多反馈,包括国内科研机构以及很多头部互联网公司的建议。这些反馈告诉我们,模型输出的稳定性是否有一些小的corner case(极端情况或特殊情况),我们也可以快速调整在某些数据上的表现。”徐栋说。
徐栋认为,如果开源模型做不到业内SOTA(当前最佳技术),做不到赶超闭源模型,那么开源模型也没有意义。
“所以,这反过来加强了整体团队的模型迭代速度和能力的建设。”徐栋表示,“模型开源打开了面向开发者的沟通渠道,基于开发者的反馈,来帮助模型建立更好的链路,这对于模型能力的提升是非常有帮助的。”
徐栋认为,“多快好省”的效率提升、Omni(全模态融合)、Reasoning(推理能力),是大模型与产业落地紧密挂钩的三个方向。
“模型发展的主脉络是提高精度、降低成本,这是客户最希望用到的模型,简单来说就是‘多快好省’。与此同时,客户越来越希望使用全模态模型,且客服场景、消费电子交互场景等都需要全模态交互。”徐栋表示。近日,魅族宣布其新机Note 16系列将成为首个深度接入Qwen2.5-Omni的终端。
“在Reasoning(推理)方面,我们会把工具调用也放到模型推理过程中,即模型在展开思考时,发现自己的知识不够,它会调取第三方工具,基于这些结果再进行思考。这是推理模型长期发展的很重要趋势。”徐栋说。据悉,国家天文台、中国科学院青藏高原研究所、中国科学院南海海洋研究所等多个中国科学院研究机构的科研项目已接入阿里通义千问QwQ-32B,用推理大模型提升科研效率。
据悉,截至2025年1月底,阿里云百炼平台中调用通义API的企业和开发者已超过29万,用AI重构代码开发、硬件制造、智能座舱、金融服务、药物研发、太空探索等场景,AI的行业化应用经验正在迅速积累与沉淀。
“我们一开始做的是通用模型,未来应该会基于客户去迭代,有可能从单一的客户项目,变得相对规模化、产品化。”徐栋说,“我们认为,深度强化学习在未来会非常有前景,而这件事情是跟客户的SOP(标准作业程序)、业务流紧密挂钩的。我们也期待在这个领域能有更多合作。”