人工智能(AI)近两年的发展具有“大”和“多”的鲜明特征,大模型的参数规模越来越大,文图视等方面的多模态能力也越来越强。2025年,它又将如何进化?
大模型应用更广,推理能力更强大
2024年,各家大模型不再简单竞争参数规模,而是将兼具文字、图片、视频等不同能力的多模态作为重要发力点。美国开放人工智能研究中心(OpenAI)的文生视频大模型Sora在2024年2月面世就惊艳世界,正式版已于2024年12月向用户开放。
美国谷歌公司近期发布的《2025年AI商业趋势报告》预测,2025年,多模态AI将成为企业采用AI的主要驱动力,助力改善客户体验,提高运营效率,开发新的商业模式。
AI的逻辑推理能力在提升。OpenAI在2024年9月发布推理模型o1,并在2024年12月迅速升级到o3版本,新模型在数学、编程等复杂问题上表现出超越部分人类专家的水平。
美国“元”公司最近推出了与传统大型语言模型不同的大型概念模型,它可以在更高的语义层级———“概念”上进行思考。这种方法能更好地捕捉文本的整体语义结构,使模型能在更高的抽象层面进行推理。
智能体将更普及,具身智能受期待
智能体的出现频率将越来越高。智能体指使用AI技术,能自主感知环境、作出决策并执行行动的智能实体。
智能体可以是一个程序。2024年11月底,在智谱AI开放日上最新“出炉”的智能体已可替用户点外卖。只要说出需求,它就可在无人工干预条件下完成跨应用程序、多步骤的真实任务。
业界普遍认为,这种智能体2025年将变得更加普及,且能处理更复杂的任务,将人类从一些重复且琐碎的工作中解放出来。智能体还可结合物理实体,形成“具身智能”,如自动驾驶汽车、具身智能机器人等。
“规模定律”受考验,多重挑战需应对
大模型过去一段时间的快速发展符合“规模定律”,即大模型的性能随着模型参数、训练数据量和计算量的增加而线性提高。但近来不断有迹象显示,由于训练数据即将耗尽、更大规模训练的能耗和成本激增等因素,“规模定律”可能难以延续。
发展AI的能源挑战也备受关注。由于训练最新的大模型耗能巨大,微软、谷歌等科技巨头已将目光瞄向核能。
AI的快速发展还伴随着安全、治理等方面的新风险。例如,多模态功能的拓展,使虚假信息的内容形态更加多元,也更难被普通人所辨别;智能体自主性的提高,会带来其目标与人类意图不一致或产生意外行为的风险。
为应对这些风险和挑战,全球多国已从政策法规、技术标准等多个维度加强AI治理。