用户头像
北京智源研究院多模态融合研究进展:2025 最新学术成果发布

? 原生多模态世界模型 Emu3:重新定义 AI 感知物理世界的方式


北京智源研究院在 2025 年带来了一个革命性的突破,推出了原生多模态世界模型 Emu3。这个模型到底有多厉害呢?它打破了传统多模态模型依赖扩散模型和组合方法的限制,只需要通过预测下一个 token,就能同时处理文本、图像和视频三种模态的数据。想象一下,AI 不再需要分别处理不同类型的信息,而是像人类一样,能够自然地理解和生成多种形式的内容。

Emu3 的核心技术在于其设计的视觉 tokenizer,它能将视频和图像转化为离散的 token,与文本 token 一起输入模型。这种统一的处理方式,让 Emu3 在图像生成、视频生成和视觉语言理解等任务中表现出色。比如在图像生成上,Emu3 生成的图片质量甚至超过了 SDXL 和 LLaVA 等知名模型。在视频生成方面,它也优于 OpenSora,能够生成连贯、自然的视频内容。更令人惊喜的是,Emu3 还支持直接偏好优化(DPO),这意味着它可以根据人类的偏好进行调整,生成更符合需求的内容。

? 脑科学多模态通用基础模型见微 Brainμ:打开脑机接口新大门


除了 Emu3,智源研究院还发布了脑科学多模态通用基础模型见微 Brainμ。这个模型整合了神经科学领域的多个大型公开数据集和合作实验室的高质量数据,完成了超过 100 万单位的神经信号预训练。它的出现,为脑科学研究和脑机接口应用带来了新的可能。

Brainμ 能够将不同的脑信号,包括人类和动物的脑信号,与文字、图像、视频等模态进行融合,实现跨任务、跨模态、跨个体的分析。在抑郁症、阿尔茨海默病等疾病的预测上,Brainμ 的能力已经超越了专用模型。此外,它还能支持脑机接口应用,比如在便携式消费级脑电系统上重建感觉信号,这对于降低脑机接口应用的门槛具有重要意义。

? 具身智能新突破:RoboOS 2.0 与具身大脑 RoboBrain 2.0


在具身智能领域,智源研究院也取得了显著进展。发布的跨本体具身大小脑协作框架 RoboOS 2.0 和具身大脑 RoboBrain 2.0,为机器人的智能化提供了强大支持。

RoboOS 2.0 是一个支持无服务器一站式轻量化机器人本体部署的开源框架,开发者可以一键下载并部署相同型号机器人本体的小脑技能,实现大小脑的无缝整合。而 RoboBrain 2.0 则是目前全球最强的开源具身大脑大模型,其任务规划准确率相较前代提升了 74%,响应时延低至 3 毫秒以下。这些技术的应用,让机器人能够更好地理解人类指令,完成复杂的任务,如餐饮互动、家居物品收纳等。

? 开源生态建设:推动 AI 技术普惠


智源研究院一直致力于开源生态的建设,2025 年的成果也不例外。除了上述模型的开源,还发布了大型开源文本数据集 CCI 4.0。这个数据集从单一语言扩展为多语种,包含中、英语两种语言,并采用 CoT 方法进行推理轨迹数据合成,提升了预训练模型的基础推理能力。CCI 4.0 的数据总量达 35TB,支持了全球众多企事业单位的大模型研发。

此外,智源研究院还积极参与国际合作,发起并承办 AI 安全国际对话高端闭门论坛,与全球 AI 领袖学者及产业专家联合签署《北京 AI 安全国际共识》。这些举措不仅推动了 AI 技术的发展,也为全球 AI 安全标准的制定做出了贡献。

? 科学研究赋能:从数字孪生心脏到药物安全评价


智源研究院的多模态融合技术在科学研究领域也发挥了重要作用。与北大医院合作搭建的医学科研大数据平台,建立了跨系统、多模态、多组学的数据安全体系。研发的全球首个实时仿真数字孪生心脏,构建了具有精细细胞电生理与解剖结构的人心室模型,能够实现复杂的心脏电生理与病理仿真。基于此,还推出了全球首个高速跨尺度心脏药物安全性评价平台,将药物毒性仿真时间从近 90 天减少到一天之内,为药物研发提供了高效的支持。

? 未来展望:多模态融合开启 AI 新纪元


北京智源研究院 2025 年的多模态融合研究进展,展示了 AI 技术在感知、理解和交互方面的巨大潜力。从原生多模态世界模型 Emu3 到脑科学模型 Brainμ,从具身智能框架到开源生态建设,智源研究院的成果不仅在技术上实现了突破,也为 AI 的应用和发展提供了新的思路。

随着多模态融合技术的不断发展,我们有理由相信,AI 将在更多领域发挥重要作用,从科学研究到医疗健康,从工业制造到日常生活,AI 将为人类带来更多的便利和创新。智源研究院的探索,正引领着我们走向一个更加智能、高效的未来。

该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具。

作者头像

AI Insight

专栏作者

专注于AI技术前沿动态,为您带来最新的AIGC资讯和深度分析。

169 篇文章 3951 关注者