首页 > 快讯 > 快讯详情

智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

格隆汇10月30日|据科创板日报,智源今日发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction(NSP)”,获得了可泛化的世界建模能力。在场景应用层面,模型不仅能实现跨场景的具身操作、具备泛化的动作规划与复杂交互能力,也能完成文图生成、图片编辑与时空变换。