欢迎光临消费电子实验室!  

登录 立即注册 找回密码

设为首页收藏本站

阿里发布世界模型HappyOyster

2026-4-16 18:28| 发布者: cncelab| 查看: 64| 评论: 0

摘要: 该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成。目前产品可实现漫游(Wander)和导演(Direct)两大核心能力,用户可以实时构建可互动、可演绎、可探索的 AI 数字世界。
【消费电子实验室-2026/4/16】今日,阿里巴巴发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成。目前产品可实现漫游(Wander)和导演(Direct)两大核心能力,用户可以实时构建可互动、可演绎、可探索的 AI 数字世界。同时,用户生成的数字世界,不仅能被完整保存,还能开放给其他用户进行二次创作。据悉,该产品由阿里ATH创新事业部团队研发,与此前爆火的HappyHorse(快乐马)同属一个团队。

相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。阿里的HappyOyster与谷歌的Genie3同属于世界模拟器流派。区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程,这一流派采用长时间跨度上的世界演化建模方式。通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,模型能够主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”,为构建可交互的通用世界模拟器提供了关键技术路径。

相比谷歌,此次阿里发布的HappyOyster采用了时间跨度更长的世界演化建模方式,使得模型能够保持高保真、长时序的动态场景生成。同时在建模初始就设计了多样的控制信号,使模型能够在统一的时序框架下同时实现生成质量、长时序与实时可控性的协同优化。在产品能力上,HappyOyster呈现出差异化优势。不仅能支持Wander漫游探索,还独家提供实时导演功能,用户可通过自然语言指令随时介入世界演化、调度角色事件,实现从被动探索到主动创作的跨越。


鲜花

握手

雷人

路过

鸡蛋

网站介绍 广告业务 欢迎投稿 招聘信息 联系我们 友情链接 法律顾问 网站地图

CopyRight 2012消费电子实验室 版权所有 京ICP备12048044号-4号

电话:13701384402 邮编:100040 邮箱:BICQ6688@QQ.COM

回顶部