腾讯混元世界模型1.5发布可生成实时交互的3D场景

凤凰网科技讯 12月17日，腾讯混元团队正式发布混元世界模型1.5（WorldPlay）。该模型支持通过文本描述或单张图片生成可实时交互的3D场景，用户可通过键盘、鼠标或手柄在生成的世界中自由探索。

据悉，此次发布版本强调空间记忆能力，当用户在场景中移动并返回先前区域时，模型能保持三维结构的前后一致性。模型支持以24帧/秒的速率生成720P视频流，并可将交互场景导出为3D点云复用。

腾讯宣布，此次同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架。技术报告公开了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节。该模型主要面向AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景。目前用户可通过官网申请体验。

本文转自：凤凰网科技

原文地址： https://tech.ifeng.com/c/8p9tyhnD4U1

搜索一下