凤凰网科技讯 12月17日,腾讯混元团队正式发布混元世界模型1.5(WorldPlay)。该模型支持通过文本描述或单张图片生成可实时交互的3D场景,用户可通过键盘、鼠标或手柄在生成的世界中自由探索。

据悉,此次发布版本强调空间记忆能力,当用户在场景中移动并返回先前区域时,模型能保持三维结构的前后一致性。模型支持以24帧/秒的速率生成720P视频流,并可将交互场景导出为3D点云复用。

腾讯宣布,此次同步开源了涵盖数据、训练与流式推理部署的实时世界模型全链路框架。技术报告公开了包括重构记忆机制、长上下文蒸馏及基于3D奖励的强化学习后训练等模块的细节。该模型主要面向AI游戏关卡生成、影视场景预览、虚拟现实及具身智能研究等场景。目前用户可通过官网申请体验。

本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8p9tyhnD4U1

小同爱分享1 天前
别随便嫌一个女生幼稚,她要是不喜欢你,比你妈都成熟。 - 小同爱分享
小同爱分享3 天前
俄罗斯方块告诉我们,合群就会消失,不合群就会失败。 - 小同爱分享