深圳国际研究生院合作在文本-3D场景生成技术领域取得新进展
新清华 2025年12月19日 第2387期 学术前沿
本报讯 随着具身机器人的场景泛化需求和数字内容创作需求,从预定义的资产集合中生成逻辑连贯且丰富的自定义3D场景布局(文本-3D场景生成)成为一项具有挑战性的任务。近日,清华大学深圳国际研究生院曾龙副教授团队与合作者共同研究搭建了一个3D场景布局系统,能在给定某个高质量的3D资产库的情况下,在文本或图像输入下即可生成自然、细致且逻辑连贯的3D场景布局。这一成果也使原本需要耗费2.5小时的工作流程有望降低至4分钟以内。
这一项研究成果以“Imaginarium:视觉引导的高质量3D场景布局生成”为题,被计算机图形学领域顶会SIGGRAPH Asia 2025接收,并发表于《美国计算机协会图形汇刊》(ACM Transactions on Graphics)。腾讯IEG游戏AI中心高级研究员邓治博士和曾龙为该论文的共同通讯作者,深圳国际研究生院2022级硕士生朱晓明为第一作者。
(深圳国际研究生院)