科技巨头腾讯(0700.HK),周二推出了一套新的人工智能工具,能够将文本和图像转换为 3D 视觉效果,这是中国在生成人工智能领域日益增强的势头的最新例证。
腾讯在一份声明中宣布,发布了基于其浑元3D-2.0技术的五个开源模型,其中包括所谓的“涡轮”版本,据称可以在 30 秒内生成 3D 视觉效果,同时保持高精度和高质量。
目前,以人工智能初创公司 DeepSeek 为首的中国公司已开始通过以明显更低的成本提供相当或更优异的性能,挑战美国在该领域的主导地位。
腾讯的 3D 计划是在今年 2 月推出混元 Turbo S 之后推出的。混元 Turbo S 是一种大型语言模型,腾讯声称其查询处理速度比 DeepSeek 的旗舰 R1 模型更快。
腾讯于 2024 年 11 月首次推出其 3D AI 模型,主要针对设计师和游戏开发者,旨在将自己定位为文本到 3D 和图像到 3D 生成功能的先行者。
该公司于一月份推出了Hunyuan3D-2.0,声称其在文本一致性、几何准确性和视觉质量基准测试中优于领先的行业模型。
TikTok 母公司字节跳动也将在 2024 年发布 VeOmniverse 模型,进军文本转 3D 和图像转 3D 领域。然而,与腾讯的产品不同,它仍然是专有的。