谷歌母公司Alphabet于2026年1月收购了马萨诸塞州剑桥的3D生成AI初创公司Common Sense Machines。该公司专注于将二维图像转换为三维资产的人工智能建模技术,是图像生成与多模态AI领域的重要创新。此次收购将增强谷歌在物理世界建模、空间推理和智能设计方面的研发能力,结合DeepMind的“世界模型”研究,推动从视觉概念到结构化三维输出的技术突破,为AI在设计、制造和科研领域应用奠定基础。
Alphabet,即谷歌母公司,已收购位于马萨诸塞州剑桥的初创公司Common Sense Machines,该公司专注于开发能够从二维图像生成三维资产的生成式人工智能模型。根据S&P的数据,这笔收购于2026年1月24日完成。财务条款未披露。这笔交易将一个小型、以研究为导向的AI公司纳入谷歌更广泛的人工智能资产组合。
根据其公开的LinkedIn资料显示,收购时Common Sense Machines约有十几名员工。PitchBook数据显示,该公司最近一次融资后估值约为1500万美元,融资金额为1000万美元,投资方包括Andreessen Horowitz。该初创公司成立于2020年,专注于训练能够从二维视觉输入推断三维结构的模型,这一技术领域与纯文本生成或纯图像生成系统仍有所区别。
领导层方面,剑桥初创公司的联合首席执行官为Tejas Kulkarni,他在创办公司之前曾在Google DeepMind担任研究科学家。他此前的工作经历将被收购团队与DeepMind的研究文化联系起来,不过Alphabet和谷歌均未披露收购后人员的整合方式。交易相关声明中,也未提及组织结构或产品方向的变化。
谷歌持续投资于图像生成和多模态人工智能系统,该领域结合了视觉、空间及上下文信息。DeepMind的领导层此前强调“世界模型”的作用,该术语用于描述旨在模拟物理环境各方面的AI系统,而非仅依赖符号或语言表示。能够将二维图像转换为结构化三维输出的系统,通常被认为属于这一研究方向,特别是在需要空间一致性和物理推理的场景中。
关于此次收购的公开信息仍然有限。除了收购完成日期、公司规模、融资历史和技术重点之外,尚未披露其他运营细节。

谷歌母公司与Common Sense Machines的标志。图片来源:Google/Common Sense Machines

Common Sense Machines AI生成三维资产的工作流程。图片来源:Common Sense Machines
DeepMind推动物理世界建模超越文本与图像
位于伦敦的人工智能研究公司Google DeepMind,隶属于谷歌,近期扩大了其在建模物理属性的AI系统方面的工作,而不仅仅局限于文本或静态图像。2025年12月,公司宣布与英国政府合作建立一个全自动研究实验室,将机器人技术与AI结合,开展材料科学自主实验。该设施将整合DeepMind的大规模AI模型套件Gemini,重点通过自动化实验识别新型超导材料。这一举措揭示了先进AI研究中的一个持续约束:将模型输出转换为反映现实世界结构、物理行为及实验有效性的表示,而不仅仅是抽象预测。
另一项DeepMind合作在工作流程的不同阶段体现了相同的约束。研究人员与设计师Ross Lovegrove、Lovegrove Studio和Modem合作,利用Gemini中的生成图像系统生成设计概念,这些概念随后通过金属3D打印制作成实体。该项目需要人工指导的精细调整,以保持结构逻辑和材料可行性,然后才能将概念转换为实体物体。从图像生成到可制造的实物,揭示了当前模型在几何形状、深度和材料约束表示上的局限性。

从草图生成到最终椅子设计。图片来源:Google
这些项目共同表明,尽管DeepMind的系统能够生成视觉和概念输出,但将二维表示可靠地转换为结构化三维形式仍然是技术瓶颈。