具身智能 AI快讯列表 | Blockchain.News
AI 快讯列表

AI 快讯列表关于 具身智能

时间 详情
2026-04-14
15:06
Gemini Robotics-ER 1.6重磅升级:视觉与空间推理突破,提升真实场景机器人规划与执行

据GoogleDeepMind在X平台发布的信息,Gemini Robotics-ER 1.6显著强化视觉与空间理解,用于帮助机器人在真实环境中更好地规划并完成多步骤任务。根据GoogleDeepMind官方帖文,此次升级聚焦场景感知、目标定位与操作规划,使机器人在动态环境中的任务分解与顺序执行更稳定。依据GoogleDeepMind的说明,该能力将利好仓储拣选、移动操作与居家辅助等落地场景,有望降低失败率并提升任务吞吐,从而为商用机器人部署带来更高安全性与投资回报。

2026-04-14
15:06
Gemini Robotics ER 1.6 最新突破:在杂乱场景中实现高精度目标定位与计数

据 Google DeepMind 在 X 平台发布的信息,Gemini Robotics‑ER 1.6 能在杂乱图像中更准确地定位、识别并计数指定物体,同时忽略不存在的目标,适用于车间工具查找等场景。根据 Google DeepMind 的介绍,该能力面向具身智能任务,如抓取放置、库存盘点与视觉引导操作,能降低误检和漏检带来的成本。依托该模型在复杂环境下的稳健性,制造、仓储与设备运维等行业可期获得更低的误抓率与更快节拍,带来拣选效率与质量追溯的业务机会。

2026-04-14
15:06
Gemini Robotics‑ER 1.6 突破:凭借代理式视觉实现指针表“子刻度”读数 — 2026 深度分析

据 GoogleDeepMind 在 X 平台发布的信息,Gemini Robotics‑ER 1.6 融合空间推理、世界知识与代理式视觉,能够对多类指针式仪表进行“子刻度”级读数,并在演示视频中展现了精确解析表针与刻度间距的能力。根据 GoogleDeepMind 的介绍,这项能力可用于产线过程监控、实验室自动化与工业巡检,尤其适用于仍大量使用传统表盘的场景。依照 GoogleDeepMind 的说明,视觉与具身推理的结合可减少对传感器改造的依赖,为存量工厂提供可即刻部署的自主化升级路径。

2026-04-04
00:36
特斯拉自动驾驶与机器人战略:2026最新分析与商业化机遇

据 SawyerMerritt 在 X 上发布的视频,David Friedberg 表示,特斯拉从电动车公司演进为自动驾驶公司,其自动驾驶能力正推动机器人革命,即便整车盈利波动,软件和机器人业务或成核心价值来源(来源:Sawyer Merritt,2026年4月4日)。据该视频所示,Friedberg 指出特斯拉依托数据、感知、规划与具身智能的垂直栈,可在 FSD 订阅、机器人出租车与通用人形机器人等方向实现高毛利变现。根据 Sawyer Merritt 的报道,这一观点将特斯拉定位为以真实世界数据闭环与大规模训练为护城河的 AI 平台公司,未来机会在出行即服务与企业级机器人场景。

2026-03-25
02:55
特斯拉Optimus最新视频:揭秘人形机器人研发团队与AI训练进展(2026深度解析)

据Sawyer Merritt在X平台披露,特斯拉发布了Optimus最新视频,重点展示人形机器人背后的工程团队与构建流程,并呈现机器人在操作、行走与工厂集成方面的最新进展。依据该视频信息,特斯拉通过硬件、感知与控制协同迭代,强化数据采集、仿真与实地验证管线,支撑具身智能快速落地。根据同一来源,这一进展对制造与物流自动化具有直接商业价值,短期可在工厂重复性工序中落地,长期有望扩展至仓储搬运与物料流转场景。

2026-03-23
17:30
实时机器人网球突破:视觉语言控制系统实现与人类对打

据Fox News AI称,研究团队展示了一款能与人类实时对拉的机器人,依靠高速视觉、轨迹预测与闭环控制,将反应延迟压至百毫秒级内。根据Fox News报道,该系统通过机载摄像头与推理估计来球旋转、速度与落点,并动态调整拍面角度与挥拍路径,标志具身智能在高速运动场景的实用进展。根据Fox News,这一能力为自主体育教练机器人、自适应康复设备与仓储抓取等高频感知—决策—执行场景带来商业机遇。报道称,方案体现从传感到执行的一体化链路与多模态融合控制的趋势,可为零售、物流与文体娱乐等实时机器人产品化提供范式。

2026-03-15
15:35
清华“网球机器人”突破实时视觉与控制:3大商业机会深度分析

据 The Rundown AI 在 X 平台报道,清华大学团队展示了一款能与人类稳定对打的网球机器人,依托实时视觉、轨迹预测与运动规划实现精确击球和跑位。根据 The Rundown AI 引用的清华团队研究演示,该系统的时延控制和高频感知表现为商业化带来三大方向:智能网球陪练设备与球馆训练服务、面向高速动态任务的具身智能评测与算法授权、以及在不确定环境下需要快速反应的工业分拣与协作机器人应用。

2026-03-12
23:07
OpenMind在NVIDIA GTC发布迎宾机器人:真实社交交互与落地场景分析

据OpenMind在X平台披露,其迎宾机器人将在NVIDIA GTC亮相,并已展示主动接近陌生人发起对话的现场视频,体现了设备端感知、多模态对话与社交导航等能力。根据OpenMind信息,机器人可识别互动意愿并维持情境化交流,适用于零售迎宾、活动签到、排队分流与博物馆引导等高频场景,助力缓解人力短缺并沉淀结构化用户反馈。OpenMind同时指出,依托NVIDIA GPU加速的视觉、语音与策略推理流水线,系统实现低时延交互,有助于安全与信任的建立。

2025-09-02
20:17
具身人工智能突破与挑战:解决复杂人类任务及规模定律最新进展

据@jimfan_42报道,AI领域正积极研究具身人工智能在解决长周期、复杂人类中心任务方面的能力,关注高低层次控制与规划的高效结合。最新研究显示,当前模型在实际环境中有显著进展,但在应对新颖或不可预测场景时仍面临泛化能力的局限(来源:@jimfan_42)。与此同时,业界对具身AI是否存在类似语言模型的规模定律表现出浓厚兴趣,这可为未来技术研发和商业应用提供指导。相关进展推动了机器人、自动化系统及AI驱动产业的商业机会。