在当地时间周一揭幕的行业顶级会议SIGGRAPH(国际计算机协会计算机图形学和交互技术特别兴趣小组年度会议)上,“全球股王”英伟达推出一系列面向机器人开发者的世界模型 、应用库和基础设施。
其中 ,最引人关注的是参数量只有70亿的开源物理AI应用和机器人视觉推理模型Cosmos Reason 。
英伟达介绍称,自从OpenAI多年前发布CLIP模型以来,视觉语言模型已经改变了计算机视觉任务 ,例如物体与模式的识别等。然而,此前的模型无法解决多步骤任务,也难以应对模糊或新颖的现实体验。
凭借记忆和理解能力 ,Cosmos Reason能够使机器人和AI具身代理“像人类一样推理 ”,并在真实世界中采取行动 。
在英伟达给出的案例中,运行视觉推理模型的机器人手臂 ,成功根据“面包+烤面包机”的场景,推断出最合理的下一步动作是将面包放进烤面包机进行烘烤,并将思考逻辑转化成机器手臂的操作指令。
(来源:英伟达)
这项功能叫做“机器人规划与推理”。Cosmos Reason能够作为机器人的“大脑 ”,负责有意识、条理化的决策 。视觉推理模型能够解释环境 ,并在面对复杂指令时将其分解为任务并利用常识执行。
除此之外,这个模型还能用于一系列AI应用。例如自动化对大规模、多样化训练数据集进行整理 、标注,也能从海量视频数据中提取有价值的信息并进行归因分析 。
目前这个模型已经投入商业化运营。英伟达披露 ,公司内部的机器人和自动驾驶团队正使用这个模型进行数据整理与过滤、标注以及VLA(视觉语言动作)后训练。优步(Uber)也在使用该模型为自动驾驶训练数据进行标注与生成说明。
除此之外,麦格纳国际正在使用该模型开发全自动即时配送解决方案City Delivery,用来帮助车辆更快适应新城市环境 。VAST Data、Milestone Systems也在交通监控自动化 、视觉检测等领域应用该模型。
除了Cosmos Reason ,英伟达也在Cosmos世界模型中新增了Cosmos Transfer-2,用来加速从3D仿真等场景生成合成数据,以及一个经过蒸馏、更为注重速度优化的Cosmos Transfers版本。
英伟达也在周一更新了Omniverse软件开发工具包 ,并公布了新的神经重建库 。其中包括一种渲染技术库,允许开发者使用传感器数据在三维中模拟现实世界。
这一系列发布标志着AI芯片巨头正在加码进军机器人领域,试图将其培养成AI数据中心之外的下一个重要应用场景。
开户买股票哪些平台好:杠杆资金-3000亿新消费龙头创新高!A股“泡泡玛特们”涨疯了
怎么买可融资的股票:十大炒股杠杆平台-华为将发布AI推理创新技术UCM 实现高吞吐、低时延体验
什么叫炒股杠杆:股票网上配资平台-7天70款车型降价 谁为价格战买单?供应商利润空间继续被压缩
手机股票配资平台:杠杆交易什么意思-鲍威尔考虑辞任美联储主席?或因美联储总部翻修项目面临压力
什么叫股票加杠杆:广西股票配资一览表-OpenAI新模型o3“抗命不遵” Claude Opus 4威胁人类!“失控”背后:AI应该“踩刹车”了?
做股票开户需要什么:股票杠杆平台排行-港股午评:恒生指数涨0.78% 恒生科技指数涨1.29%
股票什么app比较好:运用杠杆原理的工具有哪些-上半年最热十大板块梳理:DeepSeek概念傲视全场 人形机器人、军工板块掀上涨热潮
旺牛配资提示:文章来自网络,不代表本站观点。
商务部新闻发言人就美方豁免部分产品的“对等关税”答记者问,具体内容如下。有记者问:美方近日宣布豁免部分产品“对等...
界面新闻编辑|江怡曼近期,多家A股上市公司披露2024年度分红计划,其中不乏大额分红预案。4月10日...
宏观要闻外交部回应中方宣布对加拿大部分产品加税据《北京日报》客户端消息,商务部3月8日公布就加拿大对华相...
国家卫健委主任雷海潮在参加十四届全国人大三次会议江苏代表团开放团组会议时指出,人口问题仍是一个需要深入和动态研究的重要问...
截至2025年3月21日,泉果旭源三年持有期混合A(016709)近半年回报达34.75%,跑赢基金比较基准增长率(20...
2025年3月10日,神农集团(605296.SH)披露了2025年2月养殖业务主要经营数据。2025年2月份,公司销售...
据中国外汇交易中心,人民币兑美元中间价报7.1696,调升45点。...
记者|赵阳戈2025年3月中旬,沪市科创板IPO受理首单花落傲拓科技股份有限公司(简称”傲拓科技“)。公...