稚晖君搞了个“好货色”，网上的视频也能拿来_AG旗舰厅app下载

稚晖君搞了个“好货色”，网上的视频也能拿来

发布时间：2025-03-13 09:33

稚晖君搞了个“好货色”，网上的视频也能拿来练习呆板人了进步庞杂义务胜利率！上周五，稚晖君在微博预报了一波“好货色”。周一，智元呆板人beat365亚洲体育在线官网就展现了新产物。这款呆板人可能端茶倒水、煮咖啡，还能把面包放进面包机，涂抹果酱，并将面包端到眼前。别的，它还能够充任迎宾前台。不外，这些功效在现今的人形呆开元棋盘官方网站板人视频中已不常见。真正值得存眷的是智元呆板人宣布的基座年夜模子GO-1（Genie Operator-1）。这个年夜模子处理了人形呆板人临时以来面对的数据匮乏跟泛化才能差的成绩。稚晖君搞了个“好东西”，网上的视频也能拿来训练机器人了提高复杂任务成功率

现在，人形呆板人表示欠安的一个主要起因就是缺少高品质数据，而获取这些数据的本钱十分高。客岁底，智元呆板人开源了百万真机数据集AgiBot World，涵盖了超越100万条轨迹、217个义务跟106个场景。只管如斯，这些数据依然缺乏以处理呆板人泛化才能差的成绩。稚晖君搞了个“好东西”，网上的视频也能拿来训练机器人了提高复杂任务成功率

为此，智元呆板人提出了新的ViLLA（Vision-Language-Latent-Action）架构，这是GO-1年夜模子的中心。与传统的VLA架构差别，ViLLA架构不只依附于大批标注过的真机数据，还能应用互联网上的大批人类视频数据。这象征着基于GO-1年夜模子的呆板人能够经由过程不雅看视频来进修响应举措。稚晖君搞了个“好东西”，网上的视频也能拿来训练机器人了提高复杂任务成功率

详细来说，ViLLA架构由VLM（多模态年夜模子）跟MoE（混杂专家）构成。VLM处置输入的视频数据，潜伏举措模子将其拆解成要害步调，如“抓取”、“挪动”跟“喝水”。接着，隐式计划器进一步细化这些步调，天生更具体的指令。最后，举措专家将这些指令转换成呆板人能够懂得并履行的举措旌旗灯号。

上一篇：苹果操纵体系表面或推翻界面年夜改革

下一篇：没有了