机器人行业进入下沉阶段,谷歌发布低成本机器人学习平台 | 一周最火AI学术

通过引入低成本机器人学习机器人基准(ROBEL)解决硬件昂贵的问题,该开放平台旨在鼓励快速实验和硬件上的强化学习。

作者 / Christopher Dossman 编译 / Junefish、云舟 出品 / 公众号“大数据文摘”(ID:BigDataDigest)理论派经授权发布

本周最佳学术研究

低成本机器人学习的基准

随着机器人行业的不断发展,对于研究人员而言,不断努力实现低成本机器人开发和解决方案至关重要。目前有很多相关研究正在进行中,例如最近的MuSHR赛车项目。

相关链接:https://medium.com/ai%C2%B3-theory-practice-business/a-low-cost-open-source-robotic-racecar-for-education-and-research-91a896557f25

关于机器人技术的研究仍然非常活跃,为了在现实世界中进行强化学习,研究人员已经发布了一个低成本的机器人开源平台。

为了加速不同领域的强化学习研究,这个新的机器人平台引入了两个机器人。其中一个机器人 D’Claw是三指机器人,该设计有助于机器人学习如何灵巧地处理任务;另一个机器人D’Kitty是四足机器人,其设计便于学习敏捷的腿部运动任务。

目前的机器人领域已有很多振奋人心的进步和预测,但未来将有更多令人叹为观止的发展,其中之一就是低成本的训练和测试环境。

ROBEL平台就是致力于上述这一点。在巨大的成本优势下,它特别的模块化使其非常适合可扩展实验。ROBEL平台不仅提供了便宜的解决方案,还易于维护,为从头开始的硬件增强学习保驾护航。

代码,文件和结果:https://sites.google.com/view/roboticsbenchmarks/

阅读全文:https://ai.googleblog.com/2019/10/robel-robotics-benchmarks-for-learning.html

YOLO Nano:对象检测的新地标

随着人们对设计和开发更好的物体检测(尤其是移动技术)的兴趣日益浓厚,研究人员推出了YOLO Nano,这是一种高度紧凑的用于物体检测的深度卷积神经网络。

为实现这一目标,研究人员采用了一个人机协作的设计策略,该策略包括了基于规则的网络设计原型阶段和机器驱动的设计探索阶段。YOLO Nano具有约4.0MB的模型大小,需要4.57B的推理运算操作,在VOC2007数据集上达到约69.1%的mAP。

研究人员在 PASCAL VOC 数据集上测试了YOLO Nano的模型大小、物体检测精度和计算成本,结果显示,YOLO Nano 在嵌入式物体检测中实现了强大的推理速度和电源效率。

视频监控,IoT,无人驾驶飞机,自动驾驶等应用需要本地嵌入式处理系统,YOLO Nano为此迈出了重要的一步。

相关链接:https://arxiv.org/abs/1910.01271v1

TorchBeast发布,懂Python就能做强化学习

这篇文章中,Facebook AI,牛津大学,帝国理工学院和伦敦大学学院的研究人员描述了TorchBeast的设计原理和实现。TorchBeast是用于强化学习研究的平台,它实现了流行的IMPALA代理,并且具有MonoBeast和PolyBeast两个变体。

除了Python和PyTorch之外,MonoBeast不需要其他主要依赖项。PolyBeast则可以实现一些高级特性,它允许跨机器训练,也因此更难安装。MonoBeast变体的主要目的是使PolyBeast的入门变得容易。

研究人员坚信,TorchBeast让我们离强化学习研究无需静态框架或复杂库的目标又近了一步。

通过用简单易读的PyTorch来实现IMPALA,TorchBeast可以促进公平的竞争环境,帮助使用者从零开始建立易于使用的,可规模化且快速的设计。两种版本都使用多进程来解决Python多线程的技术限制,最重要的是,它们使研究人员无需Python和PyTorch之外的任何编程知识,也能够进行可扩展的强化学习研究。

TorchBeast是根据Apache 2.0许可以开源软件包的形式发布的:

https://github.com/facebookresearch/torchbeast

阅读原文:https://arxiv.org/abs/1910.03552v1

使用抽象渲染比较优化6D对象姿态预测

最近一项研究将渲染和比较框架应用在了单目6D姿态估计上,特别地,在初始姿态猜测可用的情况下,这一框架可以用于姿态优化。

在他们提出的对于二次渲染效果保持不变的抽象描述空间中,通过最小化渲染图像和观测图像之间的像素级差异,可以从最新的姿势估计方法中提升对6D姿势的预测。

进一步地,他们像许多工业和机器人应用一样假设了对象网格的可用性。这一方法已经在YCB-Video数据集上进行了评估,并表现出了很好的效果,同时也显示出对正确的物体姿态估计有很大的潜力。

该方法在YCB-Video数据集上取得的良好效果,证明了该方法能够在场景分析的背景下,对差分渲染的初始姿态估计进行稳健的细化。该方法也可与其他迭代求精过程相结合,从而有助于其对整体场景的理解。

研究人员表示,未来将会有许多在人类环境中工作的服务机器人,它们将使用为人类而设计的工具和工业零件进行活动,这样的机器人能够从精确的6D姿态估计中受益匪浅。

研究人员还计划进一步提高其性能,并在未来研究其他应用,包括类级模型的非刚性注册等。

原文:Refining 6D Object Pose Predictions

人体姿势估计的可学习三角测量

三星人工智能中心和莫斯科斯科尔科沃科技研究所的研究人员提出了两种基于可学习三角剖分的多视点三维人体姿态估计新方法。第一个解决方案结合了基本的微分代数三角剖分,和从输入图像估计的置信权。第二种方法则是基于二维骨架特征映射的人体数据聚合方法。此后,三维卷积通过生成最终三维关节的热力图对聚集体积进行细化,并允许预先对人体姿势进行建模。

这一方法极大地减少了在CMU Panoptic数据集上实现高精度和生成平滑姿态序列所需的视图数量,并且无需对时间进行处理,这证明了改进数据集真值标注的潜力。

这一方法证明了解决方案在数据集之间的可传递性,并在Human3.6M数据集上实现了最新的性能,Human3.6M数据集是目前最大的3D人体姿态基准之一,有许多针对单目和多视图设置的报告结果。

该方法具有学习人体姿态的能力,对遮挡和局部视角具有较强的鲁棒性。同时,该方法能够明确地将摄像机参数作为独立的输入。体积三角形也被推广到了单眼图像,如果一个人的大致位置是已知的,则产生的结果会非常接近最优。

但是,由于其只支持预测场景中的一个个体,并且其体积三角剖分方法依赖于代数三角剖分的预测,该方法在某些方面也会受到限制。不过,研究者在论文中提供了解决这些局限性的方法。

网站:https://saic-violet.github.io/learnable-triangulation/

原文:https://arxiv.org/abs/1905.05754

其他爆款论文

人工智能社区如何开发出对人类有价值的系统:

https://arxiv.org/abs/1910.03515v1

Midi Miner发布,基于python计算音调张力并对不同的音轨进行分类:

https://arxiv.org/abs/1910.02049

深度学习检测虚假新闻:

https://arxiv.org/abs/1910.03496

Visual Domain Adaptation Challenge 2019,源代码和预训练模型:

https://arxiv.org/abs/1910.03548v1

根据公司的文案内容和方式预测消费者在Facebook上的参与度:

https://arxiv.org/abs/1909.09914

数据集

一种新的深度伪证数据集及检测算法:

http://www.cs.albany.edu/~lsw/celeb-deepfakeforensics.html

TabFact:基于表进行事实验证的大型数据集:

https://github.com/wenhuchen/Table-Fact-Checking

用于合成动作和时间推理的诊断数据集:

https://rohitgirdhar.github.io/CATER/

由真实场景视频组成的群组修复数据集:

https://arxiv.org/pdf/1910.02618v2.pdf

AI大事件

Alexa是怎么学习新语言的?

https://venturebeat.com/2019/10/11/amazon-explains-how-alexa-learns-new-languages/

Facebook发布Captum,基于深度学习框架PyTorch,解释神经网络如何做出决策

https://venturebeat.com/2019/10/10/facebooks-captum-brings-explainability-to-machine-learning/

超过40%的美国消费者希望他们的医生使用人工智能进行更好的诊断:

https://www.forbes.com/sites/gilpress/2019/10/10/ai-stats-news-45-of-us-consumers-want-their-physician-to-use-ai-for-better-diagnosis/#255774edc9d4

神经网络是如何透过墙壁看到我们在做什么的:

https://news.yahoo.com/neural-networks-see-were-doing-205300324.html

Pytorch 1.3发布,集成量化和并支持TPU:

https://venturebeat.com/2019/10/10/pytorch-1-3-comes-with-speed-gains-from-quantization-and-tpu-support/https://venturebeat.com/2019/10/10/pytorch-1-3-comes-with-speed-gains-from-quantization-and-tpu-support/

参与评论

请输入你的评论!
请在这里输入你的名字