365bet官网登录

Column SimpleDet:简单通用的对象识别和对象识别框

2019-02-18 365bet体育电视直播
标题:列| SimpleDet:客观检测和对象识别的简单通用框架
机器中心列。
作者:Yannai
今天我们将介绍我们最新的开源项目SimpleDet。
项目管理:https://github.com/TuSimple/simpledet SimpleDet是简单的物体检测和物体识别一个通用框架,整个框架是基于MXNet API的本机在这篇文章中,不仅要解释这个新的框架,执行的特点我会解释原因。这是什么以及我们的初衷
为什么你需要再次锤击
现在的问题是,实际上是被问了很多次你开始这个项目罗斯将在2三年RCNN和快速RCNN.De.的参与每年ImageNet比赛前一个问题事实上,我起初很惊讶。特别是如果它基本上是一种非常简单的方式,并且不可能获得良好的排名,我为什么要这样做呢后来,我有机会抓住开明并提出这个问题。凯明给我的答案是,罗斯真的不关心这个排名。罗斯利用这个机会,并有兴趣为每个人推广他最好的锤子。
事实上,与所思所想的人很多,该模型是相反的,这将是优雅的,结果是好作品,因为高简单可靠,文件的越来越多是用这种方法作为基准我想我不介意。事实上,在我开始阅读博士学位后,我希望能够用基线进行锤击。参加MXNet项目,但开始从许多人,包括使用域的适应五大行的代码评审质疑,时间已经证明这些作品的价值。
有很多的代码和开源框架,而点仍有有几个冠军头衔,以现有的开源框架来改善。有几个原因,这是不容易重现实际SOTA的结果,但是,在另一方面,在开源代码可能有不错的表现。很难扩展和维护(如SNIP和SNIPER)。极低的基准线提高,而工作中,也可作为一个性能得到了改进,以提供更好的锤子和对更好的基准是困难的情况下识别问题解释方法的有效性我们已经构建了SimpleDet。
如果你问什么样的检测,需要识别的目的的框架是同学,性能好,速度快,可以覆盖这三个关键字的需求的99%。我们来看看SimpleDet。与其他开源框架相比的优势和差异方面。
什么是好表现
最值得一提的算法值得SimpleDet之一,是我们的TridentNet(我不知道TridentNet同学已经收到了欢迎:Naiyan王:TridentNet:应对目标探测的变化在中尺度一种新的方法)公布了在每个您要在上下文的模型和训练码,而这也是最高的算法称为COCO在一个单一的模式,除了干净的模型(TESTDEV地图= 42.7设定)(还提供了testdev mAP = 48.4)。同步BN,多尺度训练/测试,可变形CONV,如光滑NMS,可以在所有的大包的使用。这些是用于各种角色和游戏的方法,但是直接打开所有方法仍然很困难。
在SimpleDet,有可能通过减小SOTA阈值是重复,以增加整个光谱的参考电平,它提供了一个解决方案,准备使用的此外,为了便于开发,如面膜(更快)传统的算法和模型也可用。RCNN,FPN,RetinaNet,Cascade RCNN等该算法的结果已经过验证,可以实现本文档和现有开源代码的结果。它会积极主动地做出贡献。
什么是快速的 首先,关于速度问题,我们的独特功能是FP16训练。FP16也实现了内存的一半视频的速度,不仅节省了,一个最新沃尔和图灵系列GPU支持TensorCore以上的速度。接下来,对于拥有不同资源的学生,对速度的需求是不同的,所以我们想到了3个用户。:
初级用户:这些用户,以限制或资源的实验室只是个人的利益,不到4 GPU可以不买,它是一个重中之重复制尽可能多的资源成为可能。在这种安排下,SimpleDet提供就地ABN[1]是已经在除了极限状态被训练单个卡的批量大小的组合通过MXNet自己一直提供memonger功能(将公布)。它可以达到8到16。一些速度将会丢失,但常规8张牌的训练手数可以通过2到4张卡来实现。
一般用户:这些用户必须占绝大多数,就能独占8卡片机训练这些用户对速度的要求很高,根据用户对速度的影响您可以禁用给定的memonger组件。要获得更快的训练速度。 本地用户:8卡片机的多就在眼前,我们希望得到最出的机器,以快速重复的模型,在这个部分,使用MXNet的优异的分散设计和英仙座通信框架我会的。如下图所示,优化的阿里云可以通过4台机器和32张卡实现线性加速(不需要旧资源)。对于玩游戏并对模型重复速度有很高要求的应用程序来说,这绝对是一个很好的帮助。
使用SimpleDet,我希望每种类型的用户都能获得您需要的东西,您可以找到适合您资源的最佳配置并最大化输出。
什么是易于使用
每个用户,但它会在除了由(难产品经理......),扩展方便实用的性能和速度的定义之前的情况,以便调整在两个重要元素做出我在想。对于一些共同的需求。中心思想是尽可能地抽象和分离核心的操作,尽可能地重用不同的算法,并在不改变的情况下扩展它。由于这些常见的更改,用户无需更改核心代码即可完成优化。例如,检测算法的变化可以找到更多的逻辑。数据加载程序之前,虽然过程很复杂,实施降低,显著装载机的效率是不恰当的,成为整个瓶颈培训,GPUUtilization降低。在SimpleDet中,我们提取了常见的多进程加载框架并提取了常用操作。扩展新的后续算法将提升基于这些通用工具的简单性和效率欢迎更多设计直接阅读源代码,我们也更快速地使用RCNN代码结构我们提供分析。供您参考TridentNet。
这是SimpleDet的简要介绍。它还可以检测错误,提供新的算法和功能,并将SimpleDet联合用作目标检测和对象识别的测试平台。 开源项目只是正在进行的深度学习项目的冰山一角。深度学习只是我们无人驾驶卡车技术的一部分。图森有很多有趣且具有挑战性的项目......你想要自己的代码以80公里/小时的速度运行一辆40吨的卡车吗你试图控制约20米长的赛道。欢迎加入图森的未来,使用您自己的代码,将在起重机下停留,精度为5厘米!
[1]RotaBulò,Samuel,Lorenzo Porzi和Peter Kontschieder。“在现场启动了批量工作会议,以使用优化的内存来训练DNN。”IEEE计算机视觉和模式识别会议纪要。2018
我知道列地址:https:// zhuanlan.zhihu.com/p/559720555
本文是机器专栏的核心,请联系作者获取授权。
编辑负责人: