Mask R-CNN源代码终于来了，还有它背后的物体检测平台

robin 发布于2019-04-25 18:23 / 2682人阅读

摘要：现在，官方版开源代码终于来了。同时发布的，是这项研究背后的一个基础平台。是的物体检测平台，今天宣布开源，它基于，用写成，这次开放的代码中就包含了的实现。说，将平台开源出来，是想要加速世界各地实验室的研究，推动物体检测的进展。

“等代码吧。”

从Mask R-CNN论文亮相至今的10个月里，关于它的讨论几乎都会以这句话收尾。

现在，官方版开源代码终于来了。同时发布的，是这项研究背后的一个基础平台：Detectron。

Detectron是Facebook的物体检测平台，今天宣布开源，它基于Caffe2，用Python写成，这次开放的代码中就包含了Mask R-CNN的实现。

除此之外，Detectron还包含了ICCV 2017较佳学生论文RetinaNet，Ross Girshick（RBG）此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的实现。

Detectron的基干（backbone）网络架构包括ResNeXt{50,101,152}、ResNet{50,101,152}、FPN和VGG16。

同时，Facebook还发布了70多种ImageNet-1k预训练模型的性能基准，包括用用1、2块GPU时，上述各种基干架构和检测算法相结合做区域建议、遮罩检测以及人体关键点检测的训练时间、推理时间等。

要使用Detectron，你需要先配置英伟达GPU（是的，它还不支持CPU）、Linux系统和Python2，还要安装Caffe2和COCO API。然后，三步装上Detectron：

Clone Detectron：

# DETECTRON=/path/to/clone/detectron

git clone https://github.com/facebookresearch/detectron $DETECTRON

设置Python模块：

cd $DETECTRON/lib && make

检查Detectron的测试通过：

python2 $DETECTRON/tests/test_spatial_narrow_as_op.py

这样，就足够用预训练模型做推理了。

如果要用Detectron来训练自己的检测模型，就需要先确保能通过符号链接lib/datasets/data找到数据集，然后用CMake创建定制的运算符库：

cd $DETECTRON/lib && make ops

并检查这些运算符的测试通过：

python2 $DETECTRON/tests/test_zero_even_op.py

Facebook还贴心地写了份上手教程，教你用预训练的Mask R-CNN来做物体检测。

如果要在本地图像上运行，只需要使用infer_simple.py工具，运行：

python2 tools/infer_simple.py

--cfg configs/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml

--output-dir /tmp/detectron-visualizations

--image-ext jpg

--wts https://s3-us-west-2.amazonaws.com/detectron/35861858/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml.02_32_51.SgT4y1cO/output/train/coco_2014_train:coco_2014_valminusminival/generalized_rcnn/model_final.pkl

demo

就能得到如下图所示的输出。

如果要在COCO数据集上做推理，需要运行：

python2 tools/test_net.py

--cfg configs/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml

TEST.WEIGHTS https://s3-us-west-2.amazonaws.com/detectron/35861858/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml.02_32_51.SgT4y1cO/output/train/coco_2014_train:coco_2014_valminusminival/generalized_rcnn/model_final.pkl

NUM_GPUS 1

上面这个例子，用了端到端预训练的Mask R-CNN，在一块GPU上运行。如果要使用多个GPU，需要在第二行之后添加 —multi-gpu-testing 并更改最后的NUM_GPUS数量。

截至量子位发稿，Detectron在GitHub上放出7小时，已经收获738颗星标、101次Fork。