博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
YOLOv1, SSD
阅读量:4192 次
发布时间:2019-05-26

本文共 1818 字,大约阅读时间需要 6 分钟。

YOLOv1, SSD

今年四月份的时候,在一个研究院实习时学习了YOLOv1, SSD系列Object Detection框架,现在总结一下。关于R-CNN系列框架的总结在上一篇blog。

一. YOLOv1(You Only Look Once)

1.1 框架结构

yolo-1

  1. 首先将图片调整为 448×448 448 × 448 大小;
  2. 运行神经网络(其中包括选取region proposal以及target confidence和coordinate输出);
  3. nms(Non-max Suppression, 非极大值抑制), 用于后续bounding-box的选取(选取置信度高且不重复的方框).

yolo-2

  • 系统将输入图片分成 S×S S × S 个grid, 物体中心所在的grid负责检测这个物体. 每一个grid预测B个Bounding-box(边框)和Confidence Scores(置信度). 置信度的定义为:

Pr(Object)IOUtruthpred P r ( O b j e c t ) ∗ I O U p r e d t r u t h

  • 其中的IOU定义为:

iou

IOU(intersectionoverunion)= I O U ( i n t e r s e c t i o n o v e r u n i o n ) = 两 个 矩 形 的 交 集 面 积 两 个 矩 形 的 并 集 面 积

  • 每一个Bounding-box包括5个预测数值: 坐标x, y, w, h与置信度confidence.

  • 每一个grid同时预测C种种类的概率 Pr(Classi|Object) P r ( C l a s s i | O b j e c t ) .

  • 最后, 我们把一个grid是C种中的一种的概率和置信度相乘, 可以得到一个grid是特定种类物体的概率:

Pr(Classi|Object)Pr(Object)IOUtruthpred=Pr(Classi)IOUtruthpred P r ( C l a s s i | O b j e c t ) ∗ P r ( O b j e c t ) ∗ I O U p r e d t r u t h = P r ( C l a s s i ) ∗ I O U p r e d t r u t h

1.2 神经网络结构

yolo-net

1.3 缺点

YOLOv1 有两个主要明显的缺点:

  • 输入图像分割成 S×S S × S , S取7有点粗糙, 导致后续边框回归不太准确;
  • 每一个grid只预测一种物体, 不能预测一个grid有多种物体的情况.

针对这些, SSD和后续YOLOv2, YOLOv3有所改进.

二. SSD(Single Shot Multibox Detector)

2.1 框架结构

ssd

SSD只需要一张输入图片和ground truth框就可以开始训练. 可以把图片分成不同的scale(如 8×8 8 × 8 或者 4×4 4 × 4 ), 然后选取不同的aspect ratio(纵横比). 每一个box预测方块offset和每种类的置信度.

2.2 神经网络结构

ssd-net

2.2.1 YOLOv1与SSD网络的对比

SSD相比于YOLOv1, 在基本网络后面增加了好几层多尺度convolutional feature layer, 用于定位面积更小的物体, mAP提高了.

三. 总结

conclusion

YOLOv1, SSD和Faster R-CNN一样都是End-to-End网络了.

References

[1] Joseph Redmon, Santosh Divvalay, Ross Girshick, Ali Farhadi. (2016). You Only Look Once: Unified, Real-Time Object Detection.

[2] Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg. (2016). SSD: Single Shot MultiBox Detector.


  • 我的个人主页:
  • 我的CSDN博客:
  • 我的简书:
  • 我的GitHub:
你可能感兴趣的文章
二月手机好评排行榜公布:华为第一,小米10没上榜
查看>>
英特尔展示业界首个一体封装光学以太网交换机
查看>>
年存10W+的年轻人都是怎么攒钱的
查看>>
苹果确认部分iPad Air 3会出现永久性黑屏:可免费维修
查看>>
iPhone 11全球供应紧张:何时补货未知
查看>>
小米40W无线闪充今年商用:MIX 4首发?
查看>>
国产手机卖的越来越贵,是好是坏?
查看>>
拼多多联合三奇医卫等企业,每天上架1000万只平价口罩
查看>>
5000起步没商量!vivo NEX 3S 5G手机正式发布:骁龙865+无界瀑布屏加持
查看>>
二月1500-1999元性价比排行榜:前三都是魅族手机
查看>>
疫情下的“双11”,品牌逆势增长背后的数字化变革
查看>>
支付宝变色了!被绑架了你就眨眨眼?官方如此回应...
查看>>
罗永浩欲直播带货,京东说可以帮忙联系
查看>>
B站,正在变成下一个“公众号”?
查看>>
小米启动安心服务月 手机家电产品可免费清洁保养
查看>>
刘作虎:一加新品将全系支持 5G
查看>>
滴滴顺风车上线新功能,特殊时期便捷出行
查看>>
网易云推出“音街”APP 入局免费K歌市场
查看>>
首批马云援欧口罩运抵比利时eWTP枢纽
查看>>
微信小程序上线订单管理功能:实现订单管理、售后维权一体化
查看>>