详述目标检测最常用的三个模型:Faster R-CNN、SSD和YOLO
yolov3论文及翻译
目标检测最新总结与前沿展望
You Only Look Once: Unified, Real-Time Object Detection(翻译)
卷积神经网络入门:卷积、池化与激活函数
5、主要困难
參考 https://zhuanlan.zhihu.com/p/36734511
• 小行人难以识别:一般行人高度像素小于图像分辨率的十分之一,原图还需压缩至输入图像的大小,使得行人更小,检测率下降较大
• 遮挡行人难以识别:遮挡35%以上,检测率下降较大
• 非正常姿态行人难以识别:弯腰的,蹲着的,坐着的,躺着的
• 假行人容易误检:如人形建筑、人物照片、人物海报和人物广告等
• 晚上行人难以识别:晚上图像一般为灰度图,光线较暗,加了红外补光,主要是训练样本较少,导致检测率不高
• 密集行人难以识别:多个行人之间相互遮挡,挨的很紧,难以一个个单独识别区分
• 解决方法:
◦ 从模型方面:如修改loss函数,网络结构,增加常识信息等
◦ 从数据方面:增加相应的训练数据,但应当考虑训练样本的概率分布与实际应用场景一致
6 yolo论文阅读总结
fasterRCNN阅读总结