论文资料

news/2024/7/24 6:51:20

详述目标检测最常用的三个模型:Faster R-CNN、SSD和YOLO

yolov3论文及翻译

目标检测最新总结与前沿展望

You Only Look Once: Unified, Real-Time Object Detection(翻译)

卷积神经网络入门:卷积、池化与激活函数

5、主要困难

參考 https://zhuanlan.zhihu.com/p/36734511

• 小行人难以识别:一般行人高度像素小于图像分辨率的十分之一,原图还需压缩至输入图像的大小,使得行人更小,检测率下降较大

• 遮挡行人难以识别:遮挡35%以上,检测率下降较大

• 非正常姿态行人难以识别:弯腰的,蹲着的,坐着的,躺着的

• 假行人容易误检:如人形建筑、人物照片、人物海报和人物广告等

• 晚上行人难以识别:晚上图像一般为灰度图,光线较暗,加了红外补光,主要是训练样本较少,导致检测率不高

• 密集行人难以识别:多个行人之间相互遮挡,挨的很紧,难以一个个单独识别区分

• 解决方法:

◦ 从模型方面:如修改loss函数,网络结构,增加常识信息等

◦ 从数据方面:增加相应的训练数据,但应当考虑训练样本的概率分布与实际应用场景一致

6 yolo论文阅读总结

fasterRCNN阅读总结


http://www.niftyadmin.cn/n/824717.html

相关文章

Linux企业级项目实践之网络爬虫(4)——主程序流程

当我们设计好程序框架之后就要开始实现它了。第一步当然是要实现主程序的流程框架。之后我们逐渐填充每个流程的细节和其需要调用的模块。主程序的流程如下:1、 解析命令行参数,并根据参数跳转到相应的处理分支2、 解析配置文件3、 载入处理模块4、 …

yolov3使用问题总结

需要修改的地方 https://blog.csdn.net/weixin_36474809/article/category/7726484/5? 1.yolov3-voc.cfg文件 filter、class的值,训练或者测试需要修改注释 2.修改voc-label.py 生成训练集的路径文件 3.修改voc.data中的路径文件路径以及.names文件 yolo性能…

java基础类型包装类与自动打包解包

一基础类型包装类 基础数据类型存放在内存的栈区域,可以通过包装类将基础数据类型转换为引用数据类型,即存储在堆与栈中。 基础数据类型一共有8种,相对应的包装类也有8种。分别是Byte,Short,Integer,Long&a…

Linux企业级项目实践之网络爬虫(20)——扩展成为规则插件模式

为了方便我们爬虫功能的扩展,最好使用插件机制。使用插件技术能够在分析、设计、开发、项目计划、协作生产和产品扩展等很多方面带来好处:(1)结构清晰、易于理解。由于借鉴了硬件总线的结构,而且各个插件之间是相互独立的&#xf…

Win10 下的Linux子系统

一、打开控制面板中的程序下的启动或关闭Windows功能 二、在应用商店中搜索WSL安装Ubuntu 三、移动Win10中linux子系统的位置 下载lxrunoffline并添加环境变量:https://github.com/DDoSolitary/LxRunOffline/releases 查看已安装的子系统版本 lxrunoffline list …

机器学习总纲

计算机视觉笔记及资料整理(含图像分割、目标检测小方向学习) 神经网络综述及发展历史 神经网络发展史

Unity3D研究院之脚本生成Android Google Project

一般安卓自动化打包直接会生成个APK出来,但是我不想生成APK,我想生成Eclipse项目。 然后在自动化完成后面的打包工作。 1234567891011using UnityEngine;using System.Collections;using UnityEditor;public class NewBehaviourScript : Editor {[MenuIt…

CUDA+CUDNN驱动及软件安装(Ubuntu)

参考链接: Ubuntu16.04下安装cuda和cudnn的三种方法(亲测全部有效) Ubuntu16.04LTS安装Nvidia显卡驱动cuda8.0cudnn 一、安装CUDA 1.下载cuda 2.禁用ubuntu自带的nouveau 终端中运行:$ lsmod | grep nouveau,如…