斯坦福CS231n计算机视觉-神经网络训练细节(权值初始化、批量归一化、超参数优化)

权值初始化

使用tanh作为激活函数。

权值赋值方法:

方法一:使用小的随机数

最直观的想法,但这样会导致一个问题。

由于每一层的权值都非常小,所以每一层都好像衰减运算一样,随后会导致输出值均值为0,方差也为0。

那如果不进行0.01的衰减呢?

方法二:使用随机数

则会导致每一层都好像一个放大器一样,权值变得没有意义。

 

方法三:Xavier initialization

其实就是见了一个惩罚系数,让权值合理的分布。

具体如何实现有待研究。

如果激活函数换成ReLU呢?需要使用不同的初始化方法。

方法:He et al

具体没看懂,以后研究。

批量归一化

普通的标准化运算,没什么可说。

一般流程如下,会稍微降低运算速度(经验值最多30%)

超参数优化

一般超参数有如学习率,正则化,差量(?)等。

超参数的重要程度不同,很多时候超参数的优化是数据驱动,就是通过实验验证到底哪个更好。以学习率为例。

不同的学习率会导致不同的损失函数曲线,可以看到太大太小都不好。

有的时候初始化权值选择的不好会出现这样的损失函数曲线。

一般来说千分之一一般比较好。


http://www.niftyadmin.cn/n/957857.html

相关文章

百度指数和股票的相关性

文献: 普通投资者关注对股市交易的量价影响_基于百度指数的实证研究_张继德 投资者有限关注与股票收益_以百度指数作为关注度的一项实证研究_俞庆进 百度指数与股票市场表现相关性研究_杨帆 总结: 1、该问题属于有限关注理论,属于行为金…

v-for的用法

自己乱写的 <!DOCTYPE html> <html><head><title></title><body><script src"https://cdn.bootcss.com/vue/2.6.10/vue.min.js"></script><div id"app">< v-for: in fruits /></div>&…

斯坦福CS231n计算机视觉-神经网络参数更新机制

梯度下降法&#xff08;Gradient descent update&#xff0c;SGD&#xff09; 最后一行就是梯度下降的公式&#xff0c;只是简单的相乘。 存在问题&#xff1a; 梯度的不连续性会导致参数来回震荡&#xff0c;所以收敛的比较慢。 动量更新&#xff08;momentum update&#x…

mysql中局部变量_MySQL中变量的总结

本文对MySQL中局部变量、用户变量、系统变量的理解进行总结。 一、局部变量 局部变量由DECLARE语句声明&#xff1a; DECLARE var_name[,...] type [DEFAULT value] 默认值由DEFAULT子句来声明&#xff0c;默认值也可以是一个表达式。 局部变量的作用范围仅限在它被声明的…

v-on用法

自己写的错误的代码 <!DOCTYPE html> <html><head><title></title><body><script src"https://cdn.bootcss.com/vue/2.6.10/vue.min.js"></script><div id"app"><span><button click &qu…

斯坦福CS231n计算机视觉-神经网络的随机失活

具体操作&#xff1a;对于一个三层网络来说&#xff0c;就是每次每层计算输出&#xff0c;以一定概率乘以一个掩码0&#xff0c;一般为50%&#xff0c;从而让一半的输出无效化&#xff0c;对于被选中的节点&#xff0c;就相当于失活了。 那么为什么要随机失活&#xff1f; 解释…

ImportError: No module named ‘xlrd‘ 解决办法

1 import pandas as pd 2 3 data pd.read_excel(工作簿1.xls,sheetnameSheet1) 用pandas读取Excel文件时&#xff0c;会提示 ImportError: No module named xlrd 该错误是因为Excel需要单独的模块支持&#xff0c;所以需要安装xlrd模块 Python3可以在命令提示符中输入  …

自制vue:我是陈尼克代码修改

<template><img alt"Vue logo" src"./assets/logo.png" /><HelloWorld msg"Hello Vue 3 Vite" /> </template>App.vue 是组件 msg‘’是文字 img是图片 修改为 <template> 我是陈尼克 </template>可以&a…