Softmax函数及其导数
本文翻译自The Softmax function and its derivative
基础概念
Softmax函数的输入是N维的随机真值向量,输出是另一个N维的真值向量, 且值的范围是 (0,1) ,和为1.0。即映射: S(a)RN→RN : S(…
从caffe中我们看到softmax有下面这些参数
// Message that stores parameters used by SoftmaxLayer, SoftmaxWithLossLayer
message SoftmaxParameter {enum Engine {DEFAULT 0;CAFFE 1;CUDNN 2;}optional Engine engine 1 [default DEFAULT];// The axis along which t…
1.数学表示
这是传统的softmax: q i e x p ( z i ) ∑ j e x p ( z j ) q_i \frac{exp(z_i)}{\sum_jexp(z_j)} qi∑jexp(zj)exp(zi) 或者写: q i e x p ( z i ) / 1.0 ∑ j e x p ( z j / 1.0 ) q_i \frac{exp(z_i)/1.0}{\sum_jexp(z_j/…
softmax
1. 概念
softmax 的核心在于 soft,而 soft 有软的含义,与之相对的是 hard 硬。很多场景中需要我们找出数组所有元素中值最大的元素,是指上都是求的 hardmax。
softmax 定义: s o f t m a x ( z i ) e z i ∑ j 1 n …