softmax和sigmoid的区别

2024-03-07 04:36

文章标签 区别 sigmoid softmax

本文主要是介绍softmax和sigmoid的区别，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

sigmoid

公式： $\frac{1}{1 + e^{-x}}$

函数曲线如下：

导数公式： $f(x)\prime = \frac{ e^{-x}}{(1 + e^{-x})^2} = f(x)(1-f(x))$

导数曲线如下：

sigmoid代码：

import torch
import torch.nn.functional as F// sigmoid函数
x = torch.tensor([1.0, 2.0, 3.0])
// y = 1 / (1 + torch.exp(-x))	
y = torch.sigmoid(x)
print(f"sigmoid result: {y}")
print(f"sigmoid derivative: {y * (1 - y)}")

softmax

公式：
$softmax(z_i) = \frac{z_i}{\sum_{j=1}^n e^{z_j}}$
指数函数曲线： $y= e^{x}$

引入指数形式的优点：
指数函数曲线呈现递增趋势，斜率逐渐增大，在 x 轴上一个很小的变化可以导致 y 轴上很大的变化。
引入指数形式的缺点：
当 z值非常大时，计算得到的数值会变得非常大，可能会溢出。通常针对数值溢出的方法，是将每一个输出值减去输出值中的最大值。

导数公式：

softmax代码：

import torch
import torch.nn.functional as Fdef softmax(x):"""Compute the softmax of vector x."""exps = np.exp(x)return exps / np.sum(exps) // softmax函数
x = torch.tensor([1.0, 2.0, 3.0])
y = F.softmax(x, dim=0)
print(f"softmax result: {y}")
print(f"softmax derivative: {torch.diag(y) - torch.outer(y, y)}")