您现在的位置是：首页 > 其他

当前栏目

Pytorch Loss Functions总结

2023-03-14 22:40:36 时间

Pytorch Loss Functions总结：

L1Loss

用于测量输入中每个元素之间的平均绝对误差（MAE）。

>>> loss = nn.L1Loss()
>>> input = torch.randn(3, 5, requires_grad=True)
>>> target = torch.randn(3, 5)
>>> output = loss(input, target)
>>> output.backward()

MSELoss

用于测量输入中每个元素之间的均方误差（L2 范数）

loss = nn.MSELoss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5)
output = loss(input, target)
output.backward()

CROSSENTROPYLOSS

此标准计算输入和目标之间的交叉熵损失

The input is expected to contain raw, unnormalized scores for each class. input has to be a Tensor of size ©(C) for unbatched input,(minibatc**h,C) or (minibatch, C, d_1, d_2, …, d_K)(minibatc**h,C,d1,d2,…,d**K) with K geq 1K≥1 for the K-dimensional case. The last being useful for higher dimension inputs, such as computing cross entropy loss per-pixel for 2D images.

# Example of target with class indices
loss = nn.CrossEntropyLoss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.empty(3, dtype=torch.long).random_(5)
output = loss(input, target)
output.backward()
# Example of target with class probabilities
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5).softmax(dim=1)
output = loss(input, target)
output.backward()

CTCLoss

CTC loss 理解_代码款款的博客-CSDN博客_ctc loss

CTC Loss原理 - 知乎 (zhihu.com)

计算连续（未分段）时间序列和目标序列之间的损失。CTCLoss 对输入与目标可能对齐的概率求和，生成一个相对于每个输入节点可微分的损失值。假定输入与目标的对齐方式为"多对一"

NLLLoss

详解torch.nn.NLLLOSS - 知乎 (zhihu.com)

log_softmax与softmax的区别在哪里？ - 知乎 (zhihu.com)

PoissonNLLLoss

目标泊松分布的负对数似然损失。

BCELOSS

loss函数之BCELoss - 简书 (jianshu.com)

MARGINRANKINGLOSS

loss函数之MarginRankingLoss - 简书 (jianshu.com)

HingeEmbeddingLoss

COSINEEMBEDDINGLOSS

loss函数之CosineEmbeddingLoss，HingeEmbeddingLoss_ltochange的博客-CSDN博客_余弦相似度损失函数

MultiLabelMarginLoss

loss函数之MultiMarginLoss, MultiLabelMarginLoss_ltochange的博客-CSDN博客

HuberLoss

回归损失函数：Huber Loss_Peanut_范的博客-CSDN博客_huber loss

SmoothL1Loss

创建一个条件，如果绝对元素误差低于 beta，则使用平方项，否则使用 L1 项。它对异常值的敏感度低于torch.nn.MSELoss，并且在某些情况下可以防止梯度爆炸（例如，参见Ross Girshick的论文Fast R-CNN）。

nn.xx 与 nn.functional .xx区别：

我们经常看到，二者有很多相同的loss函数，他们使用时有什么区别呢？

两者的相同之处：

nn.Xxx和nn.functional.xxx的实际功能是相同的，即nn.Conv2d和nn.functional.conv2d 都是进行卷积，nn.Dropout 和nn.functional.dropout都是进行dropout，。。。。。；

运行效率也是近乎相同。

nn.functional.xxx是函数接口，而nn.Xxx是nn.functional.xxx的类封装，并且**nn.Xxx都继承于一个共同祖先nn.Module。**这一点导致nn.Xxx除了具有nn.functional.xxx功能之外，内部附带了nn.Module相关的属性和方法，例如train(), eval(),load_state_dict, state_dict 等。

什么时候使用nn.functional.xxx，什么时候使用nn.Xxx?

这个问题依赖于你要解决你问题的复杂度和个人风格喜好。在nn.Xxx不能满足你的功能需求时，nn.functional.xxx是更佳的选择，因为nn.functional.xxx更加的灵活(更加接近底层），你可以在其基础上定义出自己想要的功能。

个人偏向于在能使用nn.Xxx情况下尽量使用，不行再换nn.functional.xxx ，感觉这样更能显示出网络的层次关系，也更加的纯粹（所有layer和model本身都是Module，一种和谐统一的感觉）。

猜你喜欢

java.sql.SQLException: java.lang.ClassCastException: java.math.BigInteger cannot be cast to java.lan
词法分析器java语言_词法分析器java版(java词法分析器)
python leveldb
推荐系统系列之排序任务的样本工程
java websocket客户端_Java系列：Java实现websocket客户端
python其他
java学习 helloworld_Java学习里程-----Java学习第二步 HelloWorld
一款直观易用的服务控制策略新替代方案
Fortinet SD-WAN集成亚马逊云科技Cloud-WAN实现云网融合
java 图形用户界面_Java学习笔记--Java图形用户界面
Python面试
JAVA classpath设置方式启动详解：java class名、java -jar
python函数
快速构建安全规范和架构完善的云上多账户运行环境
python快捷键
java 数据表之间转java对象，ResultSet转换成Java对象
java怎么反编译_Java入门教程-Java的反编译
SAP on Amazon云原生备份解决方案
Python 快捷键
python循环

zl程序教程

当前栏目

Pytorch Loss Functions总结