您现在的位置是：首页 > 其他

当前栏目

DL之DNN优化技术：神经网络算法简介之数据训练优化【mini-batch技术+etc】

训练算法技术数据神经网络优化简介 DL

2023-09-14 09:04:47 时间

1、mini-batch技术

输出结果

实现代码

1、mini-batch技术

输出结果

实现代码

# coding: utf-8
#DL之mini-batch：理解深度学习算法中的优化技术【mini-batch技术+etc】

import numpy as np
from DIY_module.mnist import load_mnist


(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)
#设定参数one_hot_label=True，可以得到one-hot 表示（即仅正确解标签为1，其余为0 的数据结构）。

print(x_train.shape) # (60000, 784)
print(t_train.shape) # (60000, 10)


#从训练数据中随机抽取10笔数据，只需指定这些随机选出的索引，取出mini-batch，然后使用这个mini-batch 计算损失函数即可！
train_size = x_train.shape[0]
batch_size = 10
batch_mask = np.random.choice(train_size, batch_size)
#np.random.choice(60000, 10)会从0 到59999 之间随机选择10 个数字

x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]


#实现mini-batch版交叉熵误差
#同时处理单个数据和批量数据（数据作为batch集中输入）两种情况的函数。
def cross_entropy_error(y, t):
    if y.ndim == 1: #if判断y的维度为1 时，即求单个数据的交叉熵误差时，需要改变数据的形状
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size) #当输入为mini-batch 时，要用batch 的个数进行正规化，计算单个数据的平均交叉熵误差。
    batch_size = y.shape[0]
    return -np.sum(t * np.log(y + 1e-7)) / batch_size

#当监督数据是标签形式（非one-hot 表示，而是像“2”“7”这样的标签）时，交叉熵误差可通过如下代码实现。
#(1)、实现的要点是，由于one-hot表示中t为0的元素的交叉熵误差也为0，因此针对这些元素的计算可以忽略。即如果可以获得神经网络在正确解标签处的输出，就可以计算交叉熵误差。
def cross_entropy_error(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size  #微小值1e-7

#np.log(y[np.arange(batch_size),t]) #np.arange(batch_size)会生成一个从0到batch_size-1的数组
#y[np.arange(batch_size),t]  #会生成NumPy数组[y[0,2], y[1,7], y[2,0],y[3,9], y[4,4]])。

猜你喜欢

.NetWinform开发笔记(一)
瑞银、纳斯达克、巴克莱…14家头部金融机构联合发币，聚焦跨境交易
深入理解PostgreSQL的MVCC并发处理方式
APM性能分享观看有感
三星展示Flex Hybrid面板：可折叠＋可拉伸二合一
批处理文件中%~dp0是什么意思？
SQL 开发知识：SqlServer将查询结果转换为XML和JSON
windows 混合操作系统：CASTEp同时兼容Linux和Windows（casteplinux）
Linux网口性能测试：快速准确的网络实时体验（linux网口测试）
构建工具Gulp-lesson1
扬州人爱打麻将的背后，藏着这座城市沉浮的密码
vue+elementUI表单导致页面刷新
Linux串口驱动：轻松实现设备驱动接入（linux串口设备驱动）
一起针对国内企业OA系统精心策划的大规模钓鱼攻击事件
Sql Server临时表和游标的使用小结

相关主题

2023春训练7
蓝桥杯训练5
2023.15 人工智能训练师
深度学习模型训练

zl程序教程

当前栏目

DL之DNN优化技术：神经网络算法简介之数据训练优化【mini-batch技术+etc】

1、mini-batch技术

输出结果

实现代码

相关文章