TensorFlow模型保存和提取方法
TensorFlow模型保存和提取方法
一、TensorFlow模型保存和提取方法
1. TensorFlow通过tf.train.Saver类实现神经网络模型的保存和提取。tf.train.Saver对象saver的save方法将TensorFlow模型保存到指定路径中,saver.save(sess,"Model/model.ckpt"),实际在这个文件目录下会生成4个人文件:
checkpoint文件保存了一个录下多有的模型文件列表,model.ckpt.meta保存了TensorFlow计算图的结构信息,model.ckpt保存每个变量的取值,此处文件名的写入方式会因不同参数的设置而不同,但加载restore时的文件路径名是以checkpoint文件中的“model_checkpoint_path”值决定的。
2. 加载这个已保存的TensorFlow模型的方法是saver.restore(sess,"./Model/model.ckpt"),加载模型的代码中也要定义TensorFlow计算图上的所有运算并声明一个tf.train.Saver类,不同的是加载模型时不需要进行变量的初始化,而是将变量的取值通过保存的模型加载进来,注意加载路径的写法。若不希望重复定义计算图上的运算,可直接加载已经持久化的图,saver =tf.train.import_meta_graph("Model/model.ckpt.meta")。
3.tf.train.Saver类也支持在保存和加载时给变量重命名,声明Saver类对象的时候使用一个字典dict重命名变量即可,{"已保存的变量的名称name": 重命名变量名},saver = tf.train.Saver({"v1":u1, "v2": u2})即原来名称name为v1的变量现在加载到变量u1(名称name为other-v1)中。
4. 上一条做的目的之一就是方便使用变量的滑动平均值。如果在加载模型时直接将影子变量映射到变量自身,则在使用训练好的模型时就不需要再调用函数来获取变量的滑动平均值了。载入时,声明Saver类对象时通过一个字典将滑动平均值直接加载到新的变量中,saver = tf.train.Saver({"v/ExponentialMovingAverage": v}),另通过tf.train.ExponentialMovingAverage的variables_to_restore()函数获取变量重命名字典。
此外,通过convert_variables_to_constants函数将计算图中的变量及其取值通过常量的方式保存于一个文件中。
二、TensorFlow程序实现
- # 本文件程序为配合教材及学习进度渐进进行,请按照注释分段执行
- # 执行时要注意IDE的当前工作过路径,最好每段重启控制器一次,输出结果更准确
- # Part1: 通过tf.train.Saver类实现保存和载入神经网络模型
- # 执行本段程序时注意当前的工作路径
- import tensorflow as tf
- v1 = tf.Variable(tf.constant(1.0, shape=[1]), name="v1")
- v2 = tf.Variable(tf.constant(2.0, shape=[1]), name="v2")
- result = v1 + v2
- saver = tf.train.Saver()
- with tf.Session() as sess:
- sess.run(tf.global_variables_initializer())
- saver.save(sess, "Model/model.ckpt")
- # Part2: 加载TensorFlow模型的方法
- import tensorflow as tf
- v1 = tf.Variable(tf.constant(1.0, shape=[1]), name="v1")
- v2 = tf.Variable(tf.constant(2.0, shape=[1]), name="v2")
- result = v1 + v2
- saver = tf.train.Saver()
- with tf.Session() as sess:
- saver.restore(sess, "./Model/model.ckpt") # 注意此处路径前添加"./"
- print(sess.run(result)) # [ 3.]
- # Part3: 若不希望重复定义计算图上的运算,可直接加载已经持久化的图
- import tensorflow as tf
- saver = tf.train.import_meta_graph("Model/model.ckpt.meta")
- with tf.Session() as sess:
- saver.restore(sess, "./Model/model.ckpt") # 注意路径写法
- print(sess.run(tf.get_default_graph().get_tensor_by_name("add:0"))) # [ 3.]
- # Part4: tf.train.Saver类也支持在保存和加载时给变量重命名
- import tensorflow as tf
- # 声明的变量名称name与已保存的模型中的变量名称name不一致
- u1 = tf.Variable(tf.constant(1.0, shape=[1]), name="other-v1")
- u2 = tf.Variable(tf.constant(2.0, shape=[1]), name="other-v2")
- result = u1 + u2
- # 若直接生命Saver类对象,会报错变量找不到
- # 使用一个字典dict重命名变量即可,{"已保存的变量的名称name": 重命名变量名}
- # 原来名称name为v1的变量现在加载到变量u1(名称name为other-v1)中
- saver = tf.train.Saver({"v1": u1, "v2": u2})
- with tf.Session() as sess:
- saver.restore(sess, "./Model/model.ckpt")
- print(sess.run(result)) # [ 3.]
- # Part5: 保存滑动平均模型
- import tensorflow as tf
- v = tf.Variable(0, dtype=tf.float32, name="v")
- for variables in tf.global_variables():
- print(variables.name) # v:0
- ema = tf.train.ExponentialMovingAverage(0.99)
- maintain_averages_op = ema.apply(tf.global_variables())
- for variables in tf.global_variables():
- print(variables.name) # v:0
- # v/ExponentialMovingAverage:0
- saver = tf.train.Saver()
- with tf.Session() as sess:
- sess.run(tf.global_variables_initializer())
- sess.run(tf.assign(v, 10))
- sess.run(maintain_averages_op)
- saver.save(sess, "Model/model_ema.ckpt")
- print(sess.run([v, ema.average(v)])) # [10.0, 0.099999905]
- # Part6: 通过变量重命名直接读取变量的滑动平均值
- import tensorflow as tf
- v = tf.Variable(0, dtype=tf.float32, name="v")
- saver = tf.train.Saver({"v/ExponentialMovingAverage": v})
- with tf.Session() as sess:
- saver.restore(sess, "./Model/model_ema.ckpt")
- print(sess.run(v)) # 0.0999999
- # Part7: 通过tf.train.ExponentialMovingAverage的variables_to_restore()函数获取变量重命名字典
- import tensorflow as tf
- v = tf.Variable(0, dtype=tf.float32, name="v")
- # 注意此处的变量名称name一定要与已保存的变量名称一致
- ema = tf.train.ExponentialMovingAverage(0.99)
- print(ema.variables_to_restore())
- # {'v/ExponentialMovingAverage': <tf.Variable 'v:0' shape=() dtype=float32_ref>}
- # 此处的v取自上面变量v的名称name="v"
- saver = tf.train.Saver(ema.variables_to_restore())
- with tf.Session() as sess:
- saver.restore(sess, "./Model/model_ema.ckpt")
- print(sess.run(v)) # 0.0999999
- # Part8: 通过convert_variables_to_constants函数将计算图中的变量及其取值通过常量的方式保存于一个文件中
- import tensorflow as tf
- from tensorflow.python.framework import graph_util
- v1 = tf.Variable(tf.constant(1.0, shape=[1]), name="v1")
- v2 = tf.Variable(tf.constant(2.0, shape=[1]), name="v2")
- result = v1 + v2
- with tf.Session() as sess:
- sess.run(tf.global_variables_initializer())
- # 导出当前计算图的GraphDef部分,即从输入层到输出层的计算过程部分
- graph_def = tf.get_default_graph().as_graph_def()
- output_graph_def = graph_util.convert_variables_to_constants(sess,
- graph_def, ['add'])
- with tf.gfile.GFile("Model/combined_model.pb", 'wb') as f:
- f.write(output_graph_def.SerializeToString())
- # Part9: 载入包含变量及其取值的模型
- import tensorflow as tf
- from tensorflow.python.platform import gfile
- with tf.Session() as sess:
- model_filename = "Model/combined_model.pb"
- with gfile.FastGFile(model_filename, 'rb') as f:
- graph_def = tf.GraphDef()
- graph_def.ParseFromString(f.read())
- result = tf.import_graph_def(graph_def, return_elements=["add:0"])
- print(sess.run(result)) # [array([ 3.], dtype=float32)]
相关文章
- [原创]另类调用 printf 完成任务的方法
- Python中转换角度为弧度的radians()方法
- django中对model模型添加方法
- Linux - 快速进入目录的方法
- Atitit 数据库 负载均衡 方法总结 目录 1. 对称模型负载均衡 vs 非对称模型2 1.1. 业务分离法2 1.2. App + db分布式分离法2 2. 负载均衡算法2 2.1.
- ML之XGBoost:XGBoost算法模型(相关配图)的简介(XGBoost并行处理)、关键思路、代码实现(目标函数/评价函数)、安装、使用方法、案例应用之详细攻略
- CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊、主要研究方向)、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略
- 经典方法实现投资组合优化【Matlab实现】
- C++调用Go方法的字符串传递问题及解决方案
- 带你了解TensorFlow pb模型常用处理方法
- 谈谈有什么方法可以快捷实现多场景下的线程安全
- 不为人知的稠密特征加入CTR预估模型的方法
- qtcpsocket调用write和read函数写数据乱码问题解决方法
- C++ 读取文件所有内容的方法
- Oops快速定位代码行方法
- as3.0 interface接口使用方法
- 利用神经网络进行网络流量识别——特征提取的方法是(1)直接原始报文提取前24字节,24个报文组成596像素图像CNN识别;或者直接去掉header后payload的前1024字节(2)传输报文的大小分布特征;也有加入时序结合LSTM后的CNN综合模型
- ML之ME/LF:机器学习之风控业务中常用模型监控指标CSI(特征稳定性指标)的简介、使用方法、案例应用之详细攻略