您现在的位置是：首页 > 其他

当前栏目

【前沿】TensorFlow Pytorch Keras代码实现深度学习大神Hinton NIPS2017 Capsule论文

论文学习 PyTorch 代码实现深度 Tensorflow Keras

2023-09-27 14:26:36 时间

10月26日，深度学习元老Hinton的NIPS2017 Capsule论文《Dynamic Routing Between Capsules》终于在arxiv上发表。今天相关关于这篇论文的TensorFlow\Pytorch\Keras实现相继开源出来，让我们来看下。

719e11ff6aba2d68a205b6f28c68dd180226a7b4

论文地址：https://arxiv.org/pdf/1710.09829.pdf

Capsule 是一组神经元，其活动向量（activity vector）表示特定实体类型的实例化参数，如对象或对象部分。我们使用活动向量的长度表征实体存在的概率，向量方向表示实例化参数。同一水平的活跃 capsule 通过变换矩阵对更高级别的 capsule 的实例化参数进行预测。当多个预测相同时，更高级别的 capsule 变得活跃。我们展示了判别式训练的多层 capsule 系统在 MNIST 数据集上达到了最好的性能效果，比识别高度重叠数字的卷积网络的性能优越很多。为了达到这些结果，我们使用迭代的路由协议机制：较低级别的 capsule 偏向于将输出发送至高级别的 capsule，有了来自低级别 capsule 的预测，高级别 capsule 的活动向量具备较大的标量积。

CapsNet-PyTorch

python依赖包 Python 3
PyTorch
TorchVision
TorchNet
Visdom

BATCH_SIZE = 100NUM_CLASSES = 10NUM_EPOCHS = 30NUM_ROUTING_ITERATIONS = 3

Step 2 开始训练. 如果本地文件夹中没有MNIST数据集，将运行脚本自动下载到本地. 确保 PyTorch可视化工具Visdom正在运行。

$ sudo python3 -m visdom.server python3 capsule_network.py

经过30个epoche的训练手写体数字的识别率达到99.48%. 从下图的训练进度和损失图的趋势来看，这一识别率可以被进一步的提高。

9f94db0c9075c534d2b438d8966d95eb09dcef1f

采用了PyTorch中默认的Adam梯度优化参数并没有用到动态学习率的调整。 batch size 使用100个样本的时候，在雷蛇GTX 1050 GPU上每个Epochs 用时3分钟。

扩展到除MNIST以外的其他数据集。
Credits

主要借鉴了以下两个 TensorFlow 和 Keras 的实现:

Keras implementation by @XifengGuo
TensorFlow implementation by @naturomics

Many thanks to @InnerPeace-Wu for a discussion on the dynamic routing procedure outlined in the paper.

CapsNet-Tensorflow

Python依赖包 Python
NumPy
Tensorflow (Im using 1.3.0, not yet tested for older version)
tqdm (for displaying training progress info) scipy (for saving image)

$ git clone https://github.com/naturomics/CapsNet-Tensorflow.git

$ cd CapsNet-Tensorflow

第二步下载MNIST数据集(http://yann.lecun.com/exdb/mnist/), 移动并解压到data/mnist 文件夹（当你用复制wget 命令到你的终端是注意渠道花括号里的反斜杠）

$ mkdir -p data/mnist

$ wget -c -P data/mnist http://yann.lecun.com/exdb/mnist/{train-images-idx3-ubyte.gz,train-labels-idx1-ubyte.gz,t10k-images-idx3-ubyte.gz,t10k-labels-idx1-ubyte.gz}

$ gunzip data/mnist/*.gz

第三步开始训练:

$ pip install tqdm # install it if you havent installed yet

$ python train.py

tqdm包并不是必须的，只是为了可视化训练过程。如果你不想要在train.py中将循环for in step ... 改成 ``for step in range(num_batch)就行了。

$ python eval.py --is_training False

错误的运行结果(Details in Issues #8):

training loss
d39afb6441fad222de027dafb71542e163ccc50e

6ff053759b0d6c567fae0fd2cf7417cd859268b4

test acc

b73d9cb682dbd62a620309e59815252be2a8854a
f8fec5951f2d31b9db1776a9f85d76caf0b51b56

4d1af1011ad3d14b2186bd503c27c18394fb5927

Results after fixing Issues #8:

关于capsule的一点见解

一种新的神经单元(输入向量输出向量，而不是标量)
常规算法类似于Attention机制
总之是一项很有潜力的工作，有很多工作可以在之上开展

一篇新的投稿在ICLR2018上的后续论文(https://openreview.net/pdf?id=HJWLfGWRb) about capsules(submitted to ICLR 2018)

第二步用 git命令下载代码到本地.

$ git clone https://github.com/xifengguo/CapsNet-Keras.git

$ cd CapsNet-Keras

第三步训练:

$ python capsulenet.py

一次迭代训练(default 3).

$ python capsulenet.py --num_routing 1

其他参数包括想 batch_size, epochs, lam_recon, shift_fraction, save_dir 可以以同样的方式使用。具体可以参考 capsulenet.py

假设你已经有了用上面命令训练好的模型，训练模型将被保存在 result/trained_model.h5. 现在只需要使用下面的命令来得到测试结果。

$ python capsulenet.py --is_training 0 --weights result/trained_model.h5

将会输出测试结果并显示出重构后的图片。测试数据使用的和验证集一样，同样也可以很方便的在新数据上验证，至于要按照你的需要修改下代码就行了。

如果你的电脑没有GPU来训练模型，你可以从https://pan.baidu.com/s/1hsF2bvY下载预先训练好的训练模型

主要结果
运行 python capsulenet.py: epoch=1 代表训练一个epoch 后的结果在保存的日志文件中，epoch从0开始。

66cf69a3316550a23f64ca342a079cb31cf07342

损失和准确度：

669b7258294085504f8de6d70bf0e809e35c7005

一次常规迭代后的结果

运行 python CapsNet.py --num_routing 1

85eefd6b8ec6475ea939419d990ced0f3c063ae8

测试结果每个 epoch 在单卡GTX 1070 GPU上大概需要110s 注释: 训练任然是欠拟合的，欢迎在你自己的机器上验证。学习率decay还没有经过调试, 我只是试了一次，你可以接续微调。

运行 python capsulenet.py --is_training 0 --weights result/trained_model.h5

模型结构: df996811608d0f97086ea1cf59161dd60392293c

04c4167084109477ad7600a8448ed141dea7b8e5

其他实现代码

Kaggle (this version as self-contained notebook):
MNIST Dataset running on the standard MNIST and predicting for test data
MNIST Fashion running on the more challenging Fashion images.

参考网址链接：

https://github.com/gram-ai/capsule-networks

https://github.com/naturomics/CapsNet-Tensorflow

https://github.com/XifengGuo/CapsNet-Keras

原文发布时间为：2017-11-5

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”微信公众号

原文链接：【前沿】TensorFlow Pytorch Keras代码实现深度学习大神Hinton NIPS2017 Capsule论文

金玉良缘易配而木石前盟难得|M1 Mac os(Apple Silicon)天生一对Python3开发环境搭建(集成深度学习框架Tensorflow/Pytorch) 笔者投入M1的怀抱已经有一段时间了，俗话说得好，但闻新人笑，不见旧人哭，Intel mac早已被束之高阁，而M1 mac已经不能用真香来形容了，简直就是“香透满堂金玉彩，扇遮半面桃花开！”，轻抚M1 mac那滑若柔荑的秒控键盘，别说996了，就是007，我们也能安之若素，也可以笑慰平生。好了，日常吹M1的环节结束，正所谓剑虽利,不厉不断，材虽美，不学不高。本次我们尝试在M1 Mac os 中搭建Python3的开发环境。
人工智能不过尔尔，基于Python3深度学习库Keras/TensorFlow打造属于自己的聊天机器人(ChatRobot) 聊天机器人(ChatRobot)的概念我们并不陌生，也许你曾经在百无聊赖之下和Siri打情骂俏过，亦或是闲暇之余与小爱同学谈笑风生，无论如何，我们都得承认，人工智能已经深入了我们的生活。目前市面上提供三方api的机器人不胜枚举：微软小冰、图灵机器人、腾讯闲聊、青云客机器人等等，只要我们想，就随时可以在app端或者web应用上进行接入。但是，这些应用的底层到底如何实现的？在没有网络接入的情况下，我们能不能像美剧[《西部世界》(Westworld)](https://movie.douban.com/subject/2338055/)里面描绘的那样，机器人只需要存储在本地的“心智球”就可以和人类沟

猜你喜欢

ELK-安装kibana
easyexcel 2.2.6 新版本以列表的形式读取 Excel
NLP-信息抽取-NER-2019：TENER【TENER: Adapting Transformer Encoder for Named Entity Recognition】
mongodb 备份还原
小米手机藏后门可远程安装任意APP？真相如此惊悚吗？
https://maven.google.com 连接不上的解决办法(转）
Effective Java 第三版——26. 不要使用原始类型
图片处理之 ——— Bitmap（常见方法及图片圆角实现）
Windows server 自带的 .net版本
使用open live writer客户端写博客
SEO编辑必看：撰写搜索引擎喜爱的标题
测试团队绩效考核指标
数据可视化的7个好处
管子部件查看程序 - PipeCatalog
Hibernate中出现异常解决org.hibernate.service.spi.ServiceException: Unable to create requested service
SharePoint 2013 配置InfoPath 列表表单
比较牛逼的网卡介绍
Java finally语句到底是在return之前还是之后执行？

相关主题

学习学习
论文查重
写论文的笔记
[机器学习] 集成学习
机器学习和统计学习
机器学习之深度学习
学习学习中
论文即思路

zl程序教程

当前栏目

【前沿】TensorFlow Pytorch Keras代码实现深度学习大神Hinton NIPS2017 Capsule论文

相关文章