您现在的位置是：首页 > 后端

当前栏目

【趣味实践】自动补帧算法——RIFE的使用

算法自动实践趣味使用

2023-09-14 09:15:10 时间

前言

视频制作者往往对于高帧率的视频画面有所追求，因为更高帧率的画面意味着在相同时间内能够播放更多帧画面，意味着视频观感更为流畅。
本篇就来尝试一个开源的自动补帧算法——RIFE。

论文标题：RIFE: Real-Time Intermediate Flow Estimation for Video Frame Interpolation
论文地址：https://arxiv.org/pdf/2011.06294v5.pdf
论文中文翻译：https://blog.csdn.net/superbinlovemiaomi/article/details/121305931
开源代码：https://github.com/megvii-research/ECCV2022-RIFE

RIFE简介

RIFE是由北大和Megvii Inc的研究人员于2020年发表在ArXiv上的视频插帧算法，之后发表在ECCV2022。

在论文的开篇，作者就放了一张RIFE和其他补帧算法的效果比较图，纵坐标是PSNR(峰值信噪比)，从下图中可以看到，在不同帧率下，RIFE均取得了较好的效果。

在这里插入图片描述
RIFE的大致结构如下图所示：

在这里插入图片描述
输入两张相邻帧的图片到IFNet中，输出近似中间流(approximate intermediate flows)(类似光流法)，然后和第一帧的图片一起进行后向变形(Backward Warping)，得到两张预测图片，最后和第二帧的图片，一起经过一个融合过程(Fusion Process)，最终输出中间帧(第一帧和第二帧之间)的预测图片。

论文最后，作者给出了各算法详细的数据比较和可视化比较结果，可以看到RIFE基本处于领先地位，而且它在模型复杂度上也比其它模型要好很多。
在这里插入图片描述

在这里插入图片描述

更多具体细节不仔细研究了，需要进一步了解可以看原论文。

RIFE实践

下面就到快乐的实践环节，基于RIFE的应用有很多，为了开发便利，这里直接运行官方开源的Github版本。
克隆代码，配置环境不做细述。

配置好环境后，需要下载官方提供的模型，放置在train_log目录下。

在这里插入图片描述

之后，终端输入：

python inference_video.py --exp=1 --video=video.mp4

这里的exp是一个帧率倍数，exp=1表示将视频帧率修复为原来的2倍；exp=2表示将视频帧率修复为原来的4倍( $2^2$ ），以此类推。
video为视频路径。
稍等片刻，即可在输入视频的路径下得到新生成的视频。

在这里插入图片描述

效果演示

我这里用好友绘制的低帧素材进行测试。
原视频：https://www.bilibili.com/video/BV1Rt4y1L7Rb

AI补帧：RIFE效果演示

注：由于B站限制最高只能到60帧，因此96fps和192fps看不出差别。

视频中将RIFE的效果和PR自带的帧采样，光流法，帧混合效果进行对比，这三种补帧方式简介如下：

帧采样：在调整视频的播放速度之后，多出来的帧或空缺的帧按现有前后帧来生成。也就是复制前后帧。
光流法：软件根据上下帧来推断像素移动的轨迹，自动生成新的空缺帧。有点类似于运动模糊计算方法。
帧混合：混合上下两帧合并生成一个新的帧来填补空缺。

整体看下来RIFE补帧效果还是可以的，不过视频里存在一个小Bug：人物的左侧衣襟会“瞬移”到右侧，这主要是由于RIFE运用到了前后两帧的信息，两侧衣襟过于靠近且相似，造成了程序的误判。

附录：PR设置滑动变化效果

上面的演示视频中的滑动对比效果制作方式也简单记录下。
滑动效果核心是PR自带的视频过渡中的“划出”效果。

首先需要将素材按照下面时间轴的方式进行排布，滑动过程中需要两段素材有重叠。

在这里插入图片描述

然后将每一段字幕和素材进行嵌套：

在这里插入图片描述

最后添加划出效果，设置划出线条的颜色和粗细，拖动划出时间条如下图所示：

在这里插入图片描述

代码备份

RIFE源代码和模型文件备份如下：
https://pan.baidu.com/s/1gmN_5K6Re324AyZIGMQLmA?pwd=8888

猜你喜欢

m基于Lorenz混沌自同步的混沌数字保密通信系统的FPGA实现,verilog编程实现+MATLAB混沌验证程序
InfoPath中repeationg section动态填充数据
Open3D 计算点云质心
Java实现蓝桥杯历届试题危险系数
【第13天】给定一个十进制数字 B ，请你把它转换为R进制打印 | 进制转换
SpringMVC 数组类型的参数: Cannot generate variable name for non-typed Collection parameter type
Excel操作-快速定位目标数值
Scala词法文法解析器　（一）解析SparkSQL的BNF文法
使用C#操作XML文件
Spring JDBC SimpleJdbcInsert类示例
Centos 5.6下面架设NTP服务器
2013年北京hadoop in china见闻
sublime c++
赛后题解:Codeforces Round #852 (Div. 2)1793C Dora and Search
读一篇文章：ChatGPT 全宇宙大爆炸！开启联网解除封印，无敌插件彻底颠覆体验——介绍ChatGPT插件的——希望“文心一言”们，赶紧跟进吧！
工业摄像头信息采集的制作
阿里性能专家全方位对比Jmeter和Locust，到底谁更香？
SparkSQL执行时参数优化
六步带你完成博流wifi模组对接华为云流程
【t043】成绩查询

相关主题

高级算法
试题算法训练 s01串
算法-双指针
算法_贪心算法
二叉树算法
顺序串算法2
算法-递归算法

zl程序教程

当前栏目

【趣味实践】自动补帧算法——RIFE的使用

前言

RIFE简介

RIFE实践

效果演示

附录：PR设置滑动变化效果

代码备份

相关文章