首页文章阅读微信小程序高质量微信号古诗词大全

微信扫一扫
分享到朋友圈

没钱买华为P30？这个图像超分辨率项目帮你「拍」出高清照片

作者：机器之心来源：机器之心公众号

分享到：

03-27

选自GitHub

项目作者：Francesco Cardinale等

机器之心编译

华为刚刚发布的 P30「望远镜」手机能在几十米外拍到埃菲尔上的人名，确实令人佩服，但其售价也是令人望而生畏。那么，不买华为手机、高级单反就拍不到充满细节的高清照片了吗？

相机不够算法凑，拥有超级拍照能力的手机也离不开算法的加持。本文介绍的项目可以帮你补齐相机镜头的短板。

华为 P30 发布会上展示的埃菲尔铁塔高清远距离照片。

今天，一位 Reddit 网友贴出了自己基于 Keras 的图像超分辨率项目，可以让照片放大后依然清晰。先来看一下效果。

放大数倍后，照片中的蝴蝶（蛾子？）依然没有失真，背上的绒毛清晰可见。

作者表示，该项目旨在改善低分辨率图像的质量，使其焕然一新。使用该工具可以对图像进行超级放缩，还能很容易地在 RDN 和上进行实验。

该项目包含不同残差密集网络的 Keras 实现，它们可用于高效的单图像超分辨率（ISR）。同时作者还提供了各种文档资料以帮助训练模型，包括如何使用对抗损失组件训练这些网络。

项目示例

这些示例使用的放大因子（upscaling factor）为 2，即像素数扩大两倍。大家可在 sample_weights 中查看生成示例图像的权重，它们存储在 git lfs 上。如要下载这些权重，你需要先复制该 repo，然后运行 git lfs pull。

左图为原始的低分辨率图像，中间图为该网络的输出结果，右图为使用 GIMP bicubic scaling 得到的基线模型放大结果。

下面是不同方法作用于噪声图像的效果对比，这些方法分别是：使用 bicubic scaling 的基线模型、使用像素级内容损失函数训练的 RDN 网络，以及使用 19 内容压缩数据集和损失函数进行重训练的 RDN 网络。该 repo 包含这些模型的权重。

Bicubic up-scaling（基线模型）的输出结果示例。

使用像素级内容损失函数训练的 RDN 网络的输出结果示例。

使用 VGG 内容和对抗损失组件训练的 RDN 网络的输出结果示例。

超分辨率项目有什么

前面展示的超分辨率效果都是根据该项目实现的不同模型做出来的。超分辨率希望根据已有的图像信息重构出缺失的图像细节，它通常借助卷积神经网络抽取图像信息，再通过转置卷积将这些信息扩展到希望获得的图像分辨率。

在这个项目中，作者新增了很多模块与特征，例如使用 VGG 与 GAN 实现真实的放大图像。该项目主要实现的是 RDN 与 RRDN 网络，且同时还提供了预训练权重和 Colab 教程。不论是训练还是推断，根据这些资料我们都可以快速上手。

此外，该项目目前已经可以发布到 PyPI 上了，因此安装也只需键入 pip 命令即可。

总而言之，整个项目实现了三个超分辨率网络，且采用了 Keras 版的 VGG-19 作为特征抽取模块。如下所示为三个超分辨率网络的相关研究：

Residual Dense Network for Image Super-Resolution(Zhang et al. 2018, arXiv:1802.08797)
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks(Wang et al. 2018, arXiv:1809.00219)
Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network(SRGANS, Ledig et al. 2017, arXiv:1609.04802)

如果我们想要生成上面那样的高清图，该项目还提供了一系列的资源：

文档：https://idealo.github.io/image-super-resolution/
代码：https://github.com/idealo/image-super-resolution/
Colab 推断代码：https://colab.research.google.com/github/idealo/image-super-resolution/blob/master/notebooks/ISR_Prediction_Tutorial.ipynb
Colab 训练代码：https://colab.research.google.com/github/idealo/image-super-resolution/blob/master/notebooks/ISR_Traininig_Tutorial.ipynb

超分辨率项目怎么用

你可以选择两种方式安装图像超分辨率（ISR）包。

从 PyPI 中安装 ISR（推荐）：

pip install ISR

从 GitHub 源安装 ISR：

git clone https://github.com/idealo/image-super-resolution

cd image-super-resolution

python setup.py install

预测

如果我们需要扩展低像素图像，简单两步就能借助 ISR 执行超分辨率。首先加载图像并做一定的预处理：

import numpy as npfrom PIL import Image

img = Image.open('data/input/test_images/sample_image.jpg')
lr_img = np.array(img)/255.
lr_img = np.expand_dims(lr_img, axis=0)

加载模型并执行预测：

from ISR.models import RDN

rdn = RDN(arch_params={'C':6, 'D':20, 'G':64, 'G0':64, 'x':2})
rdn.model.load_weights('weights/rdn-C6-D20-G64-G064-x2_enhanced-e219.hdf5')

sr_img = rdn.model.predict(lr_img)[0]
sr_img = sr_img.clip(0, 1) * 255
sr_img = np.uint8(sr_img)
Image.fromarray(sr_img)

训练

如果需要使用你的数据集重新训练超分辨率模型，那我们也只需要改一改参数。如下首先创建模型：

from ISR.models import RRDN
from ISR.models import Discriminator
from ISR.models import Cut_VGG19

lr_train_patch_size = 40
layers_to_extract = [5, 9]
scale = 2
hr_train_patch_size = lr_train_patch_size * scale

rrdn  = RRDN(arch_params={'C':4, 'D':3, 'G':64, 'G0':64, 'T':10, 'x':scale}, patch_size=lr_train_patch_size)
f_ext = Cut_VGG19(patch_size=hr_train_patch_size, layers_to_extract=layers_to_extract)
discr = Discriminator(patch_size=hr_train_patch_size, kernel_size=3)

创建 Trainer 对象，并将训练的各种配置传递到该对象中：

from ISR.train import Trainer

loss_weights = {
  'generator': 0.0,
  'feat_extr': 0.0833,
  'discriminator': 0.01,
}

trainer = Trainer(
    generator=rrdn,
    discriminator=discr,
    feature_extractor=f_ext,
    lr_train_dir='low_res/training/images',
    hr_train_dir='high_res/training/images',
    lr_valid_dir='low_res/validation/images',
    hr_valid_dir='high_res/validation/images',
    loss_weights=loss_weights,
    dataname='image_dataset',
    logs_dir='./logs',
    weights_dir='./weights',
    weights_generator=None,
    weights_discriminator=None,
    n_validation=40,
    lr_decay_frequency=30,
    lr_decay_factor=0.5,
    T=0.01,
)

开始训练：

trainer.train(
    epochs=80,
    steps_per_epoch=500,
    batch_size=16,
)

网络架构与超参数

实际上，如果我们需要重新训练，那么还需要了解具体的参数都表示什么。这一部分介绍了各超分辨率网络的架构与对应超参数。

RDN 网络架构

RDN 网络架构的主要参数如下：

D：残差密集块（RDB）数量
C：RDB 内部堆叠的卷积层数量
G：RDB 内部每一卷积层的特征图数量

图源：https://arxiv.org/abs/1802.08797

RRDN 网络架构

RRDN 架构的主要参数如下：

T：残差密集块内的残差数量（RRDB）
D：每一 RRDB 内部的残差密集块（RDB）的数量
C：RDB 内部堆叠的卷积层数量
G：RDB 内部每一卷积层的特征图数量

图源：https://arxiv.org/abs/1809.00219

本文为机器之心编译，转载请联系本公众号获得授权。

✄------------------------------------------------

加入机器之心（全职记者 / 实习生）：hr@jiqizhixin.com

投稿或寻求报道：content@jiqizhixin.com

广告 & 商务合作：bd@jiqizhixin.com

查看原文

阅读38584

分辨率项目照片

关注机器之心微信号：almosthuman2014

用微信扫描二维码即可关注

声明

1、头条易读遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2、本文内容来自“机器之心”微信公众号，文章版权归机器之心公众号所有。

为您推荐

腾讯科技

电脑报

漫谈互联网

互联网观察

文章来自于公众号：

机器之心

微信号：almosthuman2014

机器之心的其他文章

微软机器阅读理解超越人类水平，CoQA数据集得分刷新记录

AI「王道」逻辑编程的复兴？清华提出神经逻辑机，已入选ICLR

手把手教你将矩阵&概率画成图

ACL 2019 接收论文榜单发布，我们做了可视化分析

除了检查语法，用上深度学习的编辑器也能自动优化代码

ICLR 2019论文解读：量化神经网络

如何科学交换信息？这篇ICML论文教你如何降低95%的通讯成本

重磅 | GAN之父Ian Goodfellow加盟苹果

仅需10分钟：开启你的机器学习之路

大疆农业无人机AI「果树」模式首次公开作业：开启全自动时代

没钱买华为P30？这个图像超分辨率项目帮你「拍」出高清照片

大家都在搜

小编热点推荐