Practical Compact Deep Compressed Sensing
论文作者:
Bin Chen(陈斌) and Jian Zhang†(张健)(†通讯作者)
作者单位:
收录刊物:
IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)
发表时间:
正式版本:
https://ieeexplore.ieee.org/document/10763443
arXiv版本:
https://arxiv.org/abs/2411.13081
代码链接:
https://github.com/Guaishou74851/PCNet

压缩感知(Compressed Sensing, CS)是一种信号降采样技术,可大幅节省图像获取成本。CS 的核心思想是“无需完整记录图像信息,通过计算即可还原目标图像”。CS 的典型应用包括:
CS 的数学模型可表示为 ,其中 是原始图像, 是采样矩阵, 是观测值。定义压缩采样率为 。
-
-
-
采样矩阵信息保留能力不足:将图像切块,逐块采样,导致观测值信息量有限;
-

本工作提出了一种实用、紧致的图像压缩感知网络 PCNet,具有如下创新点:
-
一种新型压缩采样矩阵,能够融合图像的局部与全局特征,从而提高信息保留能力。具体采样过程分两步:首先,用一个小型卷积网络对图像滤波;其次,使用全局矩阵对滤波结果降维,生成压缩观测值;
-
一种新型图像重建网络,将传统近端梯度下降(Proximal Gradient Descent,PGD)算法与深度神经网络有机结合,利用先进模块设计显著提升重建精度。

▲ 图1. 提出的实用、紧致的压缩感知网络PCNet
▲ 图2. 提出的协同采样算子

在 Set11、CBSD68、Urban100 和 DIV2K 等基准数据集上,PCNet 的性能显著优于其他方法,特别是在高分辨率(2K、4K、8K)成像任务中。此外,其采样矩阵可拓展至量化 CS 和自监督 CS 任务,展现了良好的通用性。
▲ 图3. 方法与其他CS方法的对比结果
视觉信息智能学习实验室(VILLA)由北京大学信息工程学院张健助理教授于 2019 年创立并负责,主要围绕“智能可控图像生成”这一前沿领域,深入开展高效图像重建、可控图像生成和精准图像编辑三个关键方向的研究。
张健老师带领 VILLA 团队已在 Nature 子刊 Communications Engineering、IEEE SPM、TPAMI、TIP、IJCV、NeurIPS、ICLR、CVPR、ICCV 和 ECCV 等高水平国际期刊和会议上发表论文 100 余篇,其中近三年,以第一作者/通讯作者发表 CCF A 类论文 40 余篇。张健老师谷歌学术引用 1 万余次,h-index 值为 49(单篇一作最高引用 1200 余次),获得北大青年教师教学比赛一等奖、国际期刊/会议最佳论文奖五次,主持国家科技重大专项课题、国自然重点项目课题、国自然面上以及与字节/华为/OPPO/创维/兔展等知名企业学术合作项目 10 余项。
在高效图像重建方面,张健老师团队的代表性成果包括优化启发式深度展开重建网络 ISTA-Net、COAST、ISTA-Net++,联合学习采样矩阵压缩计算成像方法 OPINE-Net、PUERT、CASNet、HerosNet、PCA-CASSI,基于信息流增强机制的高通量广义优化启发式深度展开重建网络 HiTDUN、SODAS-Net、MAPUN、DGUNet、SCI3D、PRL、OCTUF、D3C2-Net,以及无需真值的自监督图像重建方法 SCNet。团队还提出了基于自适应路径选择机制的动态重建网络 DPC-DUN 和用于单像素显微荧光计算成像的深度压缩共聚焦显微镜 DCCM,以及生成式图像复原方法 Panini-Net、PDN、DEAR-GAN、DDNM,受邀在信号处理领域旗舰期刊 SPM 发表专题综述论文。本工作提出的实用、紧致的压缩感知网络 PCNet 进一步提升了图像压缩感知的精度与效率。
更多信息可访问 VILLA 实验室主页(https://villa.jianzhang.tech/)或张健助理教授个人主页(https://jianzhang.tech/cn/)。
(文:PaperWeekly)