CVPR:向学术巅峰奋进

2022-07-05 | 理工学院

项目介绍

在今年的CVPR 2022 上,温州肯恩大学理工学院数学系的卢长杰(2023届),郑深(2021届),系主任Dr. Gaurav Gupta在CVPRW:precognition: see through the future上发表了题为:Unsupervised Domain Adaptation for Cardiac Segmentation: Towards Structure Mutual Information Maximization的文章。

论文封面

论文封面

 

CVPR简介

CVPR全称IEEE International Conference on Computer Vision and Pattern Recognition. 它是计算机领域影响力排名第一的国际会议。在Google Scholar的出版排名中,CVPR以356的h-index仅次于Science主刊,并且每年保持非常高的增长速度,2020年的影响因子达到了45.17。CVPRW是与CVPR主会议同时召开的研讨会,主要讨论在更加细分的领域的学术进展,其h-index为89,排名计算机视觉领域第七。

CVPR在谷歌学术上的排名

CVPR在谷歌学术上的排名

CVPR在谷歌学术上的排名

 

灵感来源

CT,核磁共振,超声是常用的医学影像成像方法。医生需要从影像中逐帧查看病人病灶位置和器官的关键部位,以此来作为诊断或者后期手术的依据。但是这些影像人工标注复杂费时,难以满足病人的迫切的需求,尤其是危重病人。人工智能图像诊断发展迅速,本文就这一领域的话题展开工作。

然而,医学影像的智能诊断也有很多难题。病人隐私,标注数据少导致了智能诊断算法要在极少的样例标记下学习到关键知识,甚至有些模态没有可学习的数据。如何使用一个模态学习到的知识来诊断另一个模态(比如学习核磁共振的数据来给CT做标注)?该方法在计算机视觉叫做领域自适应。这篇文章改进了原有算法,对心脏影像的分割精度有2-6%的提升。

论文

 

采访卢长杰学长

这个领域的文章在刚开始看的时候,完全没有头绪。论文的数学细节太多,代码复杂。为了看懂这些论文,我仔细学习了变分自编码器,U-Net,显式隐式领域自适应的发展。仔细阅读推敲了大概50篇论文,终于逐渐理解了这个话题常用的方法。同时借鉴了汪立威给我的方法指导:每次做学习笔记,在知乎上写了几篇文章理解。

心脏重建图片

心脏重建图片

 

为了理解文章每一个部件的性质,我经常给文章作者发邮件问问题。有一篇文章的作者是我们之前在复旦访问认识的博士生。我有天晚上和他电话大概一个小时,才把自己不理解的地方给梳理通了。通过之后大量的实验,代码阅读,这个领域的脉络逐渐明朗起来。

心肌, 左心房,左心室分割图

心肌, 左心房,左心室分割图

 
在找创新点的时候,发现了之前文章的一个放缩项,于是我尝试着把这个放缩项找到更好的估计方案而不是移除。在Dr. Gaurav Gupta,四川大学王学长和复旦大学富平博士的帮助下,我成功推导出了一个更加严谨的式子。为了估计这个它,我又开始了大量的文献阅读,并且用代码实现,最终完成了这个名为互信息神经估计的模块。看到实验结果有提升之后,瞬间感觉几个月的努力没有白费。
网络架构
网络架构
 
互信息神经估计模块
互信息神经估计模块
 
推导公式
推导公式
 
之后,我拉上了一直科研合作的郑深学长,有序完成了后面的对比实验和消融实验,此时距离截稿只有5天。在之前的多次科研配合下,我们分配好工作,每天高效投入,最终在截稿前8小时完成了论文的写作。审稿完成后被幸运录取了。
 
参加CVPR大会

6.19-6.24,CVPR2022大会在美国新奥尔良正式召开。由于疫情原因,我们只能线上参会。

在这次CVPR会议中,我参加了一些学术大牛的 oral presentation session,并且学习到了前沿的算法。会议邀请了众多高科技公司,如Google,Apple,Microsoft, 来展示他们最新的科技成果。同时,会议组织了多次线上的研讨会,让学者们交流科研,各个国家的学习生活感受等等,我从中收获了宝贵的经验。

CVPR线上会首页

CVPR线上会首页

 

 

        文案、图片提供:卢长杰

        编辑排版:孙文璇

        审核校对:温州肯恩大学理工学院