视觉感知与机器学习团队

团队简介

拥有教授1人、副教授1人、博士讲师5人，省研究生教学名师/高水平导师1人；面向多模态智能感知、机器智能及智能生成等领域的共性技术需求为驱动，在基于深度学习计算机视觉自然/医学图像复原增强、基于数据特征的质量控制与预测、工业领域数据样本智能生成、医学图像智能诊断、行人重识别、多视角在线学习、3D点云处理与可视化、深度图网络学习等方面开展一列研究。研究成果可为消费电子、智能行业软件及智能制造等工程应用提供关键技术支撑。近年来主持或承担国家自然科学基金项目2项、省部级以上项目8项、产学研合作及协同创新项目2项, 发表SCI/EI论文60余篇, 获国家发明专利10余项。

团队成员

刘恒教授

主要研究方向：计算机视觉、深度学习/机器学习、模式识别

个人简介：

教授，博导；长期从事智能感知与深度学习研究，在底层视觉领域围绕图像/视频超分辨、去模糊、重着色及风格迁移展开了深入研究、取得丰富成果，同时在隔空动态手势身份识别与手势识别相结合的智能交互领域，进行了原创性探索。曾任海信集团多媒体研发中心智能交互技术专家，获青岛市 “智岛计划” 领军人才、安徽省研究生教学名师。曾于2016-2017英国诺桑比亚大学及东安格利亚大学访问学者。主持国家自然科学青年基金及面上项目，安徽省高校协同创新重大项目子课题项目、安徽省教育厅自然科学重大项目及重点项目、安徽省自然科学基金面上项目，教育部重点实验室开放基金、产学研合作课题等多项。以第一作者或通讯作者发表SCI/EI收录论文90余篇，授权发明专利10余项。2018、2019及2020年指导硕士生获安徽省计算机学会优秀硕士学位论文奖、2022年指导本科生获安徽省计算机学会优秀本科毕业设计（论文）奖。目前是中国计算机学会计算机视觉专委委员，中国人工智能学会模式识别专委及智能交互专委委员，中国图像图形学会机器视觉专委委员。E-mail：hengliusky@aliyun.com

所授课程：

《模式识别与深度学习》、《Linux操作系统内核分析》、《计算机科学技术概论》、《计算机视觉》

侯书东副教授

主要研究方向：模式识别、计算机视觉、机器学习

个人简介：

2012年6月博士毕业于南京理工大学计算机学院模式识别专业，同年进入中国电子科技集团公司第38研究所从事雷达软件总体与数据处理工作。2016年起任安徽工业大学计算机学院副教授。E-mail：shudonghou@ahut.edu.cn

所授课程：

《编译原理》、《计算机视觉》

陈峰博士

主要研究方向：计算机视觉、行人重识别、步态识别

个人简介：

2021年6月毕业于安徽大学电子科学与技术专业，获博士学位，现为安徽工业大学计算机科学与技术学院讲师。E-mail: chenfeng@ahut.edu.cn

所授课程：

《计算机组成原理》、《智能计算系统》

郭向林博士

主要研究方向：3D视觉、计算机图形学和机器学习

个人简介：

2022年3月毕业于南京航空航天大学航空宇航制造工程专业，获工学博士学位，同年加入安徽工业大学计算机科学与技术学院人工智能系，担任讲师。E-mail: x.guo@ahut.edu.cn

所授课程：

《计算机组成原理》、《智能计算系统》

说明: WechatIMG576

唐振博士

主要研究方向：计算机视觉、医学图像处理

个人简介：

2023年1月毕业于英国南安普顿大学计算机科学专业，获博士学位。现为安徽工业大学计算机科学与技术学院讲师。

所授课程：

《数字逻辑》、《医学图像处理》

王永振博士

主要研究方向：计算机视觉、深度学习、图像处理

个人简介：

2023年7月毕业于南京航空航天大学计算机科学与技术专业，获工学博士学位，现为安徽工业大学计算机科学与技术学院讲师。主要研究方向为计算机视觉、深度学习和图像处理，专注于图像复原和目标检测领域。近两年在IEEE TITS，IEEE TGRS，KBS，ESWA等人工智能与深度学习顶级期刊上发表学术论文10余篇。担任CCF A类人工智能顶级会议AAAI 2022-2024年程序委员会委员。受邀担任ESWA、ACM TOMM、TVC、JEI、TJSC等多个SCI期刊审稿人。曾获博士研究生国家奖学金，南京航空航天大学群星创新奖。E-mail: wangyz@ahut.edu.cn

所授课程：

《计算机视觉》

说明: bingwen

胡炳文博士

主要研究方向：计算机视觉、深度学习、图像编辑

个人简介：

2023年10月毕业于南京理工大学计算机科学与技术专业，获工学博士学位，现为安徽工业大学计算机科学与技术学院讲师。2018年11月至2020年11月，于澳大利亚悉尼科技大学—澳大利亚人工智能研究院访学两年。长期从事图像生成、图像编辑等相关领域研究。现为中国图学学会高级会员，中国图学学会动漫图学专业委员会委员。 E-Mail：hu_bingwen@ahut.edu.cn

所授课程：

《数据库原理及应用》

近年主要科研项目

[1] 国家自科基金面上项目(61971004), 基于深度生成模型的图像及视频超分辨研究及应用， 2020/01-2023/12, 主持

[2] 国家自科基金青年项目(62206006), 基于多语义伪标签估计的无监督行人重识别方法与理论研究, 2023/01-2025/12, 主持

[3] 安徽省自然科学基金(2008085MF190), 深度卷积图像超分辨网络的多阶特征注意力机制研究, 2020/01-2022/12, 主持

[4] 军委装备发展部预先研究项目（共用技术）（80912020104），弱小移动目标数据扩充和自动标注的实时侦测与识别方法研究，2022/09-2023/12，第一主研

[5] 安徽省高校协同创新重大项目（GXXT-2022-044），颅内动脉瘤的人工智能辅助诊断和精准预后关键技术研究子课题，2022/12-2024.11，主持

[6] 教育部计算智能与信号处理重点实验室开放课题（2020A002），基于自监督学习与注意力机制的视频超分辨方法研究，2020/01-2022/12，主持

[7] 安徽省自然科学基金面上项目(1808085QF210), 基于结构化表示的相关投影分析方法研究, 2018/06-2020/06, 主持

[8] 安徽省教育厅自科基金重点项目(KJ2021A0375), 基于伪标签估计的无监督行人重识别研究, 2022/01-2023/12, 主持

[9] 安徽省高校协同创新重大项目（GXXT-2019-018），全自动转盘挤奶机套杯机器人的研发与应用子课题，2020/01-2021.12，主持

[10] 安徽省自然科学基金项目面上项目(1608085MF129)，基于深度学习隔空动态手势身份识别机理及应用研究, 2016/01-2018.12, 主持。

[11] 安徽省高校自然科学研究重大项目，基于深度学习的多模态动态手势身份识别原理研究，2015/01-2017/12，主持

近年主要论文

[1] Yongzhen Wang, Xuefeng Yan, Fu Lee Wang, et al. UCL-Dehaze: Towards Real-world Image Dehazing via Unsupervised Contrastive Learning[J]. IEEE Transactions on Image Processing, 2024, 33: 1361-1374.

[2] Guanghui Li#, Mingqi Gao#, Heng Liu*, Xiantong Zhen, Feng Zheng*, Learning Cross-Modal Affinity for Referring Video Object Segmentation Targeting Limited Samples. ICCV2023.

[3] Heng Liu, Yao Xu, Feng Chen. Sketch2Photo: Synthesizing photo-realistic images from sketches via global contexts. Engineering Applications of Artificial Intelligence, 2023 (117): 105608.

[4] Feng Chen, Nian Wang, Jun Tang, Pu Yan, Jun Yu. Unsupervised Person Re-identification via Multi-domain Joint Learning. Pattern Recognition, 2023: 109369.

[5] Yongzhen Wang, Jiamei Xiong, Xuefeng Yan, et al. USCFormer: Unified Transformer with Semantically Contrastive Learning for Image Dehazing. IEEE Transactions on Intelligent Transportation Systems, 2023, 24: 1-13.

[6] Heng Liu, Jianyong Liu, Shudong Hou, et al. Perception consistency ultrasound image super-resolution via self-supervised CycleGAN. Neural computing and applications, 2023 (35): 12331–12341.

[7] 王永振, 童鸣, 燕雪峰等. 面向真实战场环境的Transformer-CNN多特征聚合图像去雾算法. 兵工学报, 2023: 1-11.

[8] Xianglin Guo, Yifan Wang, Heng Liu, Haoran Xie, Gary Cheng, et al. Steerable Graph Neural Network on Point Clouds via Second-Order Random Walks. IEEE Transactions on Multimedia. DOI 10.1109/TMM.2023.3330338.

[9] Zhen Tang, S. Mahmoodi, A. Darekar and B. Vollmer, 2023. Automatic veins analysis of susceptibility weighted image in hypoxic-ischaemic encephalopathy. Magnetic Resonance Imaging，98, pp.83-96.

[10] Yongzhen Wang, Xuefeng Yan, Donghai Guan, et al. Cycle-SNSPGAN: Towards Real-World Image Dehazing via Cycle Spectral Normalized Soft Likelihood Estimation Patch GAN[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11):20368-20382.

[11] Yongzhen Wang, Xuefeng Yan, Hexiang Bao, et al. Detecting Occluded and Dense Trees in Urban Terrestrial Views with a High-quality Tree Detection Dataset. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1-12.

[12] Yongzhen Wang, Xuefeng Yan, Kaiwen Zhang, et al. TogetherNet: Bridging Image Restoration and Object Detection Together via Dynamic Enhancement Learning. Computer Graphics Forum, 2022, 41(7): 465-476.

[13] Bingwen Hu, Zhedong Zheng, Ping Liu, et al. Unsupervised eyeglasses removal in the wild[J]. IEEE Transactions on Cybernetics, 2021, 51(9): 4373 - 4385.

[14] Bingwen Hu, Ping Liu, Zhedong Zheng, et al. SPG-VTON: Semantic Prediction Guidance for Multi-pose Virtual Try-on[J]. IEEE Transactions on Multimedia, 2022, 24: 1233 - 1246.

[15] Heng Liu, Jianyong Liu, Feng Chen. Progressive Residual Learning with Memory Upgrade for Ultrasound Image Blind Super-resolution. IEEE Journal of Biomedical and Health Informatics, 2022, 26(9): 4390 – 4401.

[16] Rui Wang#, Feng Chen#, Jun Tang, Pu Yan. Adaptive Camera Margin for Mask-guided Domain Adaptive Person Re-identification. In: Proceedings of the 30th ACM International Conference on Multimedia (MM ’22), October 10–14, 2022, Lisboa, Portugal. ACM, New York, NY, USA, doi: 10.1145/3503161.3548216

[17] Yuezhong Chu, Yunan Qiao, Heng Liu* et al. Dual Attention with the Self-Attention Alignment for Efficient Video Super-resolution. Cognitive Computation, 2022, 14:1140–1151.

[18] Zhen Tang, S. Mahmoodi, A. Darekar, and B. Vollmer, 2022. Hypoxic-Ischaemic Encephalopathy Prognosis using Susceptibility Weighted Image Analysis based on Histogram Orientation Gradient. In: Proceedings of 15th International Joint Conference on Biomedical Engineering Systems and Technologies - Volume 4: BIOSIGNALS, ISBN 978-989-758-552-4, ISSN 2184-4305, pages 57-62.

[19] Feng Chen, Tongtong Zhang, Heng Liu*. Face image inpainting via latent features reconstruction and mask awareness[J]. Computers and Electrical Engineering, 2022, 103: 108282.

[20] Yuezhong Chu, Xuefeng Zhang and Heng Liu*. Decoupling Induction and Multi-Order Attention Drop-Out Gating Based Joint Motion Deblurring and Image Super-Resolution, Mathematics 2022, 10, 1837.

[21] Feng Chen, Nian Wang, Jun Tang*, Dong Liang. A Negative Transfer Approach to Person Re-identification via Domain Augmentation[J], Information Sciences, 2021, 549:1-12.

[22] Feng Chen, Nian Wang, Jun Tang*, Fan Zhu. A Feature Disentangling Approach for Person Re-identification via Self-supervised Data Augmentation[J], Applied Soft Computing, 2021, 100: 106939.

[23] Yongzhen Wang, Xuefeng Yan, and Junan Zhang. Research on GPU parallel algorithm for direct numerical solution of two-dimensional compressible flows [J]. Journal of Supercomputing, 2021, 77(10): 10921-10941.

[24] Feng Chen, Nian Wang, Jun Tang*, Dong Liang, Hao Feng. Self-supervised Data Augmentation for Person Re-identification[J], Neurocomputing, 2020, 415:48-59.

[25] Heng Liu, Jiajun Qin, Zilin Fu, et al. Fast simultaneous image super-resolution and motion deblurring with decoupled cooperative learning, Journal of Real-Time Image Processing, 2020, 17(6): 1787-1800.

[26] Heng Liu, Ziling Fu, Jungong Han, Single Image Super-Resolution Using Multi-Scale Deep Encoder-Decoder with Phase Congruency Edge Map Guidance. Information Sciences, 2019, 473:44-58.

[27] Heng Liu, Xiaoyu Zhen, Jungong Han, A Survey on GAN-based Face Hallucination with Its Model Development, IET Image Processing, 2019, 13(14): 2662-2672

[28] Heng Liu, Liangliang Dai, Shudong Hou, Jungong Han, Hongshen Liu. Are mid-air dynamic gestures applicable for user identification? Pattern recognition letters, 2019,117:179-185

[29] Xianglin Guo, et.al. Robust Low-Rank Subspace Segmentation with Finite Mixture Noise, Pattern Recognition 93 : 55-67 (2019)

[30] Xianglin Guo, et.al. Mesh Defiltering via Cascaded Geometry Recovery, Computer Graphics Forum 38(7): 591-605 (2019)

[31] Shudong Hou, Heng Liu, Quansen Sun. Sparse regularized discriminative canonical correlation analysis for multi-view semi-supervised learning, Neural Computing & Applications, 31: 7351-7359 (2019)

[32] Heng Liu, Ziling Fu, Jungong Han, Ling Shao, Single Satellite Imagery Simultaneous Super-resolution and Colorization using Multi-task Deep Neural Networks. Journal of Visual Communication and Image Representation, 2018, 53:20-30.

[33] Heng Liu, Jungong Han, Shudong Hou, Ling Shao, Yue Ruan. Single image super-resolution using a deep encoder–decoder symmetrical network with iterative back projection. Neurocomputing 2018, 282: 52-59

[34] 侯书东，孙权森. 稀疏保持典型相关分析及在特征融合中的应用,自动化学报，2012, 38(4): 659-665.

[35] Yihua Fan, Yongzhen Wang, Dong Liang, et al. Low-FaceNet: Face Recognition-driven Low-light Image Enhancement[J]. IEEE Transactions on Instrumentation and Measurement, 2024, 73: 1-13

[36] Zhiheng Hu, Yongzhen Wang, Peng Li, et al. iSmallNet: Densely Nested Network with Label Decoupling for Infrared Small Target Detection[C]. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023: 1-5.

[37] Xingyu Xie, Xianglin Guo, Guangcan Liu, Jun Wang. Implicit Block Diagonal Low-Rank Representation. IEEE Trans. Image Processing, 2018, 27(1) : 477-489

[38] Jie Wang, Yongzhen Wang, Yidan Feng, et al. Contrastive Semantic-Guided Image Smoothing Network. Computer Graphics Forum, 2022, 41(7): 335-346.

[39] Yiyang Shen, Yongzhen Wang, Mingqiang Wei, et al. Semi-MoreGAN: Semi-supervised Generative Adversarial Network for Mixture of Rain Removal[J]. Computer Graphics Forum, 2022, 41(7): 443-454.

[40] 熊佳梅, 王永振, 燕雪峰等. 一种基于语义引导和对比学习的战场图像去烟算法. 兵工学报, 2022: 1-12.

[41] 范益华, 王永振, 燕雪峰等. 人脸识别任务驱动的低光照图像增强算法. 图学学报, 2022, 43(06): 1170-1181.

[42] Yanbiao Niu, Xuefeng Yan, Yongzhen Wang, et al. Three-dimensional collaborative path planning for multiple UCAVs based on improved artificial ecosystem optimizer and reinforcement learning. Knowledge-Based Systems, 2023, 276: 110782.

[43] Yanbiao Niu, Xuefeng Yan, Yongzhen Wang, et al. Three-dimensional UCAV path planning using a novel modified artificial ecosystem optimizer. Expert Systems with Applications, 2023, 217: 119499.

获奖

1. 2023 安徽省研究生教学名师

2. 2022 安徽省计算机学会优秀本科毕业论文指导教师奖

3. 2021 安徽工业大学研究生高水平导师

4. 2018-2020连续三年获安徽省计算机学会优秀硕士学位论文指导教师奖

5. 2020年度第五届全国计算机类课程实验教学案例设计竞赛（人工智能类）二等奖

6. 指导学生获 2022全国大学生互联网+创新创业大赛省赛银奖

7. 指导学生获2022电子商务“创新、创意及创业”大赛省级一等奖

近年主要专利

1. 一种手机拍照快速超分辨处理方法, ZL202010210142.6

2. 一种基于对称深度网络的单幅图像超分辨率重建方法, ZL201610528420.6

3. 一种基于多任务深度神经网络的卫星图像同时超分辨和着色方法, ZL201711224807.3

4. 一种基于特征迁移学习的转换手势识别到身份识别的方法, ZL2018107628857

5. 一种隔空动态手势用户身份认证方法及装置, ZL201611087785.6

6. 一种基于深度学习的2D+3D大型飞机外形缺陷检测与分析方法, ZL201911321821.4

7. 一种智能电视的播放控制方法及装置，ZL201310617514.7。

8. 一种运动物体的高度检测方法和装置，ZL201410437736.5。

9. 基于方向运动历史图及竞争机制的手挥运动方向判定方法，ZL201210190678.1

招生信息

本团队每年招录研究生12-16名，欢迎对机器智能、计算机视觉、深度学习、图像/视频生成、多模态大模型等研究与应用感兴趣的优秀学生报考我们团队。基本素质要求：态度端正，踏实勤奋，基础扎实，勇于拼搏。

网站首页

学院概况

组织机构

本科生教育

研究生教育

师资队伍

学科与科研

党建园地

学生工作

校友之家

招贤纳士

ENGLISH

视觉感知与机器学习团队