视觉感知与机器学习团队


团队简介

拥有教授1人、副教授1人、博士讲师5人,省研究生教学名师/高水平导师1人;面向多模态智能感知、机器智能及智能生成等领域的共性技术需求为驱动,在基于深度学习计算机视觉自然/医学图像复原增强、基于数据特征的质量控制与预测、工业领域数据样本智能生成、医学图像智能诊断、行人重识别、多视角在线学习、3D点云处理与可视化、深度图网络学习等方面开展一列研究。研究成果可为消费电子、智能行业软件及智能制造等工程应用提供关键技术支撑。近年来主持或承担国家自然科学基金项目2项、省部级以上项目8项、产学研合作及协同创新项目2项, 发表SCI/EI论文60余篇, 获国家发明专利10余项。


团队成员

刘恒教授

主要研究方向计算机视觉、深度学习/机器学习、模式识别

个人简介

 教授,博导;长期从事智能感知与深度学习研究,在底层视觉领域围绕图像/视频超分辨、去模糊、重着色及风格迁移展开了深入研究、取得丰富成果,同时在隔空动态手势身份识别与手势识别相结合的智能交互领域,进行了原创性探索。曾任海信集团多媒体研发中心智能交互技术专家,获青岛市   “智岛计划” 领军人才、安徽省研究生教学名师。曾于2016-2017英国诺桑比亚大学及东安格利亚大学访问学者。主持国家自然科学青年基金及面上项目,安徽省高校协同创新重大项目子课题项目、安徽省教育厅自然科学重大项目及重点项目、安徽省自然科学基金面上项目,教育部重点实验室开放基金、产学研合作课题等多项。以第一作者或通讯作者发表SCI/EI收录论文90余篇,授权发明专利10余项。2018、2019及2020年指导硕士生获安徽省计算机学会优秀硕士学位论文奖、2022年指导本科生获安徽省计算机学会优秀本科毕业设计(论文)奖。目前是中国计算机学会计算机视觉专委委员,中国人工智能学会模式识别专委及智能交互专委委员,中国图像图形学会机器视觉专委委员。E-mail:hengliusky@aliyun.com

所授课程

《模式识别与深度学习》、《Linux操作系统内核分析》、《计算机科学技术概论》、《计算机视觉》

侯书东副教授

主要研究方向模式识别、计算机视觉、机器学习

个人简介

 2012年6月博士毕业于南京理工大学计算机学院模式识别专业,同年进入中国电子科技集团公司第38研究所从事雷达软件总体与数据处理工作。2016年起任安徽工业大学计算机学院副教授。E-mail:shudonghou@ahut.edu.cn

所授课程

《编译原理》、《计算机视觉》

陈峰博士

主要研究方向计算机视觉、行人重识别、步态识别

个人简介

 2021年6月毕业于安徽大学电子科学与技术专业,获博士学位,现为安徽工业大学计算机科学与技术学院讲师。E-mail: chenfeng@ahut.edu.cn

所授课程

《计算机组成原理》、《智能计算系统》

郭向林博士

主要研究方向:3D视觉、计算机图形学和机器学习

个人简介

 2022年3月毕业于南京航空航天大学航空宇航制造工程专业,获工学博士学位,同年加入安徽工业大学计算机科学与技术学院人工智能系,担任讲师。E-mail: x.guo@ahut.edu.cn

所授课程

《计算机组成原理》、《智能计算系统》

说明: WechatIMG576

唐振博士

主要研究方向:计算机视觉、医学图像处理

个人简介:

2023年1月毕业于英国南安普顿大学计算机科学专业,获博士学位。现为安徽工业大学计算机科学与技术学院讲师。

所授课程:

《数字逻辑》、《医学图像处理》

王永振博士

主要研究方向:计算机视觉、深度学习、图像处理

个人简介:

2023年7月毕业于南京航空航天大学计算机科学与技术专业,获工学博士学位,现为安徽工业大学计算机科学与技术学院讲师。主要研究方向为计算机视觉、深度学习和图像处理,专注于图像复原和目标检测领域。近两年在IEEE TITS,IEEE TGRS,KBS,ESWA等人工智能与深度学习顶级期刊上发表学术论文10余篇。担任CCF A类人工智能顶级会议AAAI 2022-2024年程序委员会委员。受邀担任ESWA、ACM TOMM、TVC、JEI、TJSC等多个SCI期刊审稿人。曾获博士研究生国家奖学金,南京航空航天大学群星创新奖。E-mail: wangyz@ahut.edu.cn

所授课程:

《计算机视觉》

说明: bingwen

胡炳文博士

主要研究方向:计算机视觉、深度学习、图像编辑

个人简介:

2023年10月毕业于南京理工大学计算机科学与技术专业,获工学博士学位,现为安徽工业大学计算机科学与技术学院讲师。2018年11月至2020年11月,于澳大利亚悉尼科技大学—澳大利亚人工智能研究院访学两年。长期从事图像生成、图像编辑等相关领域研究。现为中国图学学会高级会员,中国图学学会动漫图学专业委员会委员。 E-Mail:hu_bingwen@ahut.edu.cn

所授课程:

《数据库原理及应用》




近年主要科研项目

[1] 国家自科基金面上项目(61971004), 基于深度生成模型的图像及视频超分辨研究及应用, 2020/01-2023/12, 主持

[2] 国家自科基金青年项目(62206006), 基于多语义伪标签估计的无监督行人重识别方法与理论研究, 2023/01-2025/12, 主持

[3] 安徽省自然科学基金(2008085MF190), 深度卷积图像超分辨网络的多阶特征注意力机制研究, 2020/01-2022/12, 主持

[4] 军委装备发展部预先研究项目(共用技术)(80912020104),弱小移动目标数据扩充和自动标注的实时侦测与识别方法研究,2022/09-2023/12,第一主研

[5] 安徽省高校协同创新重大项目(GXXT-2022-044),颅内动脉瘤的人工智能辅助诊断和精准预后关键技术研究子课题,2022/12-2024.11,主持

[6] 教育部计算智能与信号处理重点实验室开放课题(2020A002),基于自监督学习与注意力机制的视频超分辨方法研究,2020/01-2022/12,主持

[7] 安徽省自然科学基金面上项目(1808085QF210), 基于结构化表示的相关投影分析方法研究, 2018/06-2020/06, 主持

[8] 安徽省教育厅自科基金重点项目(KJ2021A0375), 基于伪标签估计的无监督行人重识别研究, 2022/01-2023/12, 主持

[9] 安徽省高校协同创新重大项目(GXXT-2019-018),全自动转盘挤奶机套杯机器人的研发与应用子课题,2020/01-2021.12,主持

[10] 安徽省自然科学基金项目面上项目(1608085MF129),基于深度学习隔空动态手势身份识别机理及应用研究, 2016/01-2018.12, 主持。

[11] 安徽省高校自然科学研究重大项目,基于深度学习的多模态动态手势身份识别原理研究,2015/01-2017/12,主持



近年主要论文 

[1] Yongzhen Wang, Xuefeng Yan, Fu Lee Wang, et al. UCL-Dehaze: Towards Real-world Image Dehazing via Unsupervised Contrastive Learning[J]. IEEE Transactions on Image Processing, 2024, 33: 1361-1374.

[2] Guanghui Li#, Mingqi Gao#, Heng Liu*, Xiantong Zhen, Feng Zheng*, Learning Cross-Modal Affinity for Referring Video Object Segmentation Targeting Limited Samples. ICCV2023.

[3] Heng Liu, Yao Xu, Feng Chen. Sketch2Photo: Synthesizing photo-realistic images from sketches via global contexts. Engineering Applications of Artificial Intelligence, 2023 (117): 105608.

[4] Feng Chen, Nian Wang, Jun Tang, Pu Yan, Jun Yu. Unsupervised Person Re-identification via Multi-domain Joint Learning. Pattern Recognition, 2023: 109369.

[5] Yongzhen Wang, Jiamei Xiong, Xuefeng Yan, et al. USCFormer: Unified Transformer with Semantically Contrastive Learning for Image Dehazing. IEEE Transactions on Intelligent Transportation Systems, 2023, 24: 1-13.

[6] Heng Liu, Jianyong Liu, Shudong Hou, et al. Perception consistency ultrasound image super-resolution via self-supervised CycleGAN. Neural computing and applications, 2023 (35): 12331–12341.

[7] 王永振, 童鸣, 燕雪峰等. 面向真实战场环境的Transformer-CNN多特征聚合图像去雾算法. 兵工学报, 2023: 1-11.

[8] Xianglin Guo, Yifan Wang, Heng Liu, Haoran Xie, Gary Cheng, et al. Steerable Graph Neural Network on Point Clouds via Second-Order Random Walks. IEEE Transactions on Multimedia. DOI 10.1109/TMM.2023.3330338.

[9] Zhen Tang, S. Mahmoodi, A. Darekar and B. Vollmer, 2023. Automatic veins analysis of susceptibility weighted image in hypoxic-ischaemic encephalopathy. Magnetic Resonance Imaging,98, pp.83-96.

[10] Yongzhen Wang, Xuefeng Yan, Donghai Guan, et al. Cycle-SNSPGAN: Towards Real-World Image Dehazing via Cycle Spectral Normalized Soft Likelihood Estimation Patch GAN[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11):20368-20382.

[11] Yongzhen Wang, Xuefeng Yan, Hexiang Bao, et al. Detecting Occluded and Dense Trees in Urban Terrestrial Views with a High-quality Tree Detection Dataset. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1-12.

[12] Yongzhen Wang, Xuefeng Yan, Kaiwen Zhang, et al. TogetherNet: Bridging Image Restoration and Object Detection Together via Dynamic Enhancement Learning. Computer Graphics Forum, 2022, 41(7): 465-476.

[13] Bingwen Hu, Zhedong Zheng, Ping Liu, et al. Unsupervised eyeglasses removal in the wild[J]. IEEE Transactions on Cybernetics, 2021, 51(9): 4373 - 4385.

[14] Bingwen Hu, Ping Liu, Zhedong Zheng, et al. SPG-VTON: Semantic Prediction Guidance for Multi-pose Virtual Try-on[J]. IEEE Transactions on Multimedia, 2022, 24: 1233 - 1246.

[15] Heng Liu, Jianyong Liu, Feng Chen. Progressive Residual Learning with Memory Upgrade for Ultrasound Image Blind Super-resolution. IEEE Journal of Biomedical and Health Informatics, 2022, 26(9): 4390 – 4401.

[16] Rui Wang#, Feng Chen#, Jun Tang, Pu Yan. Adaptive Camera Margin for Mask-guided Domain Adaptive Person Re-identification. In: Proceedings of the 30th ACM International Conference on Multimedia (MM ’22), October 10–14, 2022, Lisboa, Portugal. ACM, New York, NY, USA, doi: 10.1145/3503161.3548216

[17] Yuezhong Chu, Yunan Qiao, Heng Liu* et al. Dual Attention with the Self-Attention Alignment for Efficient Video Super-resolution. Cognitive Computation, 2022, 14:1140–1151.

[18] Zhen Tang, S. Mahmoodi, A. Darekar, and B. Vollmer, 2022. Hypoxic-Ischaemic Encephalopathy Prognosis using Susceptibility Weighted Image Analysis based on Histogram Orientation Gradient. In: Proceedings of 15th International Joint Conference on Biomedical Engineering Systems and Technologies - Volume 4: BIOSIGNALS, ISBN 978-989-758-552-4, ISSN 2184-4305, pages 57-62.

[19] Feng Chen, Tongtong Zhang, Heng Liu*. Face image inpainting via latent features reconstruction and mask awareness[J]. Computers and Electrical Engineering, 2022, 103: 108282.

[20] Yuezhong Chu, Xuefeng Zhang and Heng Liu*. Decoupling Induction and Multi-Order Attention Drop-Out Gating Based Joint Motion Deblurring and Image Super-Resolution, Mathematics 2022, 10, 1837.

[21] Feng Chen, Nian Wang, Jun Tang*, Dong Liang. A Negative Transfer Approach to Person Re-identification via Domain Augmentation[J], Information Sciences, 2021, 549:1-12.

[22] Feng Chen, Nian Wang, Jun Tang*, Fan Zhu. A Feature Disentangling Approach for Person Re-identification via Self-supervised Data Augmentation[J], Applied Soft Computing, 2021, 100: 106939.

[23] Yongzhen Wang, Xuefeng Yan, and Junan Zhang. Research on GPU parallel algorithm for direct numerical solution of two-dimensional compressible flows [J]. Journal of Supercomputing, 2021, 77(10): 10921-10941.

[24] Feng Chen, Nian Wang, Jun Tang*, Dong Liang, Hao Feng. Self-supervised Data Augmentation for Person Re-identification[J], Neurocomputing, 2020, 415:48-59.

[25] Heng Liu, Jiajun Qin, Zilin Fu, et al. Fast simultaneous image super-resolution and motion deblurring with decoupled cooperative learning, Journal of Real-Time Image Processing, 2020, 17(6): 1787-1800.

[26] Heng Liu, Ziling Fu, Jungong Han, Single Image Super-Resolution Using Multi-Scale Deep Encoder-Decoder with Phase Congruency Edge Map Guidance. Information Sciences, 2019, 473:44-58.

[27] Heng Liu, Xiaoyu Zhen, Jungong Han, A Survey on GAN-based Face Hallucination with Its Model Development, IET Image Processing, 2019, 13(14): 2662-2672

[28] Heng Liu, Liangliang Dai, Shudong Hou, Jungong Han, Hongshen Liu. Are mid-air dynamic gestures applicable for user identification? Pattern recognition letters, 2019,117:179-185

[29] Xianglin Guo, et.al. Robust Low-Rank Subspace Segmentation with Finite Mixture Noise, Pattern Recognition 93 : 55-67 (2019)

[30] Xianglin Guo, et.al. Mesh Defiltering via Cascaded Geometry Recovery, Computer Graphics Forum 38(7): 591-605 (2019)

[31] Shudong Hou, Heng Liu, Quansen Sun. Sparse regularized discriminative canonical correlation analysis for multi-view semi-supervised learning, Neural Computing & Applications, 31: 7351-7359 (2019)

[32] Heng Liu, Ziling Fu, Jungong Han, Ling Shao, Single Satellite Imagery Simultaneous Super-resolution and Colorization using Multi-task Deep Neural Networks. Journal of Visual Communication and Image Representation, 2018, 53:20-30.

[33] Heng Liu, Jungong Han, Shudong Hou, Ling Shao, Yue Ruan. Single image super-resolution using a deep encoder–decoder symmetrical network with iterative back projection. Neurocomputing 2018, 282: 52-59

[34] 侯书东,孙权森. 稀疏保持典型相关分析及在特征融合中的应用,自动化学报,2012, 38(4): 659-665.

[35] Yihua Fan, Yongzhen Wang, Dong Liang, et al. Low-FaceNet: Face Recognition-driven Low-light Image Enhancement[J]. IEEE Transactions on Instrumentation and Measurement, 2024, 73: 1-13

[36] Zhiheng Hu, Yongzhen Wang, Peng Li, et al. iSmallNet: Densely Nested Network with Label Decoupling for Infrared Small Target Detection[C]. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023: 1-5.

[37] Xingyu Xie, Xianglin Guo, Guangcan Liu, Jun Wang. Implicit Block Diagonal Low-Rank Representation. IEEE Trans. Image Processing, 2018, 27(1) : 477-489

[38] Jie Wang, Yongzhen Wang, Yidan Feng, et al. Contrastive Semantic-Guided Image Smoothing Network. Computer Graphics Forum, 2022, 41(7): 335-346.

[39] Yiyang Shen, Yongzhen Wang, Mingqiang Wei, et al. Semi-MoreGAN: Semi-supervised Generative Adversarial Network for Mixture of Rain Removal[J]. Computer Graphics Forum, 2022, 41(7): 443-454.

[40] 熊佳梅, 王永振, 燕雪峰等. 一种基于语义引导和对比学习的战场图像去烟算法. 兵工学报, 2022: 1-12.

[41] 范益华, 王永振, 燕雪峰等. 人脸识别任务驱动的低光照图像增强算法. 图学学报, 2022, 43(06): 1170-1181.

[42] Yanbiao Niu, Xuefeng Yan, Yongzhen Wang, et al. Three-dimensional collaborative path planning for multiple UCAVs based on improved artificial ecosystem optimizer and reinforcement learning. Knowledge-Based Systems, 2023, 276: 110782.

[43] Yanbiao Niu, Xuefeng Yan, Yongzhen Wang, et al. Three-dimensional UCAV path planning using a novel modified artificial ecosystem optimizer. Expert Systems with Applications, 2023, 217: 119499.


获奖

1. 2023 安徽省研究生教学名师

2. 2022 安徽省计算机学会优秀本科毕业论文指导教师奖

3. 2021 安徽工业大学研究生高水平导师

4. 2018-2020连续三年获安徽省计算机学会优秀硕士学位论文指导教师奖

5. 2020年度第五届全国计算机类课程实验教学案例设计竞赛(人工智能类)二等奖

6. 指导学生获 2022全国大学生互联网+创新创业大赛省赛银奖

7. 指导学生获2022电子商务“创新、创意及创业”大赛省级一等奖



近年主要专利

1. 一种手机拍照快速超分辨处理方法, ZL202010210142.6

2. 一种基于对称深度网络的单幅图像超分辨率重建方法, ZL201610528420.6

3. 一种基于多任务深度神经网络的卫星图像同时超分辨和着色方法, ZL201711224807.3

4. 一种基于特征迁移学习的转换手势识别到身份识别的方法, ZL2018107628857

5. 一种隔空动态手势用户身份认证方法及装置, ZL201611087785.6

6. 一种基于深度学习的2D+3D大型飞机外形缺陷检测与分析方法, ZL201911321821.4

7. 一种智能电视的播放控制方法及装置,ZL201310617514.7。

8. 一种运动物体的高度检测方法和装置,ZL201410437736.5。

9. 基于方向运动历史图及竞争机制的手挥运动方向判定方法,ZL201210190678.1


招生信息

本团队每年招录研究生12-16名,欢迎对机器智能、计算机视觉、深度学习、图像/视频生成、多模态大模型等研究与应用感兴趣的优秀学生报考我们团队。基本素质要求:态度端正,踏实勤奋,基础扎实,勇于拼搏。