Network Optimization for Distributed Learning (面向大规模机器学习系统的网络设计与思考)

报告题目:Network Optimization for Distributed Learning (面向大规模机器学习系统的网络设计与思考)

报 告 人:陈凯, 香港科技大学计算机科学与工程系教授、博导

报告时间:2023年5月31日 16:00-17:30

报告地点:秀山校区艺设西楼213会议室

报告对象:计算机科学与技术学院研究生及其他感兴趣师生

内容摘要:Network communication overhead poses a significant challenge to large-scale distributed DNN training and draws increasing attention in the community. In this talk, I will first overview some existing efforts to address this challenge, discuss their merits and shortcomings, and further present our thought towards a domain-specific network optimization by exploiting special properties of distributed deep learning. Our proposal is by no means an ultimate solution to this challenging question. Instead, I hope this talk can inspire more critical thinking and debate about networking for AI in the community。

报告人简介:陈凯, 香港科技大学计算机科学与工程系教授、博导,网络系统实验室(iSING Lab)主任,港科大-微信人工智能技术联合实验室(WHAT Lab)主任, 香港人工智能与机器人学会(HKSAIR)副理事长。目前主要从事数据中心网络、高性能网络、机器学习系统、隐私计算的研究, 曾多次在SIGCOMM, NSDI, OSDI, TON等国际主流学术会议和期刊上发表文章, 担任SIGCOMM, NSDI, INFOCOM, TON, TCC 等国际会议和期刊的程序委员和编委,是亚太网络研讨会APNet发起者和指导委员会主席,陈凯本科和硕士毕业于中国科学技术大学、博士毕业于美国西北大学。