【校企课程共建】Make Your Deep Learning Models be More Efficient

2023年5月24日上午,微纳电子学系校企共建本科生课程“微纳电子科技前沿讲座”第六讲在闵行校区东中院1号楼108教室顺利进行,讲座由孙亚男老师和杨志老师共同主持。本学期校企共建系列讲座由上海为旌科技有限公司赞助支持。公司作为国内顶尖的集成电路设计企业,致力于为客户提供有竞争力的智能感知芯片及解决方案。

同时,本次课程有幸邀请到了英伟达公司资深架构师余翀作为授课专家。

首先,杨志老师对专家的基本信息及讲座内容做了简要介绍。余翀在英伟达公司担任资深架构师,主要负责在GPU架构上的稀疏压缩、低精度量化、模型轻量化的相关研究,以及模型部署的性能优化工作。曾在英特尔公司负责深度学习框架和算子在CPU架构上的优化工作。在NeurIPS、CVPR、ACL等国际会议和SCI期刊上发表论文20余篇,并拥有19项专利。本次授课题目是Make your deep learning models be more efficient,主要介绍深度学习模型的轻量化设计以及提升深度学习模型实际部署效率的优化策略。

1

图一 杨志老师向同学们介绍授课专家

课程开始,余翀首先简单介绍了深度学习模型在生活中的应用场景。他指出,随着深度学习模型性能的提高,其所需的计算和存储资源会呈现几何级数式的增长,因此实现高效的深度学习模型至关重要。

2

图二 专家介绍深度学习模型背景

接下来,余翀深入讲解了一些模型压缩技术,包括剪枝、量化、知识蒸馏、低秩分解和神经架构搜索。对于每种技术,他都详细地分析了其优势和劣势。同时,余翀还分享了目前已有的高效轻量化模型架构设计,如MobileNet系列、EfficientNet系列、Efficient YOLO以及EfficientViT等。

在课程的后半段,余翀将重点放在了如何在软硬件平台上实现深度学习模型的高效部署上。在硬件方面,他强调了根据不同应用场景选择适当的硬件加速结构的重要性。在软件方面,他介绍了如何实现合适的层接和选择相应的加速引擎。此外,余翀还强调了在硬件更新较慢而软件更新较快的环境下,软硬协同优化才能实现更高效的模型部署。

3

图三 专家耐心解答问题

在讲座结束后,同学们对于余翀所分享的高效深度学习模型内容非常感兴趣,并踊跃提出问题。余翀也非常耐心地解答了同学们的疑问,使得同学们对深度学习模型的理解更进一步。4

图四 课程合影留念

讲座最后,杨志老师为专家颁发授课证书并与同学们合影留念。这次精彩而意味深长的讲座在同学们的掌声中落下帷幕,相信通过这次讲座,同学们对于高效深度学习模型也会有更深刻、全面的认识。

供稿人:匡佳钰  陈宇轩

责任编辑:张媛