模型压缩

Contents

模型压缩#

《模型压缩》模型压缩跟轻量化网络模型不同,压缩主要是对轻量化或者非轻量化模型执行剪枝、蒸馏、量化等压缩算法和手段,使得模型更加小、更加轻便、更加利于执行。

内容大纲#

PPT字幕需要到 Github 下载,网页课程版链接会失效哦~

建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~

大纲

小节

链接

模型压缩

01 基本介绍

文章, PPT, 视频

模型压缩

02 低比特量化原理

文章, PPT, 视频

模型压缩

03 感知量化训练 QAT

文章, PPT, 视频

模型压缩

04 训练后量化 PTQ 与部署

文章, PPT, 视频

模型压缩

05 模型剪枝

文章, PPT, 视频

模型压缩

06(上) 知识蒸馏原理

文章, PPT, 视频

模型压缩

06(下) 知识蒸馏算法

文章, PPT, 视频

备注#

文字课程开源在 AISys,系列视频托管B 站油管,PPT 开源在github,欢迎取用!!!

非常希望您也参与到这个开源课程中,B 站给 ZOMI 留言哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交 PR 到开源社区哦!

请大家尊重开源和 ZOMI 的努力,引用 PPT 的内容请规范转载标明出处哦!