打造IC人才
科技生态圈

NPU芯片全流程实战项目课程

  • 线上授课
  • 项目实战
  • 推荐就业
  • 免费试听

自购买期一年有效

16人报名

基本信息:
课程名称:《NPU芯片全流程设计》数字IC NPU流片实战课程
流片制程:TSMC 22nm
课时数:110+个课时
课程周期:3个月

NPU芯片是什么?
NPU(Neural Processing Unit,神经网络处理器)是一种专门为人工智能(AI)任务设计的处理器,尤其擅长加速神经网络的计算(如矩阵乘法、卷积运算等)。

课程及项目优势:

从AI技术的基础知识和算法入手,一步步深入到神经网络的训练、推理,直至NPU芯片的架构设计与实际流片开发。课程覆盖了从算法、前端设计、数字验证,到芯片后端实现的整个产业链流程。

22nm真实流片:基于过往流片项目经验,重磅升级!学员能体验企业中真实芯片设计与开发的过程,并参与真实流片。
资深导师团队:IC修真院拥有众多经验丰富的行业导师,每位讲师都是行业一线的技术专家与资深工程师。
实战经验分享:导师带来的不仅是知识,更是他们在实际项目中多年积累的经验与技巧,让学员学到实用技能,提升解决实际问题的能力。
贴合企业需求:课程内容完全与当前企业实际需求相结合,确保学员所学即企业所需。
职业跃迁的黄金机会:快速把控行业脉络,明确职业定位,迅速适应企业岗位要求。已有学员在完成课程后,成功入职知名芯片企业,实现了职业的快速跃迁。

课程大纲:

NPU课程大纲0411-恢复的-恢复的_01

课程亮点:
1、全局把控:覆盖全产业链技能
AI算法基础:掌握AI算法核心,如算子、经典神经网络等,了解深度学习框架和大模型的开发、优化技巧,为后续芯片开发奠定理论基础。
芯片设计流程:涵盖数字芯片设计流程,包括前端设计、数字验证,体验从零到一的完整开发过程,掌握跨时钟域电路设计等关键技巧。
芯片后端实现:学习静态时序分析、布局布线等芯片后端设计核心内容,熟练使用相关工具,实现芯片从逻辑网表到物理实现的全过程。
2、理论+实战:无缝对接企业需求
真实流片项目贯穿:课程全程以实际NPU芯片项目为载体,每个阶段都有对应的项目实操,让学员在实践中掌握技能。
贴合企业标准:课程内容完全基于真实企业项目设计,所涉及的技术和流程与企业实际需求高度一致,确保学员入职后能立刻上手。
技能同步提升:在项目实操过程中,学员不仅能巩固理论知识,还能同步提升解决实际问题的能力,实现理论与实战的无缝对接。
3、职业适配:多岗位发展路径
AI算法工程师:通过课程学习,学员能够掌握AI算法的核心知识和开发技巧,具备成为AI算法工程师的能力,负责算法的研究和优化。
数字IC设计工程师:熟悉数字芯片设计流程和相关技术,能够独立完成芯片前端设计工作,成为数字芯片设计工程师,参与芯片的架构设计和电路实现。
数字IC验证工程师:学习系统级验证方法和工具,掌握芯片验证流程和技巧,可胜任验证工程师岗位,确保芯片功能的正确性和稳定性。
数字IC后端工程师:掌握芯片后端设计的核心技术,如静态时序分析、布局布线等,能够完成芯片的物理实现,成为后端工程师。

讲师介绍:
Paul老师:
背景:美国乔治梅森大学博士学位
经验:15年数字设计、架构工作经验
履历:曾就职于高通,担任架构工程师。对于AXI高性能设计、高级HDL设计、函数式编程、Serdes高性能设计、PCIe、低功耗设计有深入的理解,精通数字设计全流程设计。
Kevin老师:
背景:中国科学院大学硕士学位
经验:10年数字前端设计工作经验
履历:曾就职于中兴微电子研究院,担任专家级前端设计工程师。具有丰富的项目经验,长期从事模块设计、架构设计等工作。参与多款5G基站核心芯片的设计;对于前端设计、验证、时序优化以及功耗分析有深入的理解。
Bob老师:
背景:电子科技大学硕士学位
经验:10年数字前端设计、架构工作经验
履历:曾就职于英伟达,担任数字设计高级工程师。参与多款芯片的架构设计,对于数模混合设计、数字前端以及数字后端、综合STA、低功耗设计有深入的了解。
溪林老师:
背景:北京大学微电子硕士学位
经验:10年以上数字IC验证工作经验
履历:曾就职于华为,担任专家级验证工程师。获多项专利。负责IOC领域智能网卡芯片的验证工作,具有多款大型芯片成功流片经验。精通Fiber Channel协议,ARM AMBA总线协议,缓存空间管理实现;精通半导体功率器件设计流程,芯片工艺流程;精通Perl、VBA等脚本语言。
陈老师:
背景:西安交通大学硕士学位
经验:10年以上数字IC验证工作经验
履历:曾就职于华为海思,担任高级数字验证工程师。参与处理器-核心cache一致性验证工作以及PCIe Vip集成验证,负责AI芯片-卷积神经网络模块验证;精通Cache一致性验证、SoC验证、AI芯片验证、PCIe/AMBA等总线验证。
Nancy老师:
背景:西安电子科技大学微电子专业硕士
经验:10年以上数字IC验证工作经验
履历:曾就职于中兴通信、Intel,担任高级芯片验证工程师。负责基带处理芯片和手机芯片等验证工作,具有多款芯片成功流片经验,精通视频解码,音频处理等模块验证、SOC验证、USB和AMBA总线等验证,精通perl、python等脚本语言。
魏老师:
背景:西北大学硕士学位、西安电子科技大学企业导师
经验:20年以上的数字IC后端经验
履历:曾就职于英飞凌、航空航天研究所,担任专家级数字后端工程师。拥有丰富的7/5nm的流片经验。参与多款芯片的签核工作;对于后端时序收敛、逻辑综合、布局布线、物理验证有深入的研究,具有丰富的后端全流程设计经验。
唐老师:
背景:新西兰奥克兰大学集成电路硕士学位
经验:8年数字后端设计经验
履历:曾就职于微电子研究所、新思科技,担任高级数字后端设计工程师。负责ICC2的产品验证,负责EDA工具的评估以及流程设计开发。精通脚本语言,开发自动化脚本以提高IC设计流程效率。
小Y老师:
背景:西安电子科技大学集成电路设计博士学位
经验:10年数字后端设计经验
履历:曾就职于三星半导体,担任数字后端高级工程师。参与多个先进工艺的超大型数字芯片顶层STA工作,多个模块级物理全流程实现,涉及floorplan至route,以及时序签核、PV验证、LEC验证、PA验证。丰富的约束编写、时序分析能力。


64a79fba513ddab48351f2c5382994f9


Linux & EDA

  • 服务器登录

  • Linux常用命令及操作

  • SVN

  • 环境文件配置

  • 编辑器工作模式介绍

  • 一般模式下常用操作指令

  • 列操作

  • 底行命令模式常用指令

  • 常见问题解决

  • Vim/Gvim环境设置

  • .vimrc介绍

  • 芯片开发所需的环境

  • EDA工具简介

  • 脚本语言Makefile

  • 三步式编译仿真

  • 两步式编译仿真

  • Vcs的使用

  • Dve常用操作介绍

  • Verdi简介

  • 产生fsdb波形的三种方法

  • Verdi的使用

  • nTrace介绍

  • nWave介绍

  • nSchema介绍

Verilog

  • 概述与建模

  • 基本语法

  • 数据类型与运算符

  • 结构语句、赋值语句和块语句

  • 条件语句

  • 同步异步关系

  • 循环语句、模块的调用

  • 编译预处理语句

  • 任务和函数、系统任务

  • 状态机

同步FIFO

  • 同步FIFO的作用及组成

  • 常用的存储实体

  • FIFO的相关概念

  • 指针和地址

  • 同步FIFO设计框图

  • Counter

  • Pointer

  • TB代码

  • 异步处理的目的

  • 单比特信号的同步

  • 亚稳态问题

  • 脉冲展宽&同步握手的例子

  • FIFO的基本概念

  • 写指针&读指针

  • 空标志&满标志

  • 指针计数器的选择

  • 格雷码计数器

  • 二进制码和格雷码的相互转换

  • 异步FIFO设计框图

APB协议

  • APB协议介绍

  • APB协议应用场景

  • APB协议接口信号

  • APB状态机

  • APB协议时序

AI 与大模型基础

  • AI 的定义与核心问题(感知、决策、学习)

  • 大模型的演进路径(从 AlexNet 到 GPT-4)

  • 大模型的技术特点(参数规模、涌现能力、多模态)

  • 典型应用案例(图像生成、对话系统、代码开发)

NPU 概述

  • NPU 定义与核心功能(专用 AI 加速)

  • 对比 CPU/GPU/NPU 的架构差异(冯诺依曼 vs 数据流)

  • NPU 的关键技术(低功耗设计、稀疏计算支持)

  • 典型应用场景(边缘计算、自动驾驶、云端推理)

  • 行业动态(寒武纪、地平线等厂商技术路线)

LeNet 模型原理

  • 模型结构解析(卷积层→池化层→全连接层)

  • 特征提取机制(局部连接与权值共享)

  • 手写数字识别任务(MNIST 数据集特性)

  • 激活函数作用(Sigmoid/Tanh 的非线性表达)

  • 模型参数量与计算量分析(空间复杂度)

LeNet 算法详解

  • 前向传播数学推导(卷积核滑动计算)

  • 反向传播梯度计算(链式法则应用)

  • 优化算法对比(SGD vs Adam)

  • 损失函数设计(交叉熵的数学原理)

  • 过拟合解决方案(正则化、Dropout)

LeNet 训练实践

  • 数据预处理流程(归一化、增强)

  • 超参数调优策略(学习率、batch size)

  • 训练曲线分析(loss/accuracy 可视化)

  • 框架实践(PyTorch/TensorFlow 实现)

  • 模型保存与加载机制

推理基础与 LeNet 推理

  • 推理与训练的核心差异(精度 vs 速度)

  • 模型量化技术(FP32→INT8 原理)

  • 推理引擎工作流程(模型解析→图优化→执行)

  • LeNet 推理性能指标(延迟、吞吐量)

  • 端侧部署挑战(内存限制、实时性要求)

NPU 架构基础

  • 典型 NPU 架构分层(计算层、存储层、控制层)

  • 脉动阵列(Systolic Array)原理

  • 片上存储层级设计(寄存器→SRAM→DRAM)

  • 指令集架构(ISA)特点(融合操作、并行指令)

  • 能效比优化技术(动态电压频率调整)

LeNet 在 NPU 上的架构实现

  • 卷积层硬件映射(通道并行、batch 并行)

  • 池化层硬件加速(最大值 / 平均值计算)

  • 访存优化策略(权重复用、数据分块)

  • 控制流设计(任务调度与同步机制)

  • 典型实现案例(寒武纪 MLU 系列加速 LeNet

性能优化与调优

  • 性能分析工具链(Profiler、仿真器)

  • 计算密集型优化(卷积核分块)

  • 访存密集型优化(缓存命中率提升)

  • 稀疏化与剪枝技术(非结构化稀疏)

  • 多任务并行调度策略

开发环境及数字芯片基本知识

  • 课程引言

  • 芯片设计流程

  • 数字设计基本思想

  • 基本开发环境演示

  • 跨时钟域的同步电路设计

接口模块介绍

  • AHB/APB接口模块原理

  • AHB/APB接口模块仿真环境及答疑

  • AXI协议介绍

  • AXI接口模块仿真环境及答疑

NPU模块详解

  • NPU基本概念

  • NPU项目背景

  • npu设计说明

  • npu模块Spec解读

  • npu仿真环境和IPA IR数据产生

  • npu APB Config

  • npu Bring-Up

  • ctrl模块 -- Data-flow and Diagram

  • conv模块 -- Ctrl-Flow of data_cache_ctrl

  • relu模块 -- Ctrl-Flow of data_cache_wr

  • FC模块 -- Update to 4bit AWLEN

  • 权重存储模块 -- Data-Flow and Ctrl-Flow

SystemVerilog

  • 数据类型

  • 过程语句和子程序

  • 接口和接口的驱动采样

  • 类的封装、继承、多态

  • 虚接口

  • 随机化、约束的种类

  • 线程的使用

  • 线程间的通信

UVM

  • Factory

  • Sequencer

  • Driver_Monitor

  • Scoreboard

  • Agent、Env、Test

  • Phase_objection

  • Transaction

  • Sequence、do

  • Config_db

  • Message

  • Event pool

  • RAL

  • TLM

理解DUT

  • 验证需求分析

  • 了解NPU主要功能

  • 熟悉接口信号

  • 熟悉配置总线方法

NPU功能验证点分析

  • 原始图像数据源验证

  • 权重参数配置验证

  • NPU各阶段验证(包含conv,relu,max_pooling,fc,权重搬移等)

  • 不同模式的识别验证

制定验证策略

  • 介绍验证思路

  • 受约束的随机测试用例

  • 动态仿真比对机制

  • UVM验证方法学的实际应用

搭建验证环境

  • 构建验证环境

  • 集成各个agent和scoreboard

执行验证并收集覆盖率

  • 编写不同验证case

  • 运行验证流程

  • 了解不同覆盖率指标

  • 评估验证完备性

  • 收集覆盖率并分析结果

Timing path

  • timing path延时构成以及延时计算

时序约束

  • 时序约束的基本组成内容以及相关指令

时序分析

  • 时序分析及修复的基本方法

Init_design

  • 后端实现环境搭建所需要的文件,包括门级网表、sdc、lib、lef、qrctechfile、MMMC文件等

Floorplan

  • FloorPlan布局规划

  • macro及IO pad摆放注意事项

  • 电源网络搭建

  • physical cell

Place

  • place流程和基本原理

  • place相关优化方法

CTS

  • CTS流程和基本原理

  • CTS相关参数设置

  • CTS相关约束的作用

Route&Postroute

  • Route流程以及Route过程中相关option的设置

  • PostRoute相关优化策略

Signoff

  • Innovus的输出文件

  • PV验证

逻辑综合

  • 环境配置

  • 时序约束

  • 优化策略

  • 文件输出

Init design

  • 读入网表

  • 配置库文件

  • 准备SDC文件

  • 编写MMMC文件

Floorplan

  • 模块面积规划

  • Macro布局规划

  • IO位置规划

  • 电源网络规划

Place

  • Std cell摆放要求

  • Placement结果分析

  • TieHi、TieLo单元介绍

CTS

  • 时钟树单元选型

  • 时钟树约束设置

  • 时钟树优化目标

  • 时钟树结果分析

Route

  • 布线参数配置

  • Route结果分析

  • 物理规则检查

Postroute

  • 时序信息优化

  • DFM设计介绍

  • 输出结果文件

等价性验证

  • 等价性验证介绍

  • 功能一致性对比

寄生参数提取

  • RC参数提取流程

  • Spef文件输出

Timing ECO

  • 静态时序分析

  • 时序违例修复

PV

  • 物理验证

×