打造IC人才
科技生态圈

2023年中国AI芯片行业市场现状及未来发展趋势预测

发布时间:2023-05-19

来源:芯天下

2023年AI芯片报告汇总了60家国产AI芯片厂商,大致按如下应用类别进行归类:云端加速、智能驾驶、智能安防、智能家居、智能穿戴、其它AIoT。对于每一家筛选的公司,我们从主要产品、核心技术、应用场景、市场竞争力、发展里程碑等方面对公司进行全方位画像分析。

AI芯片报告概要

作为AspenCore Fabless100系列行业分析报告的一部分,2023年AI芯片报告在2022年《45家国产AI芯片厂商调研分析报告》基础上,汇总了60家国产AI芯片厂商,大致按如下应用类别进行归类:云端加速、智能驾驶、智能安防、智能家居、智能穿戴、其它AIoT。对于每一家筛选的公司,我们从主要产品、核心技术、应用场景、市场竞争力、发展里程碑等方面对公司进行全方位画像分析。

我们首先对“存算一体”技术及其对AI芯片未来发展带来的影响进行了简要阐述,然后分别对三大AI应用场景(云端加速、智能驾驶、边缘计算)进行了市场趋势概括。本届报告的内容大纲安排如下:

存算一体AI芯片及技术趋势

本部分内容涉及“存算一体”冲破能耗墙、Chiplet和2.5D/3D堆叠先进封装、ReRAM材料/工艺和AI应用潜力,以及存算一体+Chiplet助力AI算力第二增长曲线等内容。详细阅读请点击上面的链接。



AI应用:云端加速

ChatGPT等大语言模型(LLM)的AI模型训练需要大量并行处理能力,目前最适合的芯片还是GPU,比如英伟达H100和A100。尽管GPU价格昂贵且功耗极大(采用TSMC 4nm工艺的H100 GPU SXM加速卡功耗高达700W),但微软和谷歌等互联网巨头为了赢得AI竞赛仍大量购买,预计英伟达GPU的这种强劲需求势头仍将持续下去。

除了英伟达GPU外,目前能够提供云端训练和推理加速芯片的独立厂商及产品还有壁仞科技BR100系列、高通Cloud AI 100、墨芯智能英腾处理器(ANTOUM)、燧原科技邃思2.0/2.5、瀚博半导体SV100、寒武纪思元370、鲲云科技CAISA数据流推理AI芯片等。

以国内AI芯片初创公司墨芯为例,在最近的MLPerf评测中,墨芯凭借软硬协同的稀疏计算技术在ResNet50模型上蝉联冠军。其 S40计算卡以127,375 FPS获得单卡算力全球第一;S30计算卡以383,520 FPS算力获整机4卡算力全球第一。墨芯AI计算卡系列是基于其稀疏计算AI芯片12nm Antoum,性能超越了4nm工艺的GPU,展现出稀疏计算的强大优势。

基于双稀疏化算法技术和独特AI芯片架构的Antoum芯片针对云端AI推理场景,可支持高达32倍稀疏率。Antoum是一款高性能通用可编程芯片,可支持CNN、RNN、LSTM、Transformer、BERT等网络模型和浮点、定点丰富的数据类型。墨芯人工智能AI加速卡基于Antoum芯片,通过优化计算模式,可支持全面稀疏化神经网络开发,是一种高算力、低功耗的通用AI推理加速卡。

稀疏计算能够为AI大模型带来数十倍的加速性能,也许是GPU之外云端加速的一条“软硬协同”新途径。而前面提到的“存算一体”可能是另外一条迎接大模型挑战的“硬件”途径,国产AI芯片初创公司亿铸科技正在研发的基于ReRAM的全数字化存算一体AI大算力芯片及加速卡,仅用75W的功耗即可实现500T的算力。

AI应用:智能驾驶

伴随着汽车的智能化,汽车E/E架构正从传统的ECU为主转向域控制器,计算架构设计也从分布式逐渐转向集中式中央处理器。我们目前正处于从过去的分布式EE架构迈向域集中式EE架构的转变过程中,预计到2025年左右就会完成这一转变。此后将开启跨域融合,也就是转变为“中央+区域”(Central & Zonal)计算的EE架构时代。

汽车逐渐转变为像手机和电脑一样的联网通信和计算设备,但对计算处理能力的实时性和可靠性要求更高,因为汽车的运行环境更为复杂且安全性要求更为苛刻。针对L2及以上级别智能驾驶的AI芯片主要面向三个细分领域:辅助驾驶ADAS、智能座舱、自动驾驶。

ADAS

ADAS(高级辅助驾驶系统)通常包括导航与实时交通系统TMC、电子警察系统ISA、自适应巡航ACC、车道偏移报警系统LDWS、车道保持系统、碰撞避免或预碰撞系统、夜视系统、自适应灯光控制、行人保护系统、自动泊车系统、交通标志识别、盲点探测,驾驶员疲劳探测、下坡控制系统和电动汽车报警系统等。

而随着汽车功能越来越复杂,支持系统的芯片本身也变得越来越复杂,ADAS已不再是单独的域控制器,已经被整合和定义成为复杂的SoC了,多核心实时响应已经成为标配。AEB、LKA等功能都需要强大的视觉算法加持,利用激光雷达和传统雷达以及视觉融合等多种传感器的复杂算法更需要性能强大的芯片支持,很多SoC已经采用14nm甚至7nm的工艺节点。

从芯片设计的角度来说,现在ADAS处理器芯片面临的主要挑战包括:车规级标准,如ISO26262,要求达到ASIL-B甚至ASIL-D级别;多传感器融合的处理需要更高的芯片性能和带宽,以达到快速数据处理和传输吞吐率要求;增加硬件的深度学习设计,如何做好软硬件协同,以及适应快速发展的AI计算模型。

传统汽车芯片厂商如NXP、英飞凌、瑞萨、ST和TI等,都有各自的ADAS芯片和系统应用解决方案。而靠ADAS和自动驾驶芯片起家的Mobileye在这一市场也已经占据重要地位。国内汽车智能驾驶芯片开发商如地平线、黑芝麻智能、芯驰科技,以及四维图新旗下的杰发科技也都在ADAS领域提供了具有竞争力的芯片产品和ADAS应用方案。

智能座舱

单芯片方案实现智能座舱类似于座舱域控制器的方案,可以精简座舱处理器布局,降低成本。智能座舱单芯片方案要能够处理多块高清屏的显示、HUD、摄像头输入、语音及手势交互等设备,因此芯片厂商需要具备一定的技术积淀才能够研发类似的一体化芯片方案。

随着客户需求的多样化与技术的进步,以多模交互为核心的智能座舱正成为汽车行业技术发展的一大趋势。其中,在视觉识别和语音处理等交互技术的高度整合需求下,基于AI芯片的独立感知层将成为实现多模交互、推动智能座舱高速发展的关键驱动力。

未来座舱系统将变得非常复杂,不仅需要芯片方案,也需要相应的算法支持。芯片通过输出计算能力来支持操作系统、ADAS等软件的运行,未来智能座舱所代表的“车载信息娱乐系统+流媒体后视镜+抬头显示系统+全液晶仪表+车联网系统+车内乘员监控系统”等融合体验,都依赖于芯片计算能力的提升。同时具备芯片研发和相应的软件及算法开发能力的公司,在激烈的市场角逐中将更有竞争力。

以高通为代表的国际芯片厂商提供的智能座舱芯片和系统解决方案已经在很多国产汽车型号上采用。国产智能汽车AI芯片初创公司芯擎科技发布的多媒体智能座舱芯片“龍鷹一号”已经上车领克汽车旗下新能源中型SUV -- 领克08。这款型号为SE1000的智能座舱芯片采用7nm工艺,拥有8核CPU、14核GPU,以及8 TOPS AI算力的独立NPU。其强大的音视频处理能力最多可支持7屏高清画面输出和12路视频信号接入,并配备了双HiFi 5 DSP处理器。此外,该芯片具备高安全等级的“安全岛”设计,满足ISO26262车规认证,专业的硬件加/解密引擎为车载应用提供了安全性保证。

自动驾驶

自动驾驶从L0到L5级别,随着功能的完善和性能的提升,在带来更好智能体验的同时,也对AI芯片的算力和性能提出更高的要求。L2(ADAS)需要的AI计算力小于10TOPS;L3的AI计算力为30~60TOPS;L4的AI计算力>100TOPS;L5需要的AI计算力为500-1000TOPS。要承担环境感知、多传感器融合及深度学习算法等超大算力需求的AI处理芯片通常采用GPU或DSA专用芯片,如英伟达的Orin GPU、地平线征程J5等。

NVIDIA DRIVE Orin SoC可提供254 TOPS性能,为自动驾驶、置信视图、数字集群以及 AI 驾驶舱提供动力支持。借助可扩展的 DRIVE Orin平台,开发者可从 L2+ 级系统一路升级至 L5 级全自动驾驶汽车系统。Orin SoC采用7纳米工艺,由Ampere架构GPU、ARM Hercules CPU、第二代深度学习加速器DLA、第二代视觉加速器PVA、视频编解码器、宽动态范围的ISP组成,同时引入了车规级的安全岛Safety Island设计。Orin支持204GB/s的内存带宽和最高64GB的DRAM,高速I/O接口与上一代Xavier SoC的接口兼容,可实现275TOPS的INT8算力(是Xavier的7倍),功耗为55W。

地平线发布的高性能大算力车载智能芯片征程5是其第三代车规级产品,遵循 ISO 26262 功能安全认证流程开发,并已经通过ASIL-B 认证。该芯片基于地平线BPU贝叶斯架构设计,可提供高达128TOPS算力;外部接口丰富,可接入超过16路高清视频输入;适用于先进图像感知算法加速,还可支持激光雷达、毫米波雷达等多传感器融合;支持预测规划以及H.265/JPEG实时编解码。

基于自研计算平台与产品矩阵,目前地平线已支持 L2、L3、L4 等不同级别自动驾驶的解决方案。在智能驾驶领域,地平线同全球四大汽车市场(美国、德国、日本和中国)的业务联系不断加深,目前达成合作的车厂及Tier1包括奥迪、博世、长安、比亚迪、上汽、广汽、长城、理想等。

另外一家国产智能驾驶AI芯片公司后摩智能最新发布的鸿途H30芯片基于SRAM 存储介质,采用数字存算一体架构,拥有极低的访存功耗和超高的计算密度。该芯片基于 12nm 工艺,在 Int8 数据精度下可实现高达 256TOPS 的物理算力,所需功耗不超过 35W,整个 SoC 能效比达到了 7.3Tops/W。为了更好地实现车规级功能,后摩智能基于鸿途H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。后摩鸿途H30芯片适用于面向商用车L4级别及乘用车L2++级别的智能驾驶解决方案。配合其力驭域控制器硬件及软件算法参考设计,可为商用车运营商在垂直交通应用场景下提供L4级自动驾驶整体方案。

AI应用:边缘计算

相对于云端加速和智能驾驶应用,面向边缘计算和端侧应用场景的AI芯片一般更加强调低功耗和高效能,因为在这类应用中部署的计算设备数量庞大,分布广泛(从边缘网关到终端),而且很多端侧设备都是采用电池供电,对功耗要求特别严格。这类应用包括智能手机/平板电脑、智能安防、智能家居、智能穿戴,以及智慧城市、工业物联网、智慧农业及智慧医疗等。

据Deloitte和Statista预测统计,边缘和端侧AI芯片按不同应用设备的出货量对比如下。智能手机集成的AI芯片出货量最大,将从2020年的5亿颗增加到2024年10亿颗;平板电脑、智能音箱和可穿戴设备也都有不同程度的增长;企业边缘设备的增长率最高,从2020年5000万颗增至2024年的2.5亿颗。

边缘/端侧AI芯片特性

面向边缘和端侧AI计算的AI芯片具有如下特点:

边缘计算AI芯片的技术发展趋势主要表现在三个方面:

除了硬件设计的改变,深度学习框架也在发生变化。许多框架开始加入对边缘计算的支持,如PyTorch、TensorFlow、Caffe等。这些框架不仅可以支持边缘设备上的深度学习推断,还提供了对多种边缘计算平台的原生支持,如FPGA、ASIC等。

边缘AI应用场景

除了智能手机和平板电脑、企业计算和通信网络、智能驾驶/ADAS外,边缘AI应用场景还包括:

边缘AI应用场景还包括智慧城市(智能交通、智慧杆和市政智能电/水/气表网络等)、智慧农业(养/种殖、食品安全溯源防伪、环保生态旅游),以及智慧医疗(智能医疗设备、远程医疗、医疗大数据分析)等。

边缘AI市场竞争

边缘和端侧AI芯片的研发投入和下游应用设计导入相对云端训练和推理AI芯片来说门槛较低,因此竞争也更为激烈。一方面,国际芯片巨头看到边缘计算的应用前景纷纷进入这一市场,国际厂商包括英特尔、AMD、英伟达、高通、联发科、博通、TI、ST、瑞萨、英飞凌、Microchip和NXP等。另一方面,AI的兴起也推动着风投和初创公司加入边缘和终端AI芯片的角逐,这一领域比较知名的初创公司包括Hailo、Anari、Groq、Gyrfalcon、Kalray、Mythic、Zero ASIC(Adapteva)等。

在边缘AI芯片领域,国内初创公司跟国外厂商基本处于同一起跑线上,在融资和市场竞争方面甚至更为激烈。在我们汇总整理的60家AI芯片厂商中,大部分都是面向边缘和端侧AI应用场景的,比如华为海思、紫光展锐、地平线、亿智电子、爱芯元智、北京君正、瑞芯微、全志科技和云天励飞等。

2023 Fabless 100排行榜之Top 10 AI芯片公司

由AspenCore分析师团队根据量化数学模型、企业公开信息、厂商调查问卷,以及一手访谈资料,精心筛选出中国IC设计行业综合实力和增长潜力最强的公司。这些公司按照类别划分(每家公司仅归入一个类别),每个类别评选出Top 10。在60多家国产AI芯片公司中,我们从企业融资、技术创新、产品出货量及市场竞争力等方面筛选出10家最具实力和增长潜力的Top 10 AI芯片公司。



入选公司基本信息(只有寒武纪一家上市公司,其它入选公司都没有综合指数):



Top 60国产AI芯片厂商信息汇总

在我们挑选的这60家国产AI芯片公司中,属于云端加速应用类别的有22家;智能安防14家;智能驾驶11家;智能穿戴6家;智能家居5家;其它AIoT类别2家。

从公司总部所在城市来看,位于上海的有18家;北京16家;深圳6家;杭州5家;南京2家;珠海2家;成都2家;江苏省2家;福建省2家;湖北、安徽、重庆、广州和苏州各1家。

从公司成立年份来看,2016年及以前成立的有20家;2017年成立的7家;2018年成立的14家;2019年成立的6家;2020年成立的8家;2021年成立的4家;2022年成立的有1家。



60家国产AI芯片厂商详细介绍

亿铸科技

爱芯元智

地平线

瀚博半导体

寒武纪

黑芝麻智能

后摩智能

墨芯人工智能

清微智能

燧原科技

天数智芯

芯驰科技

芯擎科技

亿智电子

知存科技

相关推荐:

数字IC设计职位经典笔/面试题(一)

龙芯自研:国产芯片的新引擎

国产EDA软件是什么水平,发展前景怎么样

推荐阅读

换一换