书签分享收藏举报版权申诉 / 122

立即下载加入VIP,免费下载

当前位置：首页 > PPT模板 > 动物植物 > GPU行业深度报告：AI产业化再加速智能大时代已开启-华金证券-2023.3.26.pdf

GPU行业深度报告：AI产业化再加速智能大时代已开启-华金证券-2023.3.26.pdf

文档编号：18632328
上传时间：2023-08-23
格式：PDF
页数：122
大小：6.88MB

《GPU行业深度报告：AI产业化再加速智能大时代已开启-华金证券-2023.3.26.pdf》由会员分享，可在线阅读，更多相关《GPU行业深度报告：AI产业化再加速智能大时代已开启-华金证券-2023.3.26.pdf（122页珍藏版）》请在冰点文库上搜索。

GPU行业深度报告：AI产业化再加速智能大时代已开启-华金证券-2023.3.26.pdf

证证券研究券研究报报告告本报告仅供华金证券客户中的专业投资者参考本报告仅供华金证券客户中的专业投资者参考请请仔仔细细阅阅读读在在本本报报告告尾部尾部的的重重要要法法律律声声明明AIAI产业化再加速，智能大时代已开启产业化再加速，智能大时代已开启GPUGPU行业深度报告行业深度报告半导体半导体行业评级：

领先大市行业评级：

领先大市-A-A孙远峰/王臣复/王海维SAC执业证书编号：

S0910522120001/S0910523020006/S0910523020005华金证券电子团队华金证券电子团队走进走进“芯芯”时代系列深度之六十时代系列深度之六十“AIAI算力算力GPUGPU”2023年3月26日请仔细阅读在本报告尾部的重要法律声明核心观点（核心观点

（1）在芯片算力快速提升、日趋庞大的数据量共同支撑下，在芯片算力快速提升、日趋庞大的数据量共同支撑下，AIAI算法迭代升级加速算法迭代升级加速。

AI的发展经历了很长时间的积累，其能不断跨越科学与应用之间的鸿沟主要得益于技术突破、行业落地、产业协作等多方面的推动，而技术突破是其中最为关键的要素。

从起步阶段发展到当下深度学习阶段，算法、数据和算力构成了AI三大基本要素，并共同推动AI向更高层次的感知和认知发展。

算法方面，目前深度学习仍然是AI技术发展的主导路线，但是早期所使用的有监督学习方式由于受限于对大量标注数据依赖与理解能力缺乏，而且模型通用性较差，正逐步被新的技术所取代，在芯片算力的快速提升、日益庞大的数据量这两者的支撑下，新算法正处于加速迭代升级过程中。

自监督学习的算法模型快速发展，自监督学习的算法模型快速发展，“预训练预训练+精调精调”的开发范式迈向成熟，新一轮的开发范式迈向成熟，新一轮AIAI技术产业化之路开启。

技术产业化之路开启。

谷歌、脸书等多家企业先后发布使用自监督学习的算法模型，通过挖掘无标注数据的监督信息，减少人为干预。

现阶段自监督学习本质上仍依赖规范化、标签化的数据，主要借助预训练模型构筑并学习数据特征。

“预训练”的做法一般是将大量低成本收集的训练数据放在一起，经过某种预训方法去学习其中的共性，然后将其中的共性“移植”到特定任务的模型中，再使用相关特定领域的少量标注数据进行“微调”，这样的话，模型只需要从“共性”出发，去“学习”该特定任务的“特殊”部分即可。

预训练模型成功的关键是自监督学习与Transformer的结合。

预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性，用户基于大模型通过零样本、小样本学习即可获得领先的效果，同时“预训练+精调”等开发范式，让研发过程更加标准化，显著降低了人工智能应用门槛。

整体上来看，关于本轮AI技术突破所带来的产业化变局，我们有三个核心观点：

1、基于GPT为代表的大模型AI的通用能力，未来几年大模型AI的渗透广度、深度和速度有可能会超预期；2、ChatGPT采用的是闭源模型，其加速的产业落地会刺激更多的厂商加大大模型AI的研发投入，进而推动AI产业化发展；3、大模型AI通用能力的提升，带动的将不仅仅是云计算市场的增长，伴随着多种技术与商业化路径的逐步成熟，云、边缘、端的增量市场空间均有望渐次打开。

请仔细阅读在本报告尾部的重要法律声明核心观点（核心观点

（2）云端计算进入高性能计算时代云端计算进入高性能计算时代，大模型训练大模型训练仍以仍以GPUGPU为主为主。

虽然AI芯片目前看有GPU、ASIC、CPU、FPGA等几大类，但是基于几点原因，我们判断GPU仍将是训练模型的主流硬件：

1、Transformer架构是最近几年的主流，该架构最大的特点之一就是能够利用分布式GPU进行并行训练，提升模型训练效率；2、ASIC的算力与功耗虽然看似有优势，但考虑到AI算法还是处于一个不断发展演进的过程，用专用芯片部署会面临着未来算法更迭导致芯片不适配的巨大风险；3、英伟达强大的芯片支撑、生态、算法开源支持。

模型小型化技术逐步成熟，从训练走向推理，云、边、端全维度发展。

我们认为至少有四大投资主线应持续关注：

1、GPU方面，在英伟达的推动下，其从最初的显卡发展到如今的高性能并行计算，海外大厂已经具备了超过20年的技术、资本、生态、人才等储备，形成了大量的核心技术专利，而且也能充分享有全球半导体产业链的支撑，这都或是目前国内厂商所缺失的。

近几年在资本的推动下，国内涌现出数十家GPU厂商，各自或都具备一定的发展基础，但整体经营时间较短，无论从技术积淀、产品料号布局、高端料号性能来说，与国外大厂仍具备较大差距。

但国产化势在必行，国内相关产业链重点环节也积极对上游芯片原厂进行扶持，国产算力芯片需要不断迭代以实现性能的向上提升，后续持续关注相关厂商料号升级、生态建设和客户突破；2、AI在端侧设备应用普及是大势所趋，目前，知识蒸馏、剪枝、量化等模型小型化技术在逐步成熟，AI在云、边、端全方位发展的时代已至。

除了更加广泛的应用带来需求量的提升外，更复杂算法带来更大算力的需求也将从另一个维度推动市场扩容；3、数据的高吞吐量需要大带宽的传输支持，光通信技术作为算力产业发展的支撑底座，具备长期投资价值；4、Chiplet技术可以突破单一芯片的性能和良率等瓶颈，降低芯片设计的复杂度和成本。

基于向Chiplet模式的设计转型，已经是大型芯片厂商的共识，相关产业链具备长期投资价值。

建议关注：

瑞芯微瑞芯微、晶晨股份、星宸科技（待上市）、全志科技、北京君正、中科蓝讯、富瀚微、恒玄科技晶晨股份、星宸科技（待上市）、全志科技、北京君正、中科蓝讯、富瀚微、恒玄科技风险提示：

技术创新风险、宏观经济和行业波动风险、国际贸易摩擦风险风险提示：

技术创新风险、宏观经济和行业波动风险、国际贸易摩擦风险。

请仔细阅读在本报告尾部的重要法律声明总目录总目录0102040305由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑产业化路径显现，全球产业化路径显现，全球AIAI竞赛再加速竞赛再加速全维智能化大时代，国产算力行则必至全维智能化大时代，国产算力行则必至建议关注建议关注产业相关产业相关06风险提示风险提示请仔细阅读在本报告尾部的重要法律声明分目录（分目录

（1）1.11.1什么是什么是GPUGPU1.21.2始于图形处理设备始于图形处理设备1.31.3浮点计算能力与可编程性结合浮点计算能力与可编程性结合1.4GPU1.4GPU发展三大方向发展三大方向1.51.5英传达显卡发展历程英传达显卡发展历程1.6GeForceRTX401.6GeForceRTX40系列，时代最强系列，时代最强1.71.7英特尔的核显英特尔的核显1.81.8核显与独显性能对比核显与独显性能对比1.91.9图形流水线是图形流水线是GPUGPU工作的通用模型工作的通用模型1.101.10统一渲染架构的推出开启了通用计算大时代统一渲染架构的推出开启了通用计算大时代1.111.11从简单到越来越复杂的流水线从简单到越来越复杂的流水线1.121.12光线追踪时代开启光线追踪时代开启1.131.13光线追踪算法要求的计算量巨大光线追踪算法要求的计算量巨大01由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑1.141.14走向新场景的走向新场景的GPGPUGPGPU1.15GPU1.15GPU与与GPGPUGPGPU的对比的对比1.16GPGPU1.16GPGPU与与CPUCPU的对比的对比1.171.17并行计算发展的核心并行计算发展的核心1.18SIMT1.18SIMT，主流，主流GPUGPU的系统架构核心的系统架构核心1.19GPGPU1.19GPGPU架构，以架构，以A100A100为例为例1.20Fermi1.20Fermi是第一个完整的是第一个完整的GPUGPU计算架构计算架构1.211.21通用算力提升是英伟达通用算力提升是英伟达GPUGPU架构演进的重点之一架构演进的重点之一1.221.22多方面构建的高壁垒多方面构建的高壁垒1.231.23人才与研发投入，以英伟达为例人才与研发投入，以英伟达为例1.241.24国外厂商多年间构筑了庞大的专利池国外厂商多年间构筑了庞大的专利池1.251.25英伟达全栈布局构筑强大生态英伟达全栈布局构筑强大生态1.261.26走向异构，海外厂商横向布局不断走向异构，海外厂商横向布局不断请仔细阅读在本报告尾部的重要法律声明分目录（分目录

（2）2.1AI2.1AI技术赋能实体经济面临的瓶颈技术赋能实体经济面临的瓶颈2.22.2ChatGPTChatGPT的破圈的破圈2.32.3ChatGPTChatGPT的成功离不开预训练大模型的成功离不开预训练大模型2.42.4预训练模型的发展历程预训练模型的发展历程2.5Transformer2.5Transformer架构成主流架构成主流2.62.6自监督学习与自监督学习与TransformerTransformer的结合的结合2.72.7大模型的突现能力大模型的突现能力2.82.8参数量爆发式增长的参数量爆发式增长的ChatGPTChatGPT2.92.9预训练大模型，第三波预训练大模型，第三波AIAI发展的重大拐点发展的重大拐点2.102.10生成式生成式AIAI、边缘、边缘AIAI技术即将步入成熟期技术即将步入成熟期2.112.11大模型是大算力和强算法结合的产物大模型是大算力和强算法结合的产物2.12AI2.12AI芯片三剑客芯片三剑客2.132.13训练端训练端GPUGPU担纲担纲产业化路径显现，全球产业化路径显现，全球AIAI竞赛再加速竞赛再加速2.142.14数据中心迈入数据中心迈入“高算力高算力”时代，兵家必争时代，兵家必争2.152.15英伟达数据中心业务快速增长英伟达数据中心业务快速增长2.162.16自动驾驶研发两大商业路线自动驾驶研发两大商业路线2.172.17自动驾驶实现的两种技术路线自动驾驶实现的两种技术路线2.182.18单车智能化推动算力升级加速单车智能化推动算力升级加速2.192.19自动驾驶具备广阔市场前景自动驾驶具备广阔市场前景02请仔细阅读在本报告尾部的重要法律声明分目录（分目录（3）3.13.1全球数据中心负载任务量快速增长全球数据中心负载任务量快速增长3.23.2全球计算产业投资空间巨大全球计算产业投资空间巨大3.33.3预训练大模型对于预训练大模型对于GPUGPU的需求的需求3.43.4国内市场需求将保持高增长国内市场需求将保持高增长3.53.5云计算及云部署方式云计算及云部署方式3.63.6不同云部署方式的市场占比不同云部署方式的市场占比3.73.7企业上云持续向细分行业渗透企业上云持续向细分行业渗透3.83.8从从“资源上云资源上云”迈入迈入“深度用云深度用云”3.93.9信创从试点走向推广信创从试点走向推广3.103.10公有云主要参与厂商公有云主要参与厂商3.113.11云计算产业链云计算产业链3.123.12集成显卡与独立显卡市场份额集成显卡与独立显卡市场份额3.133.13独立显卡英伟达一家独大独立显卡英伟达一家独大3.143.14性能强大的性能强大的H100H1003.153.15国产厂商两条发展路径：

国产厂商两条发展路径：

GPUGPU和和GPGPUGPGPU03全维智能化大时代，国产算力行则必至全维智能化大时代，国产算力行则必至3.163.16先求有，再求好先求有，再求好3.173.17生态先兼容主流，未来将走向自建生态先兼容主流，未来将走向自建3.183.18国产之路已开启，部分国产国产之路已开启，部分国产GPUGPU设计厂商列表设计厂商列表3.19GPU3.19GPU发展离不开全球产业链的支撑发展离不开全球产业链的支撑3.203.20制程升级对于算力芯片性能提升具有较高贡献度制程升级对于算力芯片性能提升具有较高贡献度3.213.21摩尔定律发展趋缓摩尔定律发展趋缓3.223.22ChipletChiplet技术潜力大技术潜力大3.233.23ChipletChiplet技术发展历程技术发展历程3.243.24行业巨头推动，产业加速落地行业巨头推动，产业加速落地3.253.25采用采用ChipletChiplet技术的产品不断出现技术的产品不断出现3.263.26算力两大演进方向：

更大算力算力两大演进方向：

更大算力&更多样化应用更多样化应用3.273.27存量替代与增量成长并存存量替代与增量成长并存3.283.28高吞吐量离不开高速传输高吞吐量离不开高速传输3.293.29光通信前景可期光通信前景可期请仔细阅读在本报告尾部的重要法律声明分目录（分目录（4）4.14.1瑞芯微瑞芯微4.24.2晶晨股份晶晨股份4.34.3星宸科技（待上市）星宸科技（待上市）4.44.4全志科技全志科技4.54.5北京君正北京君正4.64.6中科蓝讯中科蓝讯4.74.7富瀚微富瀚微4.84.8恒玄科技恒玄科技建议关注建议关注5.15.1海光信息海光信息5.25.2龙芯中科龙芯中科5.35.3景嘉微景嘉微5.45.4寒武纪寒武纪-U-U5.55.5中芯国际中芯国际5.65.6芯原股份芯原股份-U-U5.75.7华大九天华大九天5.85.8概伦电子概伦电子5.95.9长电科技长电科技5.105.10华天科技华天科技5.115.11通富微电通富微电5.125.12炬芯科技炬芯科技5.135.13源杰科技源杰科技5.145.14光迅科技光迅科技5.155.15摩尔线程（未上市）摩尔线程（未上市）0405产业相关产业相关06风险提示风险提示技术创新风险技术创新风险宏观经济和行业波动风险宏观经济和行业波动风险国际贸易摩擦风险国际贸易摩擦风险请仔细阅读在本报告尾部的重要法律声明目录目录0105由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑06风险提示风险提示1.11.1什么是什么是GPUGPU1.21.2始于图形处理设备始于图形处理设备1.31.3浮点计算能力与可编程性结合浮点计算能力与可编程性结合1.4GPU1.4GPU发展三大方向发展三大方向1.51.5英传达显卡发展历程英传达显卡发展历程1.6GeForceRTX401.6GeForceRTX40系列，时代最强系列，时代最强1.71.7英特尔的核显英特尔的核显1.81.8核显与独显性能对比核显与独显性能对比1.91.9图形流水线是图形流水线是GPUGPU工作的通用模型工作的通用模型01020304产业相关产业相关建议关注建议关注全维智能化大时代，国产算力行则必至全维智能化大时代，国产算力行则必至产业化路径显现，全球产业化路径显现，全球AIAI竞赛再加速竞赛再加速1.101.10统一渲染架构的推出开启了通用计算大时代统一渲染架构的推出开启了通用计算大时代1.111.11从简单到越来越复杂的流水线从简单到越来越复杂的流水线1.121.12光线追踪时代开启光线追踪时代开启1.131.13光线追踪算法要求的计算量巨大光线追踪算法要求的计算量巨大1.141.14走向新场景的走向新场景的GPGPUGPGPU1.15GPU1.15GPU与与GPGPUGPGPU的对比的对比1.16GPGPU1.16GPGPU与与CPUCPU的对比的对比1.171.17并行计算发展的核心并行计算发展的核心1.18SIMT1.18SIMT，主流，主流GPUGPU的系统架构核心的系统架构核心1.19GPGPU1.19GPGPU架构，以架构，以A100A100为例为例1.20Fermi1.20Fermi是第一个完整的是第一个完整的GPUGPU计算架构计算架构1.211.21通用算力提升是英伟达通用算力提升是英伟达GPUGPU架构演进的重点之一架构演进的重点之一1.221.22多方面构建的高壁垒多方面构建的高壁垒1.231.23人才与研发投入，以英伟达为例人才与研发投入，以英伟达为例1.241.24国外厂商多年间构筑了庞大的专利池国外厂商多年间构筑了庞大的专利池1.251.25英伟达全栈布局构筑强大生态英伟达全栈布局构筑强大生态1.261.26走向异构，海外厂商横向布局不断走向异构，海外厂商横向布局不断请仔细阅读在本报告尾部的重要法律声明1.1.由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑1.11.1什么是什么是GPUGPU图形处理器（graphicsprocessingunit，缩写：

GPU），又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上做图像和图形相关运算工作的微处理器。

NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。

从此NVIDIA显卡的芯片就用这个新名字GPU来称呼。

GPU使显卡削减了对CPU的依赖，并执行部分原本CPU的工作，尤其是在3D图形处理时。

SOCSOC中的中的GPUGPU模块模块GPUGPU与显卡与显卡资料来源：

痞客邦，华金证券研究所资料来源：

痞客邦，华金证券研究所请仔细阅读在本报告尾部的重要法律声明1.1.由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑最早计算机是黑白显示的时代，机器对于显示的要求极低，随着计算机的普及和软件的多样化，使用者对于显示的要求越来越高。

VGA（VideoGraphicsArray，视频图形阵列）是一种标准的显示接口，是IBM于1987年提出的一个使用模拟信号的电脑显示标准。

VGA标准由于可以呈现的彩色显示能力大大加强，因此迅速成为了显示设备的标准，也推动了VGACard也即是显卡的诞生。

早期的VGACard的唯一功能是输出图像，图形运算全部依赖CPU，当微软Windows操作系统出现后，大量的图形运算占据了CPU的大量资源，如果没有专门的芯片来处理图形运算，Windows界面运作会大受影响而变得卡顿，因此出现专门处理图形运算的芯片成为必然趋势。

1993年1月，英伟达创立，1999年，英伟达发布了划时代的产品GeForce256，首次推出了所谓图形处理器（GPU，GraphicProcessingUnit）的概念，它带来了3D图形性能的一次革命。

1.21.2始于图形处理设备始于图形处理设备图：

显卡发展历程图：

显卡发展历程资料来源：

51CTO，华金证券研究所绘制请仔细阅读在本报告尾部的重要法律声明1.1.由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑GeForce256是一款用于实时图形处理的专用处理器，GeForce图形处理器的发布，实现了顶点的矩阵变换和光照计算，图形实时处理应用需要高内存带宽和大量的浮点计算能力。

2001年英伟达发布了第三代显示核心GeForce3，GeForce3不仅集成了来自之前GeForce256和GeForce2芯片的“静态”座标转换和照明引擎，更增加了称为“顶点着色单元”的可编程顶点处理器功能。

游戏开发者可借由加上顶点程序，让游戏产生令人惊艳的全新效果。

可编程性与浮点计算能力相结合，基于GPU的通用计算也开始出现，GPU朝着通用计算的方向持续演进。

2006年，英伟达CUDA（ComputeUnifiedDeviceArchitecture，统一计算设备架构），及对应工业标准的OpenCL的出现，让GPU实现更广泛的通用计算功能，GPGPU的概念落地。

1.31.3浮点计算能力与可编程性结合浮点计算能力与可编程性结合GPUGPU的图形（处理）流水线的图形（处理）流水线资料来源：

搜狐网，华金证券研究所NVidiaTeslaNVidiaTesla架构架构资料来源：

深入GPU硬件架构及运行机制博客园，华金证券研究所请仔细阅读在本报告尾部的重要法律声明1.1.由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑GPU最初用在PC和移动端上运行绘图运算工作的微处理器，与CPU集成以集成显卡（核显）的形态发挥功能。

NVIDIA于2007年率先推出独立GPU（独显），使其作为“协处理器”在PC和服务器端负责加速计算，承接CPU计算密集部分的工作负载，同时由CPU继续运行其余程序代码。

2019年NVIDIA的中国GTC大会设置了两大主题：

AI和图形。

从大会的关注重点可以看出，GPU未来趋势主要是3个：

大规模扩展计算能力的高性能计算（GPGPU）、人工智能计算（AIGPU）、更加逼真的图形展现（光线追踪RayTracingGPU）。

1.4GPU1.4GPU发展三大方向发展三大方向四核心四核心IntelIntel处理器的处理器的dieshotdieshot框图（带有框图（带有Gen9Gen9核显）核显）资料来源：

CSDN，华金证券研究所英伟达三大产品系列英伟达三大产品系列资料来源：

英伟达，华金证券研究所请仔细阅读在本报告尾部的重要法律声明1.1.由专用走向通用，由专用走向通用，GPUGPU赛道壁垒高筑赛道壁垒高筑1.51.5英传达显卡发展历程英传达显卡发展历程时间发布型号制程亮点1995STG-2000X500nm采用第一代NV1核心，核心频率12MHz，同时支持2D、3D处理能力1998RIVA128350nm第一款成功的显示核心。

第一款支持微软Direct3D加速的图形芯片，也是第一个提供硬件三角形引擎的128bit图形芯片，加入了对OpenGL技术的支持1999RivaTNT2250nm奠定英伟达显卡王朝的基石，核心频率和显存容量都有了极大的提升，从这一代开始，英伟达开始产品进行了市场化细分1999GeForce256220nm首次推出了所谓图形处理器（GPU）的概念，增加了PixelShader流水线的数目，支持硬件T&L引擎，第一款硬件支持T&L的显卡，亦支援MPEG-2硬件视频加速。

Quadro也是以GeForce256为基础开始研发。

2001GeForce3180nm英伟达首款支持DirectX8.0的产品，并支持可编程的T&L引擎2002GeForce4Ti4200150nm新一代的T&L引擎，并支持高效率的反锯齿技术2004GeForce6800130nm渲染管线首次突破性增长到16条，采用GDDR3显存，频率达到了1.1GHz。

同年，英伟达SLI（可扩展的链接接口）技术问世，单台PC的图形处理能力大大提升。

2006GeForce8800GTX90nm世界上第一块支持DirectX10的PC桌面显卡。

GeForce8采用统一流水线结构，传统显示核心的架构分为顶点着色引擎和像素着色引擎。

所谓统一渲染，即GPU中不再有单独的顶端渲染单元和像素渲染单元，而是由一个通用的渲染单元同时完成顶点和像素渲染任务。

统一渲染架构具有硬件利用效率高以及编程灵活的优点，进一步提升了GPU内部运算单元的可编程性，让GPU运行高密集度的通用计算任务就成为可能2010GeForceGTX48040nm采用英伟达推出全新一代的Fermi架构，Fermi架构GPU产品在保持图形性能的前提下，将通用计算的重要性提升到前所未有的高度，大规模GPU计算从之开始。

30亿个晶体管的大芯片，全局ECC设计、可读写缓存、更大的sharedmemory、甚至出现了分支预测概念。

Fermi是英伟达最后一款在游戏显卡上保留强悍双精度的微架构2013GeForceGTXTitan28nm采用Kepler架构，与前一代的Fermi