商业

国产GPU不讲武德

来源|爱集微APP

集微网报道 最近几年大芯片投资赛道,数GPU热得发烫。一众初创公司涌现,大厂精英抱团创业,巨额融资不断刷新行业纪录。一些成立较早的企业,已经进入研发落地阶段,刚成立不久的厂商,也旋风般推出相关产品。

与GPU创业高热相伴的,是从未间断的质疑声:估值虚高,PPT发布,套壳马甲……一些国内GPU创企推出产品被认为已经背离芯片研发规律成为融资的工具跳板,后生们不讲武德,坏了规矩。

国产GPU创业领域目前存在哪些问题?应该以什么样的态度发展国产GPU?与海外巨头相比,有何差距与挑战?追赶的机会在哪?集微网同产业人士进行交流,探寻国产GPU创业浪潮风起云涌的背后。仔细丈量国产GPU的“成色”,或许有助于更加清醒地正视现实。

一、乱象丛生 泥沙俱下

近两年,受市场需求以及政策、资本的推动,GPU在国内受到疯狂追捧。地缘政治、大国博弈背景下,相较于已有一定积累的国产CPU,国产GPU的破局更具紧迫性和必要性。人才储备程度,科创板提供的退出机制,也为国产GPU的发展创造了良好契机。

于是,GPU成为继AI之后,最为性感的芯片投资赛道。资本的蜂拥而至吸引了来自英伟达、AMD、海思、高通等一众大厂精英创业。据不完全统计,目前该领域的初创企业已近20家,所有一线投资机构均参与其中。

谈及目前国内GPU创业领域的现状,行业人士李明(化名)认为赛道过热且拥挤,市场鱼目混珠泥沙俱下。

李明并不否认看到一些企业推出的产品,不管是在跑分还是在标准测试和应用方面都取得了进步,但也有不少产品和演示目前还处于“PPT”状态对于那些成立一年左右就推出多款产品的公司在行业摸爬滚打了20多年的李明称颠覆了自己的行业认知”

“一块GPU芯片的研发周期从立项到上市至少要3~5年好的芯片要经过架构和应用打磨,这个过程也不可能低于两年。有的产品宣称是自主设计,但明显违反整个芯片的设计规律。GPU不可能一年半载就设计出来并跑通应用,有可能设计全是外包,或是将已流片的设计的Spec配置稍作修改。”李明分析称。

另一位GPU企业高管王强(化名)认为,一些GPU新势力尚没有明确自己的细分市场,也没有想清楚未来长远的发展方向,只会用PPT吹牛,发布产品参数和性能对比时混淆视听,实际并不能够正常量产或进行流畅演示,真实性和可靠性大打问号。

“有的芯片参数比较奇怪,宣称算力是6T Flops/s,存储能力是50GB/s,两者的比例达到120:1,但实际上GPU最理想的比例应该是25:1,这在应用层面非常尴尬,不知所用何处此外,有的芯片带宽非常低,无论是用于AI计算还是图形,基本上都发挥不出功能。”谈及诸多费解之处,王强直摇头。

行业看来,这样导致的结果是搅乱了市场,浮躁了人心,在GPU这样一个高门槛且重积累的领域,不讲诚信,违背市场、技术规律,待潮水退去后,只能是一地鸡毛。

二、资本裹挟蒙眼狂奔

GPU创企在产品上的乱象丛生,在行业投资人士张帅(化名)看来,有些是迫不得已。

海思做GPU,前后花了4年半,在华为强大流程体系支持下尚且如此,初创企业难度更大。如果也做这么长时间才出产品,投资人不会答应。张帅说。

张帅透露,有的GPU初创公司与投资方签下对赌协议,在某个时间推出芯片产品,是决定其拿到下一轮融资的入场券。

资本裹挟之下,一些配置错误、不合逻辑、完全不像正常产品的GPU芯片横空出世,冠以自研、国产、打破垄断之名。吃瓜群众亢奋,行业人士错愕。

“很多国内GPU的研发,其实已经脱离了芯片开发的初衷,所有的成果展示和发布,其实是以融资为目的。”创道投资咨询合伙人步日欣直言。

赛道的火热以及大规模的融资助推GPU初创企业估值一路走高。一些成立一两年的热门企业,估值已经达到两三百亿元,GPU成为高估值代名词。

不少业内人士呼吁对于那些通过“放卫星”博眼球的方式来吸引关注的可疑产品公司,需要投资人和相关的市场机构进行甄别以及理性对待和评估

北科建集团产业运营负责人李锴表示,国内GPU从整体而言,受到了政策推动的影响,有了积极进展,尤其包括“东数西算”政策、算力芯片和智慧化应用的市场打开。但目前阶段的投融资热度,还是一种行业聚焦惯性投资,依靠当前的政策性红利,大部分投资标的还属于高风险投资项目。

“真正投进去,一是要考虑估值是不是虚高的问题,二是需要专业性的知识背景和能力,考验投资机构慧眼识珠的本领。”李锴说。

但独具慧眼似乎是少数GPU赛道的玩家更多处于“蒙眼狂奔”几年过,投资热度仍未消减

张帅不否认GPU赛道过热,但他并不认为GPU创企估值过高,因为在他看来GPU的价值摆在那。

“如果真的中美脱钩,高性能GPU被卡脖子,中国一定要想办法替代。一个GPU工程师年薪50万,2000人的企业,人力一年就要10亿,每年二三十亿的整体开支跑不掉。投资方愿意投钱给不同的创业团队也有道理,谁都想赌一把中国的AMD和英伟达。”张帅说。

三、图形/计算 花开两朵

GPGPU、通用GPU、全功能GPU、图形GPU、渲染GPU、GPU+……在国内,GPU命名上的文字游戏已被厂商们玩坏,也让外界对这些产品一时云里雾里。

按功能划分,GPU主要分为侧重图形图像的渲染GPU和侧重通用计算的GPGPU。

目前国内初创GPU公司,结合自己的优势和阶段性定位,分别采取了不同的切入路线。其中GPGPU公司包括壁仞、沐曦、登临、天数智芯、红山微电子、珠海芯动力等,渲染GPU企业包括摩尔线程、励算、深流微、瀚博、芯瞳、格兰菲等。

沐曦CTO杨建博士指出,GPGPU相当于大算力芯片,是传统计算的回归,GPGPU的创新等同于将一些专用加速功能变成GPU的一组指令集,芯片面积只有原来的1%-10%,却相当于实现了一个全新专有芯片的加持,同时具备通用计算的性能,这使得边际成本更低,更具价值。

而渲染GPU约80%仍是GPGPU部分,20%则是固定渲染流水线(fixed function),例如geometry pipeline、rasterization pipeline等。固定渲染流水线涉及较多的数学公式,因此比较依靠编译器和驱动等软件能力,而GPGPU在硬件和应用层面较为复杂。

“从软硬件复杂度看,渲染GPU复杂度更高。从开发人员团队数量来看,GPGPU如需要200人的硬件团队,渲染GPU可能要再增加50人,但软件开发人员相比GPGPU或需增加三倍,需要更多的人员开发驱动和编译器等。”杨建说。

芯动科技首席SoC架构师何颖认为,图形渲染GPU因为经过了十几年的演化进程,流水线长,实现起来复杂,设计上的挑战更大,同时存在很多专利陷阱。

“芯动科技目前聚焦于渲染GPU领域,但GPGPU也在规划之中,芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然GPGPU的价值很高,增长也不错,但图形渲染GPU在细分市场总的体量更大。”何颖告诉集微网。

但杨建认为,对于一家初创公司的首颗GPU产品来说,如果要同时自研渲染GPU的固定渲染流水线IP、统一着色器(shader)IP,需要的时间和人力成本将非初始的几百人团队可以承受。因此,沐曦采取先做GPGPU,再发展图形渲染GPU的模式。在自研GPGPU中,只有统一着色器IP,不需要固定渲染流水线,这样可以在自研GPU的道路上一步一个脚印稳健前行。

四、核心IP 十年差距

任何一款高端芯片的打造,都离不开基石——IP的“成全”,IP的质量很大程度上决定了国产GPU性能的底色。

在步日欣看来,GPU作为高性能的大芯片,想在短期内出成果,必然需要依赖外部IP。国产GPU厂商能够快速推出相关产品,很大程度上依靠外购IP。

但打着自主研发之名,行外购之实,推出“马甲”产品就难免有忽悠之嫌,这样的案例在芯片领域本就不在少数。

自研IP越多,芯片设计上越有把握,产品的差异化更明显。但相对而言,资金、人员、时间上的成本投入也更高。王强告诉记者,GPU IP自研需要36-48个月以及200个工程师,而采用外购IP的方式,可以减少12-18个月开发周期。

李明则表示,考虑到GPU的研发非常考验项目的目标管理能力,对于团队能力和组织工程能力要求很高,初创企业由于能力有限,短期内如果自研路线不顺利,会选择大量外购IP或马甲路线。但从长远看,公司团队的成长市场定位以及盈亏平衡不能得到保证,而且会逐渐拉开跟行业领先公司的差距。

据集微网了解,GPU 的IP主要涉及三大类,一是模拟IP,包括PCIe、Displayport和HDMI等等,这方面国内厂商占有率较低;二是Memory;三是数字IP,包括基于Arm或RISC-V的微控制器IP、编解码芯片IP以及最核心的GPU IP等。核心IP国内有Imagination、芯原、格兰菲等厂商,相对而言,Imagination认可度较高,芯原是后起之秀,而格兰菲主要面向特定领域用户。

在李明看来,国内核心IP能力至少比英伟达、AMD等落后十年左右。而整体而言,GPGPU企业与国际大厂技术差距约3年,渲染GPU与国际大厂差距约10年左右

李锴认为,国内GPU底层技术空白点较多,IP大多受制于国外厂商,产品前端稳定性不理想,目前又很难在主线中高端电子产品上得到普及化应用,需多年沉淀形成自主IP积累才能具有一定替代性。

需要指出的是,外购IP并不意味着无法自主可控,但对GPU企业的能力要求很高。

据何颖介绍,芯动科技与Imagination的合作是与苹果一样的架构授权,基于该初始架构芯动科技探索了很多自己的方案,包括自研的Cache一致性Innolink Chiplet技术,内置国产物理不可克隆iUnique Security PUF信息安全加密技术等。

“芯动科技去年推出的渲染GPU‘风华1号’80%以上的IP都属于自主研发。既然已经获得了架构授权,芯动科技就可以不受限制地自行改进,能够做到自主可控。”何颖说。

五、生态之路 道阻且长

除了硬件性能上的比拼,高性能芯片的生态搭建也是绕不过去的一道坎儿。某种程度上,生态比硬件更重要。

步日欣表示,在最终量产和商业化产品出来之前,国产GPU还没到谈论生态和应用层面的地步杨建认为,GPU生态是除产品外初创企业能否活下来的重要因素,是一开始就要考虑的问题。

对于渲染GPU和GPGPU而言,构建生态的难度截然不同。

渲染GPU在技术层面来相对复杂,但是好处在于有很多业界成熟的标准的API,如OpenGL、OpenGL ES、DirectX、Vulkan等。只要打通了整个驱动程序层和编译器生态,就基本完成90%。

而在GPGPU领域,几乎是被英伟达一手打造的CUDA生态所垄断。

“GPGPU的生态非常复杂,要求一路打通到应用层,提供面向所有应用的全面支持,甚至要自主开发以支持一个新的应用领域。”杨建指出。

虽然不少GPU初创公司推出的产品都号称兼容CUDA生态,但李明认为存在兼容多少的问题,水分较大,比较重要的特性中可能60%-70%都无法支持。

而据集微网了解,兼容CUDA并非易事,需要投入工程师的数量巨大。涉及50个驱动、50个编译器、50个数学库、300个应用层工程师,3-5年的时间。功能的验证,用户的培养需要额外3-5年,每年还要至少开支1000万-3000万元资助外部开发者。

“使用的人越多,生态越占统治地位,看看国内的初创GPU企业,哪些是已经开始编写教材在高校开课和开展合作项目组织比赛做这些人才培养方面的工作,就知道谁真正沉下心来做生态。”李明说。

何颖指出,国产GPU业应采取开放合作的心态,学会站在巨人的肩膀上,善于利用现有架构和生态,设计契合市场需求的优秀产品,打造全球化设计水平的开发团队。国产GPU在起步阶段兼容现有生态更容易发展,先求生存;长期还是要摆脱兼容思路,站稳脚跟后再求发展自有的核心技术。

在GPU生态中,软件的权重已越来越高。Imagination中国区战略市场与生态副总裁时昕博士提及,GPU软件极为复杂,包括各种图形API和计算接口、基础库、与上层应用对接适配等等,开发工作量巨大。

从应用角度来看,国内GPU生态的发展更需要“众人拾柴”。时昕认为,要加快打造国产GPU产业链,下游的整机厂商需要对国产GPU给予更多包容。

“国产GPU可能99%已达标了,如果能帮助国产GPU厂商一起将这百分之一影响体验的最后一步补齐,做到更完善,这对其发展是非常重要的。”时昕强调。

六、掘金市场 盈利维艰

对于GPU创企而言,巨大的研发费用和资本开支是必需,但长期、持续的利润支撑才是GPU跨代发展的强劲驱动力。也就是说,GPU的成功和成熟需要大量的验证和出货,这就需要国产GPU厂商瞄准目标应用市场发力。

步日欣认为,对于初创企业而言,渲染GPU涉及到生态建设的完善度,所以从信创、军工、工业等领域切入较为稳妥。而GPGPU市场从人工智能、服务器、高性能计算等领域切入是最优选择。

但初创GPU企业掘金市场的现实相对骨感。

比如,在渲染GPU的传统应用如视频、游戏等领域,英伟达和AMD构建的护城河可谓固若金汤,国内企业与之差距较大,而且这一市场全球容纳三四家都比较困难。

短期看,虽然国内信创市场提供了一定空间,但总量不大,且偏向于中低端。因此,如何分食这一“蛋糕”之下还能实现正循环是国内渲染GPU厂商面临的问题。从长期看,虽然云端渲染成为新的增长点,但元宇宙、云游戏、云手机等市场普遍认为将在2024年前后起势,因此当下如何获得盈利求生存也是艰难挑战。

而在GPGPU方面,比如在AI计算领域,则面临场景应用复杂且碎片化,以及国内众多竞争对手混战的局面。

何颖认为,游戏、3A大作对GPU的图形和计算相对要求比较全面,国内企业在Windows领域追赶难度较大,但在安卓手游、信创桌面和某些定制的服务器领域,以及自动驾驶领域,国内厂商有机会实现切入。目前,芯动科技的风华系列GPU瞄准国产信创桌面和服务器这两大细分领域。相较于信创市场,服务器显卡单价更高,实现盈利较有希望。

而杨建则指出,除生态之外,当下对于初创GPGPU企业生存而言,最大挑战是产能。

“目前和AI相关的大芯片,因为需要Cowos等先进封装,所涉及的中介层原材料非常紧缺,在目前产能吃紧的情况下,对于已经推出一些产品的初创GPU企业,会面临短期盈利的问题。”杨建说。

七、弯道超车 路在何方

我国在高端GPU领域缺席多年,面对海外巨头固若金汤的专利、生态等壁垒,GPU业从战略布局成长为核心支柱,显然还有漫长征途。

行业人士看来,国内GPU企业发展破局的关键在于找准定位,贴近市场。

何颖特别强调,国内的渲染GPU厂商应该着重于贴近市场的定位和创新,使得设计和能效能够贴近应用,力争在专有应用领域或局部领域实现突破,然后再进一步拓展和打磨经验和能力,使得最终在生态和应用上能跟技术创新良好结合,形成正向循环。

“跟国外巨头相比,国产GPU在一些专用领域优化方面,并不是完全亦步亦趋。通过在这些领域发力,能够在计算密度或在工艺、节奏、带宽密度等面体现出差异化,可以使产品在性价比,在某些特种应用方面能够达到国外GPU的能效,甚至做得更好。”何颖说。

杨建则表示,在GPGPU方面,英伟达没有百分百的优势,国内GPGPU在某些方面可以说是超越的。国内厂商在HPC和服务器、通用计算等领域可以依托Linux的开放性和可控性强的优势,实现有效突破。

在杨建看来,国内GPU厂商的最大优势在于本土支持。

“如果整个市场是一个地图,国内GPU厂商可先撒点,针对一些特定市场循序渐进抢占生态,加强与国内厂商的紧密合作,积累一定的优势和声誉后,再由点及面布局寻求突破。”杨建建议

多位受访者提及,高端芯片研发周期长、投入大,没有足量资金支持无法取得成功,但过度的投资热潮容易滋生投机现象,互联网投资的模式并不适用于芯片领域,国产GPU要谨防重蹈AI芯片的覆辙,需要正视差距,脚踏实地前行。

“烧钱的模式是难以为继的,只有踏踏实实服务客户,服务市场,并且能够不断的回收研发成本,进一步实现创新,才是国产GPU的成功之路。急功近利,疯狂招人,疯狂烧钱的模式,实际上不可能快速弥补国产GPU跟国外GPU之间的差距,因为国外的GPU是一个个应用打磨出来的,国产GPU一定要有耐心,才能够在这个领域实现创新和弯道超车。”何颖说。

步日欣指出,国内GPU距离国际大厂还有很长的距离,特别是目前的竞争格局下,国内GPU还处于野蛮生长阶段,虽然资本市场较为关注,但同质化竞争和创业造成了很大的人才和资金的浪费,一定程度上制约了国产GPU的发展进程。

“下一步这几十家GPU企业,肯定要面临一定程度洗牌,那个时候才是真正的国产替代、缩小差距的开始。”步日欣说。