|
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
大厂“造芯”有了进展。; D& L# v; W6 U! h+ J9 }! U' {
, |. T" b3 w5 v; |1 p7 I1月29日上午,阿里巴巴集团(09988.HK,下称阿里)全资芯片业务主体平头哥在官网悄然上线一款名为“真武810E”的高端AI芯片。) ?; Q+ Y$ s9 P. A, K, g
+ U& W: x n6 H5 a5 l
事实上,早在去年9月,这款芯片就已短暂“现身”。在央视报道的中国联通三江源绿电智算中心项目中,国产算力板块关联到阿里平头哥(万卡)、沐曦股份、壁仞科技、中昊芯英、太初元碁、燧原科技、摩尔线程等多家国产AI芯片厂商,其中阿里云投入的设备数量为1024台,搭载的平头哥算力卡有16384张,所提供的算力达到1945P。
6 C, |6 T5 N6 y) M- R N3 i/ w: I p. k' x& Q4 p
据平头哥官网介绍,“真武810E”是一款AI训推一体芯片,采用自研并行计算架构和ICN(Inter-Chip-Network)片间互联技术,配合全栈自研软件栈,实现软硬结合,采用HBM2e内存,容量可达96GB,支持7个独立ICN链路,片间互联带宽达到700GB/s,可应用于AI训练、AI推理和自动驾驶。
8 V2 `9 U. B- \- {
8 ~5 E4 }7 R$ d, {; I5 B# o有业内人士透露,对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流国产GPU,与英伟达H20相当。
. m) m2 L* ~2 D4 I
% }/ D; P4 j( @+ Y& \一大模型行业从业者陈星(化名)向时代财经分析,从数据上看,“真武810E”在显存容量与H20持平,显存带宽、片间互联略逊,架构与互联技术有差异化优势,整体达国际主流水平、真实情况还有待实际使用。
* T* u' b8 Z1 @. x% }, F0 v. B# h1 c- ]8 S# z4 v
阿里表示,其已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云AI软件栈进行深度优化。目前,“真武”PPU已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等400多家客户。
' F5 y& ]7 y" V1 D( o& n ]( ]
' E& @: _& j& f3 \! }# X6 H八年蛰伏, v" V3 l6 K6 A$ u# `1 j, G
# O! L$ ?8 ~- R/ w5 i# P“真武”PPU“显露真容”的时间非常微妙。( s* i3 N% G% f& Z# o
/ Q. [4 _3 c) |. k
几日前,市场刚刚传出消息,称阿里正准备推进平头哥独立上市。阿里计划先对该芯片业务进行内部重组,将其改造成一个部分由员工持股的业务实体,随后再探索进行首次公开募股(IPO)的可能性。具体上市时间尚未确定,该行动仍处于准备阶段。不过,彼时阿里方面对此消息并未置评。
4 Q5 U! ^6 ?8 N0 [& i( H* Q+ X: J% }/ O" B% a# H
紧接着在1月26日,通义实验室发布千问旗舰推理模型Qwen3-Max-Thinking,按照官方口径,该模型的性能媲美GPT-5.2、Gemini 3 Pro。目前,全球最大AI开源社区Hugging Face数据显示,千问开源模型的衍生模型数量突破20万个,下载量突破10亿次,稳居全球第一。7 b! I/ @# V- }1 ]' o; N4 f6 d% J4 Q
r7 v4 Q {! J9 L
而从更大的行业背景看,国产 AI 芯片企业扎堆冲刺上市通道,互联网大厂纷纷分拆硬科技板块独立资本化,AI 算力基础设施的商业化价值正被资本市场重新定价,科技巨头的“芯云一体”战略也迎来了市场化落地的关键窗口期。9 `! B1 O9 S. W0 d: \3 e% }% Q
5 r1 a+ r, B! D6 x
对于为何在此时间点披露“真武810E”,阿里方面并未给予正面回应。 B/ X, Q: I e" V9 {
! m: D& Q: _* W
不过,有业内人士向时代财经分析,这可能是内外环境发生了变化。一方面,芯片是个敏感的行业,之前阿里造“芯”保密程度都很高,但此前这款芯片在央视的节目中已有过曝光;另一方面,国际局势发生了变化。* ~! X+ J+ X# m, a* g0 x3 s
+ |( q! o. J( W( P7 Y
但即便如此,阿里的态度仍相对谨慎,目前亦没有透露任何关于下一代产品的信息。
/ e. D& Z3 o" D, R9 S3 e
0 y$ q" e. M6 e回看平头哥的来时路。阿里在2009年创建阿里云,2018年成立半导体芯片子公司平头哥。平头哥的前身由阿里从收购的中天微系统及阿里达摩院内部芯片团队整合而来。
4 c- @- ^' d# Z5 Q4 C/ Y* {1 t% _' A$ q& j8 Q2 }$ O! M1 h
2019年7月,平头哥交出第一颗RISC-V处理器芯片玄铁910。同年9月的云栖大会上,平头哥首款人工智能芯片“含光800”面世,其峰值性能达78563 IPS,峰值能效达500 IPS/W,彼时达摩院院长张建锋表示,这是阿里第一次用了自己的硬件架构,也是互联网公司第一个研发这种大芯片,同时宣布基于含光800的AI云服务也正式上线。$ r" z/ I: z! s; ?5 Z
$ [8 S& [" N% d8 u
也是在2019年,阿里启动了大模型研究。/ C+ D) T, {9 z& v" C8 _4 n
D: t8 e0 C4 K% ^- ?9 a" y/ V2021年10月,又是一年云栖大会上,阿里平头哥发布自研云芯片倚天710,是阿里第一颗为云而生的CPU芯片,会在阿里云数据中心部署应用。之后几年,平头哥分别面世了RISC-V高能效处理器玄铁C908,超高频RFID电子标签芯片羽阵611和羽阵612,首颗SSD主控芯片镇岳510等。% L- i$ {5 e$ A. f9 R" l
$ q- Q, `8 @9 Y) T- y' y# X/ y中邮证券研报表示,为避免业务被单一芯片供应商“绑定”或断供影响,阿里2021年提出“一云多芯”战略,称其飞天云计算操作系统正全面兼容X86、ARM、RISC-V等多种芯片架构。“一云多芯”是阿里云从上层云操作系统到底层自研芯片的全栈布局,目标是为企业提供更自主、更灵活、更高效的算力。平头哥的倚天、含光以及PPU等,都是“多芯”生态中的关键自主选项。倚天710、含光800等均在阿里云上实现了规模化部署。
0 @' I; }! U1 W0 M$ I3 o7 V) k0 j1 I* Z. D2 g# ^
大厂“造芯战”升级/ C N/ `8 Y% k
/ W3 e9 P& R; e那么,此次公开“真武”PPU,阿里想要对外界释放的信号是什么?6 f+ |7 V7 c- p2 Q+ c$ ~
3 {4 J* m# J9 [" ` J
阿里此次动作核心包含两大关键信息:一是平头哥正式披露了“真武 PPU”芯片的存在;二是首次提出“通云哥”技术垂直整合体系。* K, Y& @2 O$ W( K
# Y2 H x5 W8 l- G3 |) H
上述业内人士表示,“之前行业里一直有关于平头哥自研芯片的传言,甚至央视新闻联播曾曝光过相关对比画面,但都没有官方实锤。现在官网上线产品信息,就是明确告诉大家‘这款芯片确实存在’,补齐了外界对阿里技术布局的认知缺口。”
, C+ p J- r4 E; j
6 N1 K2 B1 [1 z0 s# z; S/ p0 C通云哥的发布,更多是让外界以“芯片(平头哥)- 云计算(阿里云)-AI 大模型(千问)”的垂直整合视角,去审视阿里的技术布局:自研芯片筑牢硬件底座,云计算提供算力支撑,大模型则是技术落地的产品体现,全链路协同。
( L& Q9 E r2 D& m5 ^
5 N$ K# P6 b! G- T2 H( e1 N据阿里方面表示,其正在将“通云哥”打造成一台AI超级计算机,它同时拥有全栈自研芯片平头哥、亚太第一的阿里云,以及全球最强的开源模型“千问”,可以在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。2 {2 ~+ w! a& G1 X) o& f
8 n% v3 q4 d& s! D4 D而“芯-云-大模型”的布局也让阿里直接对标谷歌,成为在大模型、云和芯片三大领域均具备顶级实力的科技公司。5 C) Z* w2 s. I, K
1 C5 [; ^3 ^" O3 l A' U6 s目前看,阿里平头哥可能是希望对标谷歌自研AI芯片TPU(张量处理单元)。此前多年,谷歌凭借这款芯片在大模型研发领域实现突破,基本不对外出售。
0 a, A+ r- k3 s5 l+ r
; s% y0 M' @; }' y3 H不过,在去年12月底,据财联社援引报道消息,谷歌正在向客户推销其TPU,其中Meta考虑斥资数十亿美元购买谷歌TPU用于数据中心建设。大摩亚洲半导体团队将谷歌2027年TPU产量预测从原先的约300万块上调至500万块。摩根士丹利认为,这些趋势可能是谷歌酝酿中的TPU销售战略的“早期信号”,眼下该公司正加大力度,试图抓住全行业对先进AI算力的需求红利。, ?3 X& m. b8 G, D
7 h; b4 P; k" r g, n& G: }7 B
同样的,平头哥的“真武”PPU也在近年来走出阿里,目前已服务了超400家客户。
4 k! C- e+ ` x" D
' Z$ K3 Z- g ^“市场上需要更多有活力的产品注入,阿里对外,初期肯定会有个适应期。如果生态能够完善,类似Qwen模型一样,相信大家还是会很喜欢的。”陈星表示。
' ^1 u+ H1 R* c5 `% f" L/ r8 I' t9 c+ _/ N2 j+ ]6 r, f- M: c8 k
一位芯片行业内人士同样认为,“真武”PPU能否被市场接受,用得起来、用得好是关键。他还提到,如今行业内推理市场的需求更大,猜测阿里未来有可能更多将平头哥的芯片用于自身大模型的训练,而在推理端将云计算建设好后以算力的形式租用出去,而非纯卖芯片的形式。
/ b5 S7 q, d9 M) p$ e& V) q* e: Z1 Q G7 }0 N: m6 |
事实上,早在10年前,互联网大厂早已纷纷入局自研芯片赛道,不过此前始终保持低调布局的节奏,近期却纷纷主动亮出技术成果,频频对外 “秀肌肉”。
% A2 w3 i$ W6 q- G" _5 T9 J0 t: P# m! R O, `' Y7 W" C
百度昆仑芯自研芯片项目最早可追溯到2011年。2021年昆仑芯完成独立融资。! j% [4 `5 T# T, y8 H1 \7 P6 k- C- t
7 n0 J* t7 ^2 P& n8 u5 s3 R0 `2 C在近年的发展中,昆仑芯已对外公布了多起订单及未来的产品规划。去年8月,昆仑芯中标运营商领域10亿级大单。在中国移动2025年至2026年人工智能通用计算设备(推理型)集中采购项目的“类CUDA生态”标段中,基于昆仑芯的AI服务器产品中标份额排名第一,标包1和标包2均占70%份额,标包3占100%份额。
" P, K @2 ~2 c) T$ A- n2 ?# a2 N2 ~) b/ o4 N& ~ @- H; t
同年年底的百度世界大会上,百度发布新一代昆仑芯和超节点产品天池,并给出了相关产品的上市规划。新一代昆仑芯产品中,昆仑芯M100 针对大规模推理场景优化设计,关注性价比,将于2026年上市;昆仑芯M300面向超大规模多模态模型的训练和推理需求,偏向高性能,将于2027年上市。超节点产品天池256超节点与天池512超节点将于2026年正式上市,单个天池512超节点就能完成万亿参数模型训练。0 P. t( v! Q' y2 I
* E" |% ]8 _9 L- e
据媒体报道,IDC发布的2024年中国加速计算芯片出货报告显示,昆仑芯出货量达6.9万片,约为寒武纪(2.6万片)的2.65倍。
$ s9 a% ^; z$ C: o3 ]
, o( J. R" l! u8 B# E今年港股第一个交易日,百度(BIDU.O,09888.HK)就宣布,非全资附属公司昆仑芯确定分拆上市。百度在公告中提到,建议分拆完成后,百度预计昆仑芯仍将属于百度的附属公司。* U" q" p* @9 X% K( f9 e' q( A# w
7 Y9 a* [% _/ w3 Z. ^腾讯从2018年起,多年重仓燧原科技,是燧原科技的第一大客户和股东。过去几年,腾讯在燧原科技的销售额中的占比逐年提高,到2025年前三季度,腾讯相关业务往来(包括直接销售和 AVAP 模式销售)在燧原科技的营收占比已经超过了70%。燧原科技的产品包括云端AI芯片、AI加速卡及模组、智算系统及集群,以及AI计算及编程软件平台。近日,这家公司在科创板的IPO状态变更为“已受理”,融资金额为60亿元。
) h% T) y1 {: x2 c5 I$ T
8 L Z6 |% [8 t |
|