从吊打英特尔到吊打英伟达,苹果携地球最强桌面芯片M1 Ultra抢别人饭碗
- 王树一
当英特尔受困工艺制程升级,为延续摩尔定律而苦苦支撑之时,业界并未因龙头陷入泥沼而裹步不前。前有英伟达(Nvidia)首席执行官黄仁勋提出“黄氏定律”,称AI芯片性能将每年翻一番;后有EDA龙头新思科技提出系统摩尔定律(SysMoore),表示要从系统层面将生产力在10年内提升1000倍。
而“跨界选手”苹果公司更人狠话不多,直接“复制黏贴”。在北京时间3月9日凌晨,苹果公司发布地球最强桌面级处理器M1 Ultra,将去年10月份发布的M1 Max的集成度翻倍,集成晶体管数量超过千亿,达到1140亿个晶体管。

更关键的是,存储器带宽翻倍,支持内存容量翻倍,CPU性能与功耗表现吊打当前一众桌面处理器不说,GPU性能与功耗表现吊打最强独立显卡芯片,达到同样最高显示性能时,苹果M1 Ultra比当前性能最强的独立显卡功耗可以低200瓦,简直是降维打击。简言之,苹果芯片(Apple Silicon)在性能提升方面走出全新路径,远远领先其他芯片公司,而且短期内还看不到瓶颈。


当面积不是限制
在芯片产品开发过程中,性能、功耗和面积这三个关键条件主要决定一款产品的参数指标范围。产品经理追求的总是性能最佳、功耗最低和面积最小,但这三个条件互斥,提升性能往往意味着牺牲功耗和面积;降低功耗可能会影响性能,同时可能牺牲面积;减小面积是为了降低成本,但缩小面积往往会影响到性能与功耗。
产品经理与芯片工程师的职责就是在这三项当中取得平衡,面积对于独立芯片供应商尤其重要,因为对这些厂商而言,市场上往往还有其他竞争对手,面积大意味着成本高(芯片成本与芯片面积正相关),而价格高在消费电子市场往往就意味着没有竞争力。
但对苹果这样的整机厂商而言,其芯片设计部门可以去掉面积这个限制因素。当然,所有大批量生产的芯片产品还是要考虑面积,但对苹果这种系统公司而言,面积在定义产品参数时的影响因子很低,这就为极致性能和功耗表现带来了机会。
从苹果M系列芯片来看,芯片面积迅速扩大。如果把M1、M1 Pro、M1 Max与M1 Ultra视为不同代产品的话,这四代产品面积指数型上升,因为这四代产品都采用台积电5纳米工艺,因而可以直接比较。根据Counterpoint的数据,2020年四季度推出的M1的芯片面积(die size)为119平方毫米,而2021年四季度推出的M1 Pro的芯片面积为251.3平方毫米,M1 Max则是425.1平方毫米(一种说法是432平方毫米)。

M1 Ultra还没有数据,但从苹果给的示意图来看,至少是M1 Max的两倍,那么芯片面积约为850平方毫米,是其初代桌面处理器产品M1的7倍多,这只花了不到两年时间。

UltraFusion
不用太考虑面积,再加上苹果有自己的软件生态,因而其可以根据应用自由定义产品,例如将缓存根据需求比常见的处理器放大多倍,例如在M1时,苹果就将一二级缓存(L1/L2)比英特尔和AMD的主流桌面处理器大好多倍,加大一二级缓存能极大提升性能,当然代价就是面积大——因为缓存电路特别占面积。除了一二级缓存,苹果还有其称之为系统缓存的SLC,也是根据系统需求不计成本的堆面积,这样的缓存系统,芯片成本较贵,但从系统层面而言,无疑是低成本获取高性能的极佳案例,因为在缓存后面的性能提升,都意味着更高的成本,例如更贵的存储器。总之,在苹果芯片中,面积与成本是一个弱影响因素。


当然,不是解除面积限制就可以做出性能又好功耗又低的芯片。苹果在终端产品上当世无双的产品定义与理解能力,将是对其芯片设计部门最大的支撑。而其每年有数亿款终端产品出货,这些终端产品基本都是在线设备,可以实时让苹果公司对其进行产品全生命周期的监控,这种反馈数据都是无价之宝,也是英特尔、英伟达、高通和AMD等独立芯片厂商所不具备的优势。
除了缓存,苹果芯片在内存带宽上也独领风骚。从M系列发展史来看,苹果显然找到了打开内存带宽的钥匙,M1存储带宽只有68.3GB/s,到M1 Pro升级到200GB/s,而M1 Max内存带宽翻倍到400GB/s,这次发布的M1 Ultra再次翻倍,达到800GB/s

能够用很短时间将内存带宽大幅增加,说明苹果在芯片I/O技术积累上,也远远领先竞争对手,从而自己有充分的数据带宽提升空间。这应该与苹果今天公布的UltraFusion技术直接相关,根据苹果官方资料,UltraFusion在M1 Max中开始引入,是一种把不同裸芯片(die)通过硅中介层(Silicon interposer)连接在一起的技术,即通常所说的3D封装、异质集成。

近日,由台积电、英特尔、高通、三星、Arm、AMD和日月光等十大厂商,成立UCIe(Universal Chiplet Interconnect Express,通用芯粒互连技术)标准联盟,准备制定芯片立体封装接口技术标准。据外媒报道,UCIe原本是英特尔自研技术,现在英特尔将其公开,并免费授权UCIe联盟会员使用。

当时有人表示,为何苹果没有加入这个联盟,是否被产业孤立了?
现在看,应该是苹果无意加入该联盟,芯片间互连技术,靠苹果和台积电合作就可以搞定。此次公布的UltraFusion,能同时传输超过 10,000 个信号,芯片间互连带宽可达2.5TB/s,远远超出现在公开信息拿到的UCIe 1.0标准,也给苹果芯片性能继续提升,留出了足够的空间。
总结
M1 Ultra将首先应用于苹果台式机Mac Studio上,作为苹果公司新一代多媒体工作站,其指标参数吊打前代产品及主流竞争对手产品,因为具体参数到处都有,此处不再罗列。
毫无疑问,苹果芯片再次刷新行业认知,UltraFusion技术也将引领产业在提高集成度上打破瓶颈,苹果芯片除了抢走CPU生意,也开始抢独立GPU的饭碗。虽然短期内还没有哪一家终端设备厂商具备苹果的芯片开发能力,但独立芯片厂商对苹果路线应该高度重视了,而M1 Ultra的推出,也意味着桌面处理器市场固有格局被进一步打破。