2025 年 6 月 22 日 下午 12:38

"我全要"可能吗?英特尔酷睿 Ultra 200V 系列处理器解析


这么一段时间以来,英特尔是接连陷入一个又一个的风波之中,作为一家对 PC 产业影响深远的科技巨头,这显然有些窘迫。自 2021 年技术派老将 Pat Gelsinger 成为英特尔新任 CEO 后,「IDM 2.0 战略」 与 「四年五制程」 规划的提出无疑展露出了英特尔在新时代意欲打破坚冰的雄心壮志,但在产品研发方面的巨额支出、消费级市场、数据中心市场的份额被挤压以及这个时代对于硬件需求的变革,让英特尔走的每一步都变得步履维艰,英特尔急需一个契机来扭转当下的局势。

在去年 12 月,专用于移动端的英特尔首代酷睿 Ultra 处理器正式实装并发售,在短短半年后,同样专用于移动端的 Lunar Lake 架构正式公布,再到 9 月 Lunar Lake 的终端产品酷睿 Ultra 200V 系列处理器发布,这个发布的时间间距与节奏在近年来的消费级芯片行业中也算是相当之快的了,当然这和英特尔在研发方面的巨额投入有关,但也不难看出英特尔正急于向公众展示出自己的新品、新技术,以提振市场对于自己的信心,所以,这次发布的酷睿 Ultra 200V 承载着比以往酷睿处理器更重要的任务,只许成功不许失败的酷睿 Ultra 200V 至少要取得市场的广泛认可与关注,而它会是那个 「扶大厦之将倾」 的契机吗?

本篇文章就来解析一下全新的英特尔酷睿 Ultra 200V 系列处理器。

一、酷睿 U 系列正统传承者,可能是最适合轻薄本的处理器

此前,英特尔无论是低压 U 系列、P 系列,标压 H 系列,高性能 HX 系列,桌面端低功耗 T 系列,桌面端高性能 S 系列等等处理器,基本都是在相同的架构设计下对 TDP、频率、核心数量、电压等等方面进行调整从而得来的,并没有针对于某一细分领域进行单独的架构设计,而本次的 Lunar Lake 就不太一样了,它是酷睿低压处理器 U 系列的继任者,是专门面向无独显超轻薄本打造的处理器产品,目的是提供低功耗、高能效、高续航的使用表现,为兼容性程度更广泛的 x86 平台注入一直以来缺失的 「高能效」 基因。

所以,酷睿 Ultra 200V 适合经常携带电脑、离电办公或学习的差旅、学生、工作人群使用,而如果您需要的是绝对的高性能,那么后续英特尔推出的 Arrow Lake 可能会是更适合您的选择,不过由于 Arrow Lake 将采用与 Lunar Lake 架构中相同的 CPU 微架构,P 核 Lion Cove 以及 E 核 Skymont,所以通过 Lunar Lake CPU 部分的表现,多少也可以对新 Arrow Lake 的 CPU 性能有一定的参考。

在终端型号上,酷睿 Ultra 200V 共有 9 个型号,均为 4P+4E、8T 的 CPU 核心规格,除旗舰 Ultra 9 288V 的 TDP 为 30W、可配置功耗 17W~37W 外,Ultra 5~Ultra 7 的 8 个型号 TDP 均为 17W,可配置功耗在 8W~37W。各个型号的主要区别在于核心频率、核显规格、核显频率、封装内存容量大小以及 NPU 频率。

二、与前代不一样的模块化设计

对于英特尔酷睿 Ultra 200V 系列处理器的架构 Lunar Lake,我在 6 月份的文章中已经有过介绍了:《下一代 AIPC 的旗舰平台,英特尔正式公布全新架构 Lunar Lake》,所以在这里就简单说明一下。

Lunar Lake 与上代的 Meteor Lake 架构均采用了模块设计,3D Foveros 封装,不过 Lunar Lake 的核心区域不再为 4 个 Tile,而是两个 Tile,分别为 Compute Tile 与 Platform Controller Tile,其中 Compute Tile 采用台积电 N3B 工艺,CPU 核心、核显、媒体引擎、显示引擎、NPU 等都位于其中,而 Wi-Fi 6、蓝牙、PCIe 控制器、雷电控制器等布置在了 Platform Controller Tile 中,采用台积电 N6 工艺。

另外在架构方面更为显著的变化是整块处理器中封装进了内存颗粒,可选 16GB 或 32GB,频率为 LPDDR5x-8533MHz,这虽然锁死了 OEM 厂商或用户对于内存方面的可升级性,但是会在内存层面最高降低 40% 的物理功耗,还会节省主板与机身空间。

为了达到更高的能耗比,或者说更节能,Lunar Lake 中引入了 PMIC 整合式供电,相比于传统的 VRM 供电,可以对整个处理器上面更多的部分进行更加精确的电压调节,从而降低功耗。

Lunar Lake 使用了更为先进的工艺和更节能的供电设计,还有为高能效所考量的架构设计,在 6 月份的时候,通过英特尔公布出的信息,我们仅能知道 Lunar Lake 的能效比将会很高,功耗很低,同时由于 IPC 的提升,在不算多么豪华的核心规格下,也能拥有相当不错的性能表现,但是具体的提升幅度有多大,与竞争对手和前代的自己相比情况又是如何,我们在 9 月份举办的 IFA 上,依据英特尔的官方介绍,终于有了答案。

三、Lunar Lake 架构解析

对于全新的架构名称为 Lunar Lake 的酷睿 Ultra 200V 系列处理器,英特尔主要设计的重点目标/产品的核心特点为:

(1)、突破性的 X86 平台能效比;

(2)、出色的 CPU 核心性能

(3)、巨大的核显性能提升

(4)、卓越的 AI 算力

为此,英特尔为酷睿 Ultra 200V 打出的主宣传语为 「一台伟大的 AIPC 始于伟大的 PC」,表明了英特尔对于 AI 时代 PC 的全新定义:一台 PC 只有把基础功能做好,才能再去讨论 AI。

那么英特尔酷睿 Ultra 200V 系列处理器的具体表现如何呢?我们按照上面的顺序一个一个来看

1、高达 50% 的整机功耗降低

作为英特尔口中 「能效比最高的 x86 处理器」,同时也是 Lunar Lake 最显著特点,整机功耗最高降低幅度可以达到 50%。

为了达成更低的功耗控制,在架构的设计方面,首先在内存上,前面已经提到,封装级内存使得物理功耗降低 40%,Lunar Lake 的 Compute Tile 中还额外加入了 8MB 的内存测缓存,可以更加高效的为内存密集型任务提供数据交换;其次在供电管理方面,PMIC 整合式供电也起到了不小的作用,Lunar Lake 中共有 4 颗 PMIC 对 SoC 上的各部分进行调压供电,可改善整机在低功耗或待机时的功耗情况,这也是 x86 平台一直以来在功耗控制方面的最大短板之一。能效核心上也有改进,相比于之前 Meteor Lake 时期两个 LPE 核心共享 2MB L2 缓存,Lunar Lake 上的 4 个 Skymont E 核心共享 4 MB L2 缓存,本身能效就提高很多,更高的算力上限也可以实现更低的功耗控制。

 

英特尔线程调度器也是非常有必要单独拿出来说一下的,从 12 代大小核架构开始到首代酷睿 Ultra,大小核心自登陆 x86 平台就有改善能效比的初衷在,但大小核心的调度与管理则是非常困难的一件事,对于相同架构,桌面端和高性能处理器用户对于功耗则没有多敏感,期望的是绝对的性能上限,而低压 U 用户则期望功耗压的越低越好,显然没有办法两头都兼顾,而 Lunar Lake 就不用考虑那么多了,是专门的低功耗平台,所以在线程调度上面就可以更加简单粗暴了。酷睿 Ultra 200V 的调度逻辑为优先使用单个 E 核,当需要更高负载时则扩展到其他 E 核,负载更高时才会根据需求调度到 P 核心,最大限度的利用 E 核心,减少功耗。

一套组合拳下来,整机功耗和续航方面有着怎样的表现呢?

首先来看整体功耗控制情况,在 UL Procyon 的 Office Productivity 测试中,Ultra 9 288V 在仅使用 E 核心时,相比于高通 X1E-80-100 有着 7% 的性能提升和 49% 的功耗降低,每 W 性能提升 1.2 倍;相比于上代 Ultra 7 165H,有着 7% 的性能提升和 53% 的功耗降低,每 W 性能提升 2.29 倍。

在常用办公、日常使用场景中,对比 Ultra 7 165H,Ultra 9 288V 整体功耗下降最高可达 50%。

到续航方面,英特尔官方给出了两组数据。在相同 OEM 提供的相同模具下,在 UL Procyon Office Productivity 测试与 Microsoft Team 3x3 场景中,Ultra 7 268V 的续航时长可以达到 20.1 小时和 10.7 小时,而高通 X1E-80-100 则是 18.4 小时与 12.7 小时。

在相同 OEM 提供的 14~16 英寸屏幕的模具、1080P 屏幕、75Whr 的电池容量下,同样在 UL Procyon Office Productivity 测试与 Microsoft Team 3x3 场景中,Ultra 9 288V 可以分别达到 14 小时和 9.9 小时的续航能力,而高通 X1E-78-100 的成绩为 9.5 小时与 9.4 小时,AMD HX 370 的成绩分别为 10.1 小时和 8.2 小时。

游戏场景下的核显能耗也有很大的提升幅度,Ultra 9 288V 的 Xe2 架构核显对比 Ultra 7 165H 的核显在 《刺客信条:英灵殿》、《赛博朋克 2077》、《模拟农场 22》 中,最高有 68% 的性能提升和 35% 的核显功耗下降。

Arm 架构的高通骁龙 X Elite 处理器在能耗方面有着 Arm 架构带来的先天优势,但是通过上面的测试可以看到,x86 架构的英特尔酷睿 Ultra 200V 甚至在续航表现上反超了高通骁龙 X Elite,再加上 x86 架构更好的软件兼容性和生态,那么终端产品的真实使用场景下,英特尔酷睿 Ultra 200V 将会是追求低功耗表现上更好的选择了。

2、E 核 IPC 提升 68%,8 核 8 线程强于 14 核心 22 线程

Lunar Lake 的性能核心与能效核心皆有微架构的升级。

高性能核心微架构升级为 Lion Cove,英特尔对于 Lion Cove 的介绍为:「为轻薄 PC 打造速度更快的性能核心」,最高 12MB 共享 L3 缓存,18 个执行端口,更广泛的分配和撤离机制,对于性能、功耗、芯片面积有着针对性的平衡优化,IPC 提升幅度为 14%。

本代的 Lion Cove 并不支持超线程,不过在英特尔给予的数据中,我们可以看到,在关闭超线程后,Lion Cove 可以达成更高的每瓦性能、芯片每单位面积性能、芯片每单位面积每功耗性能,以达成更优秀的能耗表现与性能表现还平衡了芯片规模。

在单线程基准测试中,在 CINEBENCH R24、Geekbench 6.3、SPECrate 2017_int_base 中,Ultra 9 288V 均能提供相比高通骁龙 X Elite 的两款竞品 X1E-78-100、X1E-80-100 以及 AMD 的 HX370 更强的单线程性能。

高效能核心微架构升级为 Skymont,英特尔对于 Skymont 的介绍为:「以高能效比迫近 P 核性能」,4MB 共享 L2 缓存,26 个调度端口,增强指令预测能力,拥有更深的队列提高任务并行处理能力、更广泛的指令分配和撤出能力以及 2 倍的 AI 吞吐量,IPC 提升幅度达到惊人的 68%。

具体到多核性能方面,在低功耗区间段内,凭借着极其优秀的能效比,Lunar Lake 可以以 8 核心 8 线程的规格实现对规格更高的上代 Meteor Lake 产品完成性能反超。在功耗为 9W 时,4P+4E、8T 的 Lunar Lake 性能领先 2P+8E+2PE、14T 的 Meteor Lake 22%,每线程性能领先 2.1 倍;在功耗为 17W 时,4P+4E、8T 的 Lunar Lake 性能领先 6P+8E+2LPE、22T 的 Meteor Lake 10%,每线程性能领先 3 倍;在 23W 时,4P+4E、8T 的 Lunar Lake 性能仅落后 6P+8E+2LPE、22T 的 Meteor Lake 6%,每线程性能领先幅度为 2.6 倍。

在功耗性能曲线上,英特尔着重标记了 Ultra 9 288V 可以在减少 40% 功耗的情况下,达到高通 X1E-80-100 50W 功耗时的多核心性能性能表现;在大约 20W 功耗时,与苹果 M3 性能持平;在 15W 功耗以内时,领先 Ultra 7 165U。

在生产力方面,Ultra 9 288V 在五个维度的测试中,也领先于高通骁龙 X1E-80-100 和 AMD HX 370。

通过更低延迟的总线,缩小了 P 核与 E 核间的访问延迟,内存则是再加上 8MB 内存侧缓存,内存延时被降低到了 90ns 左右,相比于 Meteor Lake 降低了 40%,比 Strix Point 降低了 30%。

在保证高能效的前提之下,Lunar Lake 并不是一个只考虑低功耗而放弃性能的架构,在全新的 P 核、E 核以及内存、总线等等方面的优化和重新设计,Lunar Lake 在低功耗段可以实现对更高规格处理器的性能超越,所以在它的目标使用场景,如办公、学习、网页浏览、在线视频等,可以处理比以往更繁重的工作负载,与此同时,更低的功耗、更高的能效比使得整块处理器的温度表现也会更好,在同等情况下,对于主板上周边元器件以及整机散热规格的要求也都更低,带来的是低发热量+更轻薄的机身尺寸,这也是为何酷睿 Ultra 200V 系列处理器是更适合放在超轻薄本产品中的重要原因之一。

3、再次跃升的核显性能

首代酷睿 Ultra 时,核显架构从之前沿用多代的 Xe LP 升级为了 Xe LPG,性能已经有了相当大的进步,而 Lunar Lake 中的核显再次升级到了 Xe2 架构,拥有最高 8 个第二代 Xe 核心和 8 个光线追踪单元,内置了新的 XMX 矩阵引擎可为 AI 加速,可提供 67 TOPS 的 AI 算力,加之更出色的 Xess 内核,在游戏中可实现更高的帧数表现。

在 45 款游戏中,Ultra 9 288V 的平均帧数表现超越 Ultra 7 155H 31%;超越 AMD HX 370 16%;高通 X1E-84-100 则是有 23 款游戏不能运行,在其余可运行的游戏中,Ultra 9 288V 的平均帧数领先幅度达到 68%。

英特尔的 XeSS 技术会让游戏帧数再进一步,目前市面上已经有 120+款游戏支持 XeSS。Ultra 9 288V 相比于不开启 XeSS,在 XeSS 的 Performance 挡位后,10 款游戏中最高可以达成 60% 的帧数提升。

得益于 8 个全新的光追单元和对 DX12 Ultimate 的完全支持,开启光追后,5 款游戏中,Ultra 9 288V 开启 Xess Performance 挡位对比 AMD HX 370 在开启 FSR Performance 挡位时,帧数领先幅度最高可达 30% 以上。

媒体引擎也依然是英特尔处理器中核显的强项,在编解码方面的支持更加全面,最高支持 8K 60 10bit HDR 的硬件编解码、AV1 格式硬件编解码、全新的 VVC(H266) 格式硬件解码,视频的转码速度上,竞品 AMD HX 370 以及高通 X1E-78-100 都远不及 Ultra 9 288V。

从个人的角度来出发,对于 Lunar Lake 这种产品的目标适用人群和使用场景,图形性能其实并不是一个重要的配置点,哪怕是使用更老的图形架构、更低的规格,在办公和学习场景下其实都几乎不会造成什么影响,但英特尔在 Lunar Lake 上首发自家的 Xe2 图形架构其目的之一肯定是要 「秀技术」,自从 AMD 将 Vega、RDNA 图形架构搬到移动端锐龙处理器后,英特尔酷睿的核显在游戏性能方面就一直落后,直到上代才勉强能掰掰手腕,而英特尔目前的境遇显然需要的是在各方面都要展现出自己的硬实力,对竞争对手实现全方位的领先,才能扭转这几年来不利于自己的市场因素。

另外,这样的核显也自然是有它价值所在和发挥场景的,就例如在 Windows 掌机中,虽然这并不是一个多么大的市场,但当前的 Windows 掌机大部分厂商由于能效比和图形性能的缘故都纷纷加入 AMD 阵营,甚至会去专门定制掌机芯片,比如 ROG 掌机上的 Z1 Extreme。显然英特尔并不想将这部分拱手相让,市场份额和出货量是一方面,作为消费级处理器市场多年来的龙头,英特尔绝对不想在任何一个方面落得下风,Lunar Lake 的高能效比以及图形性能的突破,非常适合放到 Windows 掌机中来使用,或许在这之后我们可以看到更多的厂商推出搭载英特尔酷睿处理器的 Windows 掌机了。

核显的媒体引擎则保持了英特尔一贯的优势,如果平常有轻度的视频剪辑需求,那么凭借着强大的媒体引擎,硬件编解码对视频格式有更广泛的支持,英特尔酷睿处理器就是一直以来在这方面更好的选择,这点依旧是没有变的。

4、120 TOPS 算力

对于当下 AI 应用对 CPU、GPU 以及 NPU 的利用率,目前 NPU 占比 25%,GPU 占比 40%,CPU 占比 35%,英特尔预测在 2025 年,NPU 的利用率占比提高,CPU 则会降低。一般情况下来讲,对于当下的 AI 应用,CPU 虽然通用性更广,但是其算力对比 GPU、NPU 是更低的,所以如果能将 AI 计算负载从 CPU 逐渐转移到 NPU 与 GPU,那么对于 AI 应用的运行速度、能效比等显然是更好的选择。

在 Lunar Lake 中,CPU 算力为 5 TOPS,GPU 为 67 TOPS,专用于 AI 计算的 NPU 单元为 49 TOPS。

在常用的本地生成式 AI 应用 Stable Diffusion 1.5(GIMP) 中,Ultra 9 288V 使用 GPU(FP16) 进行运算时..... 没有对比,因为用来对比的高通 X1E-78-100 又一次的 「DNR」 了,而使用 NPU(W8A16) 时,Ultra 9 288V 的速度更快一些。

在 UL Procyon 的 AI Computer Vision 测试中,Ultra 9 288V 的 int8 性能得分 1886 分,FP16 性能得分 1017,高通仅能完成 int8 的测试,测试成绩为 1760,AMD HX 370 在两项测试中都无法完成。

在 UL Procyon 的 AI Image Generation 测试中,Ultra 9 的 FP16 性能得分 391,AMD HX 370 为 182,高通 X1E-78-100 无法完成。

在 Geekbench AI 项目测试,Ultra 9 288V 在 CPU、GPU 和 NPU 的性能表现都断崖式的领先于竞争对手 AMD HX 370 和高通 X1E-78-100。

实际应用中的表现,以 Ultra 7 155H 为基准,Ultra 9 288V 也极大幅度的领先于竞品 X1E-78-100。

在 AI 生态方面,英特尔对于大语言模型、多模态模型、扩散模型、框架的都有更好的支持,与 ISV 合作有着 300+的 ISV 特性,拥有更好的兼容性、更快的引擎、更多的框架。

不仅仅是 AI 方面的生态,在创作、连接、娱乐、学习等诸多方面,英特尔酷睿平台都会以强大的硬件支撑来提供给用户更好的软件生态。

英特尔列出了其在 Adobe 软件 Pr、Lr、Ae 中部分功能的性能对比,与高通 X1E-78-100 和上代 Ultra 7 155H 的对比中,Ultra 9 288V 也都有大幅度的领先,这得益于与合作伙伴更深层次的合作,可以在新硬件推出后第一时间给予优化支持。

四、写在最后

下面是我个人对于英特尔 Lunar Lake 架构酷睿 Ultra 200V 系列处理器的总结与想法。

从实际的产品出发,Ultra 200V 系列处理器目标是提供 x86 平台更强生态的同时,为 x86 平台引入一直以来缺失的低功耗和高能效比,同时在性能方面完全满足办公与日常所需,这也确实相比于之前的 x86 产品更加适用于轻薄本平台,为差旅人士、办公人群、学生群体等提供更好的便携性、续航能力以及更低的发热量。

而从稍微宏观一点的角度来讲,酷睿 Ultra 200V 由于其更加专注于一类细分市场,它肩负起的任务并不是在市场测出货的多么风生水起,来给予英特尔更多的收入与利润,而是通过其富含的技术力来向投资者、OEM 厂商、终端消费者以更大的信心在接下来还会选择和相信英特尔,它的出现最终要达成的更多的是让大众扭转近年来对于英特尔的负面情绪和认知。

所以如果说酷睿 Ultra 200V 可以 「扶英特尔之将倾」,那么它的出现并不是将英特尔完全扶正,而是最多止住或减缓英特尔的继续倾斜,想要真正的 「扶正」,还需更多的努力与时日。

9 月 24 日,20+OEM 厂商提供的 80+款酷睿 Ultra 200V 机型已经蓄势待发,我们拭目以待!



- Advertisement -spot_img

推荐阅读