我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。无穷尽的算力增长,对于英特尔这样的公司提出了更大的挑战。
过去几十年,在摩尔定律的持续作用下,芯片算力大幅提升,驱动了互联网以及移动互联网的快速发展。如今,我们正处于数据大爆炸的时代,这不仅意味着数据量的爆发,更带来了数据形态的多样化。单纯依靠摩尔定律提高晶体管密度来大幅提升性能的做法,已经无法满足大数据、5G、AI 等新技术的计算需求,业界要更多的并行解决方案。在这一时代背景下,英特尔提出了制程和封装、架构、内存和存储、互联、安全、软件六大技术支柱,希望以此为灯塔,照亮未来数年前行的方向。
而这六大技术支柱背后的核心人物,正是芯片界大神 Raja M. Koduri。Raja 在 2017 年加入英特尔,目前担任英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理,他不仅直接负责英特尔独立显卡项目和显卡架构 Xe 的研发工作,也是 跨架构统一编程框架 oneAPI 的核心负责人。
近日,InfoQ 记者有幸在上海紫竹园英特尔亚太研究院见到了 Raja,并对他进行了采访。在采访中,Raja 表示,英特尔正在快速 从以 PC 为中心的时代进入到以数据为中心的时代, 在这一转型过程中,异构计算至关重要,且对制程和封装、架构、内存和存储、互联、安全、软件这六大技术领域都提出了相当大的挑战。在 Raja 看来, 英特尔是现在唯一一家可以横跨这所有六大技术领域的企业。
英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理 Raja M.Koduri
我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。过去,英特尔在制程技术和 CPU 方面始终保持领先,但面对更强的计算需求,以及半导体芯片行业自身发展的瓶颈,英特尔必须突破制程和 CPU 领域,向六大领域迈进,并且都做到领先。
Raja 表示:“首先,制程的重要性已经不言而喻了;而从 CPU 到 XPU 的发展,也让架构变得日益重要;随着数据的不断爆发,内存和存储可以说是现在发展的最大瓶颈;还有互连,我们希望能够实现从微米到英里的全面互连,这也是英特尔一个重要的技术蓝图之一;安全的重要性这里也不再多说,相信大家都了解到它有多么关键;最后是软件,它的重要性是其他技术领域的十倍,如果没有软件的支持,我们是无法实现计算性能的指数级增长的。”
“软件为先”是英特尔近两年新提出的技术口号,Raja 更是在多个场合不断强调“全新的硬件架构每一个数量级的性能提升,软件就能带来两个数量级的性能提升。”在采访中,Raja 也给出了几组实际数据:从 JDK8 到 JDK9,现有硬件的性能提升了 6 倍;结合内存层级架构,加上软件栈技术,借由傲腾 + 软件的方式能够将工作负载的性能提升 8 倍;利用 DL Boost 等架构扩展,从 Skylake 升级到 Cascade Lake 之后,相比上一代硬件能够提速 28 倍之多。这相当于在一次软件发布中就能实现数代硬件的性能提升。
Raja 进一步表示,通过软件和硬件的结合可以让摩尔定律的提升变成十倍。因为摩尔定律会带来更多的晶体管,而软件可以将越来越多的晶体管的极致性能释放出来。将软件和硬件结合,是英特尔接下来的战略重点,也是英特尔未来面临的非常巨大的机会。
带领团队开发出英特尔自己的高性能独立显卡,是 Raja 加入英特尔之后最重要的工作之一。此前,英特尔宣布将在明年六月份正式发布其高性能独立显卡,这距离英特尔着手开始研发仅仅三年。Raja 告诉 InfoQ 记者,在独立显卡研发过程当中,团队面临的最大挑战在于如何为独立显卡准备成熟的软件,这其中有大量工作要做。
集成显卡领域是英特尔的强项,研发团队已经为集成显卡开发了非常好的软件,而这些技术需要借鉴到独立显卡上,尤其是数据中心的图形卡,这是对团队的挑战。但是,Raja 对此并不担心。在他看来,在过去很长时间里,英特尔在 CPU 软件方面拥有大量的历史经验和技术积累,研发团队将充分利用这些优势并将之应用在 GPU 领域的开发上。
Xe 架构就是目前的阶段性成果之一。它是英特尔全新的 GPU 计算架构,专为高性能计算领域打造,将于 2021 年上市的英特尔首款 7 纳米产品便将是基于英特尔 Xe 架构的通用 GPU。虽然在本次访谈中 Raja 表示无法透露太多关于 Xe 架构的技术细节,但对于 Xe 架构本身,Raja 表现得相当有信心:“有关 Xe 架构和市面上现有的 GPU 架构有什么不同,这里我先卖个关子,等我们真正发布这款产品的时候,大家可以拭目以待,相信大家对我们的产品特点是非常期待的。”
Raja 仅仅向我们透露了一个有关 Xe 架构的特点,那就是其同时提供两个不同的微架构,分别针对不同的应用场景,一种应对数据中心的高性能要求,另一种应对客户端的低功耗要求。可扩展性将是 Xe 架构的核心优势,有了两种微架构的加持,Xe 架构的应用可以横跨多个计算和图形细分市场,从主流笔记本电脑和发烧友级游戏系统到数据中心的高性能计算,满足广泛的市场和工作负载需求。
此外,英特尔还提出了名为 oneAPI 的统一软件编程框架,旨在提供一个跨不同硬件架构的统一编程接口,使开发者可以随意在底层硬件之间切换和优化。oneAPI 在设计之初,就对充分发挥 Xe 架构性能做了充分考量,不管是高性能还是低功耗,都能支持 Xe 架构输出最佳性能。另外,OneAPI 的设计也符合英特尔所有其他不同计算和应用的需求。无论是 CPU、FPGA 还是加速器,OneAPI 的设计都可以和它们进行非常完整的配合。
英特尔的目标是实现最简流程,通过一个统一的软件栈、统一的 API 就可以适应从性能、功耗到成本上的不同优化需求。
事实上,如果论 GPU 芯片占有率,英特尔是当之无愧的世界第一,尤其在消费领域里,每年都有超过两亿台搭载英特尔核芯显卡的新 PC 出货,除此之外超过 10 亿用户都在使用英特尔 GPU 和显卡的一系列产品,因此英特尔有着非常深厚且广泛的用户基础。在此基础之上,英特尔希望通过研发高性能独立显卡更进一步,借此进军到余下的市场,继续发掘英特尔在 PC 市场上的潜力,这是英特尔推动高性能独立显卡研发的主要原因。
既然决心向高性能独显 GPU 领域发展,那么英特尔自然避不开两个强大的竞争对手,NVIDIA 和 AMD。不过 Raja 认为,英特尔与 NVIDIA、AMD 有明显的区别,得益于在 CPU、存储、软件等领域的深厚底蕴,英特尔有能力和自信提供更加一致的用户体验。这意味着不管是在台式机、手机还是在其他设备上,都可以获得完全一致的用户体验,这可能是 NVIDIA 和 AMD 很难做到的。
面向未来五年,Raja 和英特尔的工程师们有一个大胆的工程愿景,那就是在 10 毫秒内,向世界上每个人提供每秒万万亿次浮点运算的计算能力和 10PB 数据。为此,英特尔在设计与工程模式方面进行了战略性转变。无论是 CPU 还是 GPU,无论是 oneAPI 还是 Xe 架构,都与英特尔六大技术息息相关。英特尔在传统的制程和封装领域拥有丰富的经验,但当前面临的挑战越来越多样化和复杂化。单纯依靠晶体管密度提高获得性能大幅优化的时代已经不复存在,英特尔需要找到其他更多的并行解决方案。
Raja 认为,“英特尔选择六大技术支柱作为未来发展的重要愿景,并不是因为它们中的哪个很简单,或者哪一个不重要,而是因为每一个都非常关键。在每个单独的技术领域以及支柱体系之下都有着非常复杂的问题需要解决,而 英特尔也是现在唯一一家可以横跨这所有六大技术领域的企业 。如果今天此时此刻一定要让我选出一个最大的挑战,我可能会说软件。因为毕竟现在我们很大一部分精力都是放在像人工智能领域,为了更好地取得突破以及进展,软件是非常重要、需要着手的地方。但是如果放眼未来的 5 年和 10 年,我要说的是,六个都非常关键,都面临很大的挑战,需要不断地创新。”