当前互联网、物联网等技术和产业的发展,将我们带进了一个初步的数字化世界中。相信大家也有同感,日常工作、生活、娱乐等方方面面已经很大程度上建立在数字技术之上。
那么,这些数字技术具体包括哪些呢?除了我们大家熟知的5G、Wi-Fi 等通信技术,支撑我们数字娱乐生活的,其实还有一项关键技术:GPU。
特别是在当前移动化浪潮席卷一切的背景下,移动GPU会迎来怎样的发展,也是目前科技界最重要的课题之一。众所周知,GPU和CPU不同,CPU核心数少,但拥有足够多的数字和逻辑运算单元,因此擅长通用的数字逻辑运算。而GPU核心数众多,每个核拥有的缓存相对较小,非常擅长进行大规模数据并行计算。而图形计算就是这种类型的计算,因此天然适合由 GPU 来完成。
就移动端来说,目前负载最高、效果最极致的图形计算主要是游戏场景,而且随着移动游戏的市场规模越来越成为主流,游戏画面品质的提升会成为刚需,这将非常考验移动 GPU 的整体性能。
同时,以XR为核心技术的元宇宙正在大步向前,这无疑也将需要更大规模的图形即时演算,因此,移动GPU的性能演进势在必行。
但同时,考虑到移动终端移动性,在高性能负载下无法承载体积庞大的散热体系,这就需要移动GPU同时也拥有强大的能效表现。
所以,与桌面端GPU以狂飙性能为主的发展趋势不同,移动GPU必然会朝着性能与能效极致平衡的方向发展。
众所周知,性能与能效是一对矛盾综合体,所以某种程度上来说,想要实现性能和能效的极致平衡,是比狂堆性能更艰巨的挑战。
如何完成这个挑战?联发科从提高性能和增效两条并行的路径给出了答案。
不久前,联发科举办了一场MediaTek天玑旗舰技术沟通会。从这场沟通会中,我们就能看到目前行业领先的移动芯片平台解决方案提供者,是如何探索移动 GPU 提高性能与增效方案的,同时也可以让我们一窥移动 GPU 的未来发展。
首先看性能,这一点可以参考桌面端 GPU 的发展趋势。说起桌面 GPU 的“性能魔法”,这两年最炙手可热的无疑就是光线追踪技术。光线追踪能够最大程度模拟现实世界中光线折射、反射的原理和效果,从而极大提升 3D 虚拟场景中的拟真感,也就是提高画质。
具体来说,光追可以从三个方面提升渲染画面的拟真品质。
第一个是软阴影,即让物体根据光线强弱、光源距离产生强和弱的阴影效果,让阴影更符合真实的表现。还有是反射效果,比如在水面、光滑物体表面增加反射的效果,也可让观感更接近真实。最后是加入全局光照,也就是直接光源和间接光源的结合与交互都能细腻的表现出来,从而进一步增强环境的真实性。
要做到这些,需要非常巨大的计算量,在桌面端,英伟达在 2018 年的图灵 GPU 架构中成功将光追带入到桌面游戏市场,但同时并行的是更大的散热模组。在移动端这么做显然不行。
那么移动光追应该如何实现呢?目前有两个方向,其一是基于软件的方案实现光追效果,而更彻底的,是通过硬件级加速,实现实时的光线追踪。只有基于硬件的光线追踪,才能在效果和功耗之间达到最好的平衡。
除了提升性能,为移动GPU增效,也是重中之重,但这也是移动GPU发展进化的一大难点。
至于提升移动GPU的整体能效,这是一个系统性的工作,需要从芯片底层到应用软件和硬件的全链路优化,才能对系统整体的功耗进行优化和控制。
遵从这个思路,可以将移动GPU的增效方案分为“三板斧”,分别是底层软硬件的适配、AI等技术加持的系统级深度优化以及生态层面的广泛合作。
所谓底层软硬件的适配,包括GPU芯片层面的进化以及图形计算接口、标准等软件对能效的优化。
系统级的优化方案则是在此之上引入对应的平台技术,来进一步为 GPU 的运算降低负载,这其中,AI技术的引入是非常重要的,特别是有独立AI处理模块的情况下,通过异构同步运算,可以大大降低GPU的工作负荷。这也是移动GPU发展的一个重要趋势。
当了解了移动 GPU 在未来发展的主旋律后,相信很多朋友不禁要问,在沿着这个主基调前行的路上,行业现如今的进展究竟如何?
前面提到,联发科在今年的MediaTek天玑旗舰技术沟通会就讲到了移动GPU方面的内容。一直以来,联发科在移动GPU发展方向上的探索都是非常积极且有前瞻性的,一定程度上也能代表行业里最前沿的研究进程。
比如在移动光追方面,联发科在去年10月就正式发布了移动端光线追踪SDK解决方案。目前联发科顶级的天玑9000移动平台,就基于Mail-G710 GPU 实现了移动端光追图形渲染技术,可以有效提升手游画质,像OPPO Find X5 Pro天玑版这样的产品,还做出了光线追踪壁纸这样独特的系统级应用。
要知道,Vulkan接口标准组织在今年1月才发布支持Vulkan Raytracing光追的API,而联发科在2020年12月就已经提前布局了Ray Query技术方案,其技术领先性和前瞻性可见一斑。
当然,之前的移动光追还是基于软件的,但随着Arm在今年6月推出首款移动端硬件光追的GPU产品Immortalis-G715,真正的硬件级移动光追已经近在眼前。Immortalis-G715 拥有2倍的浮点算力提升,对三角片的输出能力也提升了3倍,同时还有带宽的升级,完全能驾驭复杂、真实的光追场景渲染。
联发科也是第一时间与 ARM 展开了合作。在这次沟通会上,有媒体问到了联发科与 Immortalis GPU 合作的进展,联发科的回应是“即将推出相对应的产品,各位可以再期待一段时间。”这显然让人对联发科搭载硬件级移动光追的下一代天玑旗舰芯片有了更多期待。
在移动 GPU 增效方案的探索方面,联发科同样也是走在了行业的前面。
前文我们分析到,移动 GPU 的增效,离不开底层软硬件、AI 等系统级优化技术和生态合作三个方向,事实上联发科的具体布局也与这三个方向密切相关。
比如在 GPU 芯片底层,联发科的天玑之星生态实验室一方面与金标联盟联合推动 64 位生态的普及,因为在 64 位计算环境下,主流芯片能获得 13.2% 至 35.2% 的能效提升,更能令游戏帧率平均提升 16%。
另一方面,联发科始终第一时间支持最新的 Vulkan 标准,因为 Vulkan 相较于其他图形接口标准能够显著提升 GPU 的效率和性能,在联发科的深度优化下,热门游戏的 Vulkan 性能平均可提升 10%。因此普及 Vulkan 生态,对移动 GPU 的增效很有意义。
当然,不可忽略的还有 GPU 芯片本身制程工艺的每年进步迭代,也能带来大约 15% 的能效收益。联发科的下一代天玑旗舰,定然会采用最先进的制程工艺。
在底层软硬件优化的基础上,联发科还会通过系统调优、GPU 驱动优化,实现进一步的降载渲染等等,这一部分会引入 AI 相关的技术能力。
不过与 AI 相关更引人关注的,是更上层的优化,也就是与应用内容开发商、终端厂商等生态伙伴合作的一些自研技术。
举个例子,比如联发科在去年 10 月就预告过的移动端游戏超分(Game AI-SR)技术,就是利用 GPU 与 APU 的异构方案,在保证相同甚至更高游戏画质的前提下,来降低 GPU 的工作负载,从而提升能效。目前这项技术已经在于终端厂商 vivo 合作中应用在了 vivo X80 系列手机里。
除了游戏超分,联发科还有自适应调度技术、可变速率着色等技术,都实实在在提升了移动 GPU 的能效。
说到生态层面的合作,联发科还提出与内容方案商共同定义一系列自适应框架,比如谷歌的 ADPF 方案,ARM 的 Adaptive Preformance 框架,还有腾讯的 TGPA 等等,有了这些自适应框架,内容厂商可以收到来自系统、芯片实时的讯息,从而进行实时的负载调整,对于 GPU 的降低负载有着直接的收益。
可以看到,在联发科这样的移动芯片平台解决方案提供商,以及整个移动数字产业参与者的共同努力下,移动 GPU 正朝着“提速增效”的大方向稳步前进。我们在移动端数字娱乐体验的每一步提升,都让人无比期待移动 GPU 能够为我们“渲染”出的美妙的未来。
结语
当然,未来我们要实现全社会的数字化转型,在移动端仅仅依靠 GPU 的升级进化远远不够,它是一个需要各种技术深度融合才能构建的世界。而在这次 MediaTek 天玑旗舰技术沟通会上,联发科还分享了包括 AI 图像语义分割、5G 新双通、Wi-Fi 7、高保真蓝牙音频、高精度导航等主题,助力手机用户充分享受天玑旗舰技术带来的全场景体验升级,也为未来的移动数字化生活做好了充分的准备。
对世界级的科技企业来讲,技术硬实力决定了其能否飞得高,对市场和用户需求的洞察和预判则决定其能否走得远。显然,联发科在这两方面都做得十分出色,多个领域的数年深耕与致力于提升用户体验的初心共同筑起了一道坚实的壁垒。如今,网传联发科下一代天玑旗舰芯片天玑 9200 正在走近,在领先的旗舰技术加持下,或许其将成为的变革新一代终端体验的产品,值得我们共同期待。