您的位置:首页>>智能设备

多核打游戏反而更慢?谈CPU和游戏优化那点事

发布时间:2019-07-28 10:18:47  来源:太平洋电脑网    背景:

  随着AMD锐龙的横空出世,电脑CPU进入了多核震慑的时代。

  同一系列的产品,核心翻倍已经司空见惯,有爆料显示Intel下一代CPU的i3将会配备4核8线程——这样的CPU,三年前它的名字叫i7。

  而在高端系列中,核战更是令人心惊胆战,在售的AMD锐龙3900X的12核24线程已经足以令人倒吸一口凉气,而即将上市的3950X更是配备了16核24线程,数框框爱好者们纷纷表示把持不住,高呼yes根本停不下来。

  然而多核CPU打游戏一定会更快吗?不一定。排除频率、架构IPC的差异,某些情况下多核CPU打游戏甚至会更慢——例如在某些情况下,AMD的12核新品3900X,某些游戏中要比8核的3700X更慢。

有测试显示,核心更多、频率更高的3900X在某些情况游戏表现不如3700X

有测试显示,核心更多、频率更高的3900X在某些情况游戏表现不如3700X

  要知道从规格来看,3900X全面压倒3700X,且不说核心多了四个,连频率也更高(3.8/4.6GHz vs 3.6/4.4GHz),3级缓存也翻了倍(64MBvs32MB),那为什么会出现多核玩游戏更慢的情况?

  今天就从这个现象出发,谈谈CPU和游戏优化的那点事吧。

  游戏的多核优化有多难?

  我们就先从游戏对多核心的优化谈起吧。谈游戏的优化,就绕不开对多核的支持。什么游戏对多核优化好、什么游戏只能一核有难、多核围观,一直是玩家们津津乐道的话题。

  为什么游戏在对多核心的优化上会出问题,而视频压缩等应用就能充分利用多核心?这和游戏的运行机制有关。

  为何游戏喜欢用单核心?

  视频压缩这类任务可以轻易做到并行计算,例如一个线程压缩某个片段,另一个线程压缩另一个片段,多核一起运作,最后压缩完成所有片段,完整视频也就压缩完成了。

  而游戏的运行一般都是线性的,某一步的运算往往会和上一步息息相关,很难充分利用多个线程。

  例如在FPS游戏中,某个玩家被击中产生伤害,那么这个伤害结果和子弹运行轨迹有关,需要先计算出子弹轨迹然后才能计算出伤害,这只能在一条线程中先后完成,无法通过多线程同时计算子弹轨迹和伤害。

  游戏想要充分利用多核,需要巧妙地将计算任务拆分成为多线程,例如不同的线程负责物理碰撞、AI行为等,技术门槛比较高,也得下更多功夫。基于此,目前仍有大量游戏未能充分利用CPU的所有核心。

  支持多核心一定优化好吗?

  随着时代的发展,越来越多游戏愿意在多线程优化上做出努力。

  例如前几年,我们经常可以看到“i3默秒全”的情况,而现在的游戏大作已经将门槛提升至4核,双核i3已经难堪大任。

  但尽管如此,仍会出现12核3900X表现不如8核3700X的情况,这又是为何?

  出现这种情况,主要在于CPU核心调度不合理。锐龙的架构比较特殊,每4个核心封装成为一个CCX,每两个CCX封装为一个CCD,核心和核心之间的通讯,可以跨CCX,乃至跨CCD,而无论是CCX还是CCD之间通信,都存在延迟。

  换言之,如果一个程序能够调用多个核心,会出现以下几种情况。

  1、调用的多核心处于同一CCX内,延迟最小;

  2、调用的多核心跨CCX,但处于同一CCD内,有所延迟;

  3、调用的多核心跨CCX、跨CCD,延迟最大

  例如一个游戏可以调用4个核心,最理想的情况自然是调用同一CCX内的4核,这样能获得最好的性能。

  但实际上,代码对多核心的调用不一定这么智能,很有可能不能辨认出哪些核心位于同一CCX上。于是,游戏可能会调用位于不同CCX、CCD的多个核心,产生的额外延迟导致性能有所损失。

  知道了这些,就可以解释为什么有时候3900X的游戏表现有时候还要低于3700X了。3900X封装了两个CCD,每个CCD内有两个CCX,每个CCX有4核心,原生共4x2x2=16核心,屏蔽了4核心后得12核。

  而3700X则只有一个CCD,内含两个CCX,共4x2=8核。可见,3900X比3700X多了一个CCD,多了一种可能产生额外延迟的情况,如果游戏不能发挥出3900X的多核心优势,那么3900X表现略逊于3700X也就在情理之中了。

  因此,即使游戏对多核进行了优化,但在核心调度方面,也需要另外下更多功夫,才能取得最佳性能。

  很高兴的是,微软已经意识到了相关问题,在Windows 10 1903中做出了优化,系统会优先调度处于同一CCX内的核心,避免跨CCX造成的延迟。

  如果你想要更好地发挥AMD Ryzen处理器的性能,升级到Windows 10 1903还是很有必要的。

  2CPU单核性能真的在挤牙膏?CPU单核性能真的在挤牙膏?有人认为,目前CPU已经很难从频率上做性能突破,架构亦难以进一步提升效率,堆核是性能进步的唯一之道。

  有的朋友从Intel的“挤牙膏”中论证这一观点,认为CPU的同频性能已经多年止步不前,而AMD的Zen2架构尽管效率相对于前代大幅提升,但也只是追上竞争对手的水平而已。

  用数年前的4核CPU和现在的4核CPU玩游戏,体验似乎并没有什么不同,也是一个有力的佐证。但事实是否如此?

  实际上,这种观点是片面的。之所以数年前的CPU在某些测试、某些游戏中表现尚可,是因为这些测试、游戏并没有针对新CPU的指令集作出优化。

  近年来,新款CPU的一大价值在于增加了AVX、AVX2、TSX等指令集。

  如果代码调用了相应指令集,能更高效地利用FMA这样的浮点加乘混合单元,减少CPU流水线的闲置,性能表现可以获得可观的提升。

这些都可是近十年间陆续增加的指令集,不是说没有堆核就是挤牙膏

这些都可是近十年间陆续增加的指令集,不是说没有堆核就是挤牙膏

  以著名的渲染软件Cinebench为例,这是DIY玩家都相当熟悉的CPU测试工具。

  最新版的Cinebench R20对比旧版的Cinebench R15,一大改进就是加入了AVX指令集的支持。

  在CPU对AVX指令集有较好支持的情况下,同样的渲染项目,在Cinebench R20中跑,速度甚至要比Cinebench R15快一倍以上!新型指令集对性能的提升之巨,由此可见一斑。

Zen2的单核性能进步如此大,很大程度上是因为AVX2性能大幅提高

Zen2的单核性能进步如此大,很大程度上是因为AVX2性能大幅提高

  支持AVX或更新的指令集已经在渲染、视频压缩、科学计算等专业领域中渐渐成为常态,著名的Linux发行版Fedora 32甚至计划不支持没有AVX指令集的CPU。

  然而,仍有大量游戏未跟进AVX等新指令集,只支持老的SSE,新CPU跑这些游戏自然和旧款CPU没有太大区别。在指令集支持方面,游戏对CPU仍缺乏应有的优化。

  著名的游戏性能测试组件3DMark已经意识到了这点。在新的Time Spy Extreme测试项目当中,加入了AVX、AVX2乃至AVX512指令集支持,调用AVX512指令集跑分,成绩对比SSE3跑出来的分数高了一倍有余。

  AVX等新指令集在实际游戏中意义也变得越来越重大,例如《刺客信条:奥德赛》甚至不支持没有AVX指令集的CPU(因为太激进,后来不得不重新兼容老CPU)。

  又例如某些使用了D加密的游戏需要FMA3指令集才能正确解密运行,早年的“神U”E1230 v2只能干瞪眼;如果你是PS3模拟器玩家,也有切身体会过TSX指令集下性能的飞跃。

  总体而言,大部分游戏在指令集方面的优化做得依然不够,在缺乏指令集优化的情况下,旧CPU和新CPU的游戏表现拉不出太大差距。

  但支持新指令集是游戏对CPU优化中无法规避的环节,活用新指令集才能彰显新款CPU应有的价值,希望有更多游戏对新的CPU指令集作出优化吧。

  后话

  无论是增加CPU核心多线程,还是使用新型指令集提升SIMD性能,都可以大大增强CPU的性能。

  就消费市场而言,AMD似乎更多地走了多核路线,而Intel则致力于推行新指令集。但无论是哪种发展方向,都需要相应的软件对此作出优化,才能发挥出CPU应有的性能。

  现在早已经不是不改一行代码就能发挥出新CPU的全部性能的时代,多核心和先进指令集,限于匮乏游戏支持的现状,都不得不沦为“战未来”。

  CPU并没有在“挤牙膏”,游戏对CPU的优化也远未到尽头,希望未来我们能看到更多能发挥出CPU真正功力的游戏吧。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:太平洋电脑网

本文评论
千元5G神机开售,iQOO Z1x实力演绎高刷长续航可皆得
要说今年最火热的手机硬件配置,那一定是高刷新率屏幕。从目前发布的5G手机中来看,几乎所有旗舰手...
日期:07-09
有了萤石视频锁DL20VS 家居安全主动把握
近日,某地派出所接辖区群众报警称家中被盗。经民警缜密侦查发现,这是一起典型的“白日闯&rdq...
日期:07-09
Redmi Note 9宣布:性能/相机号称“无与伦比”
7月9日消息,Redmi宣布Note系列新成员Redmi Note 9即将在印度发布。
日期:07-09
Realme C11将于7月14日在印度推出 联发科Helio G35芯片组加持
Realme 刚刚证实,该公司 Realme C11 入门新机将于下周正式登陆印度市场。感兴趣的朋友,可于美国标...
日期:07-09
iQOO Z1x 正式发布
(原标题:1598 元至 2298 元,iQOO Z1x 正式发布:骁龙 765G/120Hz 屏 / 5000mAh 电池)
日期:07-09
想怎么玩,就怎么玩!搭载桌面级十代酷睿的神舟超级战神真香!
电子竞技作为世界上增长速度最快的体育运动,在中国玩家数量增长超过1亿人,现已超过6.5亿人。电子竞技...
日期:07-09
科大讯飞iFLYTEK A.I.开发者大赛 无人机赛道新机遇
2020年,随着“新基建”的加速与催化,我国科技发展也迎来了新机遇。智能科技时代的新一...
日期:07-09
三星手机也不附赠充电头了?
(原标题:三星手机也不附赠充电头了?或改变我们的使用习惯)
日期:07-09
iphone12:不附带充电器 价格仍将提高
(原标题:分析师:即使不附赠 EarPods / 充电器,iPhone 12 定价仍将提高 50 美元)
日期:07-09
荣耀平板 V6 钛空银 Wi-Fi 版明天开卖:麒麟 985+2K 全面屏
7 月 8 日消息 根据荣耀官方的消息,荣耀平板 V6 钛空银 Wi-Fi 版明天开卖,6GB 内存 + 128GB 闪存...
日期:07-08
iPhone用户吐槽续航锐减 电老虎被揪出:系苹果音乐App作祟
你的iOS设备续航水平还安好吗?
  日前,不少国外用户吐槽反馈电量消耗异常的问题,且多数运...
日期:07-08
放弃骁龙875?三星或为Galaxy S21全系配备Exynos 1000芯片组
早前有传闻称,因担心新一代骁龙 875 SoC 助涨新机售价,三星或为 Galaxy S21 沿用高通骁龙 865 SoC...
日期:07-08
华硕证实骁龙 865 + 存在,ROG 游戏手机 3 首发
7 月 8 日消息 华硕将于 7 月 22 日发布 ROG 游戏手机 3,根据此前消息,该机的一大亮点是首发搭载...
日期:07-08
华院数据2020WAIC“认知智能 改变世界”论坛即将重磅呈现
2020WAIC线上活动以"智联世界 共同家园”为主题,致力于打造世界顶尖人工智能合作交流平台,推...
日期:07-08
更专业更智能:讯飞智能录音笔实现声音高效转写
在很多人的印象中,录音笔最大功能就是用来录音,一些重要的信息来不及记录用录音笔就会变得很轻松...
日期:07-08
一加刘作虎将操刀Find X3!
(原标题:一加刘作虎将操刀Find X3!后置四摄加屏下摄像头,买吗?)
日期:07-08
办公新常态、智慧新一代:“办公宝”华为企业智慧屏火热订购中
随着数字经济的发展,我们的生活工作方式也在不断升级更新。特别是在信息化赋能下,企业办公方式也...
日期:07-07
龙之谷2手游怎么操作最爽,北通G2组合手游手柄告诉你
《龙之谷2》作为龙之谷IP的正版大世界手游,不仅以前作宏大世界观为蓝本续写阿尔特里亚的传说,还继...
日期:07-07
骁龙665手机只卖2100元 HTC翻身:6月营收大涨60%
很久没有HTC公司的情况了,这一两年来HTC的业绩江河日下,没有什么给力产品支撑。不过6月份HTC过的...
日期:07-07
Mate V?华为翻盖折叠屏手机外形出炉
华为的首款折叠屏手机Mate Xs至今一机难求,似乎在一定程度上反映了消费者的兴趣以及产品本身制造工...
日期:07-07
  专栏介绍
王涵 的专栏
王涵发表的文章
积分:
自我介绍 :