因为一般人能接触到的软件应用中,游戏对硬件性能的要求是最高的。如果没有广大的游戏玩家均摊了GPU成本,仅仅依靠少数科研单位、设计院,是很难撑得起高性能计算领域。
我们衡量电脑性能,常用的一个单位是FLOPS,floating point operations per second,每秒浮点运算次数。
一般来说,运行一个应用产生的计算量,来自于两个维度:运算复杂度和数据量。复杂度方面,比游戏复杂的应用很多,但数据量能比游戏更大的就不多见了,也就视频应用能比一下。事实上今天的电脑游戏也叫video game,属于视频应用的一种。
视频应用的巨大数据量来自于高分辨显示设备数以百万计的像素,再乘以每秒需要显示多帧画面才能让我们的眼睛认为这是连续的运动图像。以目前算入门级的显示设备,1080P分辨率,即920×1080、60Hz刷新率需要每秒产生60帧画面。RGB颜色,每种颜色8位深度,以此计算每秒产生的数据量为:
1920×1080×3×8×60=2.986 Gbit=373MB。
常见的录制视频,每秒只有24~30帧图像,而且从编码视频中解码的运算量比3D游戏从三维线框模型变化、纹理贴图、计算显示的复杂度要低得多。如果是最新的光线追踪游戏,一束光线要计算十数次甚至数十次的反射和散射效果,计算复杂度还会进一步提高。
展开全文
事实上,能满足大部分非光线追踪游戏在1080P分辨率下达到60FPS的1060显卡,理论计算性能大概是3.5~4.3 TFLOPS(单精度),上面的1秒钟游戏画面数据量相当于93M个单精度浮点数据,如果假设显卡理论性能可以发挥50%,以3.5 TFLOPS计算,平均每个数据进行了1.8万次以上计算。
作为对比,笔记本的甜点级显卡,满血3060的理论性能是9.85~13.08 TFLOPS。
台式机上16核的AMD 5950X,支持AVX2指令集,256bit数据宽度相当于8个单精度浮点数据,支持FMA指令每个时钟周期进行2次计算,每个核心2个浮点单元,基本频率3.4 GHz,理论性能为:
8×2×2×16×3.4=1.74 TFLOPS。
所以,带有独立显卡的高性能笔记本,被大家称为游戏本。游戏这么变态的性能要求都能满足了,性能高不高还用说吗。返回搜狐,查看更多