在计算设备中,我们有一个处理单元来处理数据。这个单元被称为中央处理单元。该单元的主要任务包括数据的编码和解码、数据的存储、数据的处理和编译、数据的执行等。CPU的频率决定了设备的处理或工作速度。当处理大量数据时,需要更大的内存存储。今天,随着图像处理技术的发展,我们正在享受高清晰度的图片、清晰的图形等。这些技术所需的数学运算非常庞大,需要更快的处理单元。为了克服这一点,图形处理单元(GPU)成为了人们关注的焦点。


什么是图形处理单元?

处理单元被用来在计算设备中进行计算。随着3D图像、高清视频流、图形等技术概念的出现。为了在硬件设备上实现这些概念,必须以更高的速度执行大型复杂的数学运算。

中央处理器虽然频率很高,但不能有效地处理如此大规模的计算。因此,引入了一种专用的处理单元,用于以高频率执行更大的计算。这个处理单元被称为图形处理单元。GPU是一种专门的电子设备,主要用于基于计算机图形和图像处理的计算。它们要么与微处理器或主处理器一起嵌入SoC,要么作为具有专用存储单元的独立芯片提供。

计算函数

对于与3D计算机图形相关的计算,GPU使用其设计中存在的晶体管。围绕3D图形的计算包括几何操作,例如将顶点旋转和平移到不同的坐标系、纹理映射和渲染多边形。许多最近的GPU功能还包括CPU、过采样和插值技术的功能,以减少混叠。

如今,随着深度学习和机器学习技术的增加,GPU的使用量大幅增加。为了训练深度学习模型,必须进行大量复杂的计算。GPU的使用使机器学习模型的训练变得更容易。

图形处理单元的速度是CPU的250倍。在GPU加速的视频解码中,GPU执行视频解码过程和视频后处理的部分。用于此目的的常用API有DxVA、VDPAU、VAAPI、XvMC、XvBA。这里DxVA用于基于windows的操作系统,其余用于基于Linux和类Unix的操作系统。XvMC只能解码使用MPEG-1和MPEG-2编码的视频。

GPU可以执行的视频解码过程如下-

  • 运动补偿
  • 离散余弦逆变换
  • 反向修正离散余弦变换。
  • 环路内解块滤波器
  • 帧内预测
  • 反量化
  • 可变长度解码
  • 时空去交错
  • 自动隔行扫描源检测
  • 比特流处理
  • 完美的像素定位

图形处理单元体系结构

GPU通常与CPU一起用作协处理器。通过这种方式,CPU可以以更高的频率执行通用科学和工程计算。这里,代码的耗时和计算密集的部分被移动到GPU上,而剩余的代码仍然在CPU上工作。GPU对代码进行并行处理,从而提高系统的性能。这种类型的计算被称为混合计算。

ding="async" class="size-full wp-image-38633" src="https://uploads.9icnet.com/images/aritcle/20230518/graphical-processing-unit-architecture1.jpg" alt="Graphical Processing Unit Architecture" width="461" height="183" sizes="(max-width: 461px) 100vw, 461px">
图形处理单元体系结构

与包含两到八个CPU内核的CPU不同,GPU由数百个较小的内核组成。所有这些核心在并行处理中协同工作。为了有效利用GPU并行计算架构的功能,NVIDIA的应用程序开发人员设计了一个名为“CUDA”的并行编程模型。

GPU体系结构因其模型而异。GPU的通用体系结构由多个处理集群组成。这些集群包含多个流式多处理器。这里,每个流式多处理器都包含一层第1层指令高速缓存及其相关核心。

GPU表单

基于它们的功能和处理方法,市场上有不同形式的GPU。GPU在个人计算机中有两种主要形式——专用图形卡和集成图形。专用图形卡也被称为离散GPU。集成图形也称为统一内存架构、共享图形解决方案。

大多数GPU的设计都考虑到了它们的应用,如3D图形处理、游戏等。GeForceGTX是专门为游戏设计的,Nvidia Titan是为云计算设计的,Nvidia Quadro是为工作站和3D动画设计的,英伟达特斯拉是为云工作站和人工智能培训设计的,恩伟达Drive PX是为自动化汽车设计的,等等…

专用显卡

具有专用GPU的系统被称为“DIS系统”。这里的专用指的是这些GPU芯片有一个专用RAM供卡专用。这些芯片通常使用PCI Express或Accelerated Graphics Port等扩展插槽与主板连接。这些芯片很容易更换或升级。由于尺寸和重量的限制,便携式计算机上的专用GPU通过非标准插槽连接。

集成图形处理单元

这种类型的GPU没有专用的RAM单元。相反,它使用了一部分计算机内存来进行操作。该GPU可以作为芯片组的一部分集成到主板上,也可以与CPU构建在同一芯片上。这些显卡的容量比专用显卡小,但实现成本较低。Intel HD Graphics和AMD加速处理单元就是这种GPU的例子。

混合图形处理

该GPU的功能位于专用图形卡和集成图形卡之间。这使用了一部分系统内存,还具有一个小型专用内存缓存。这种专用缓存弥补了RAM的高延迟。ATI的超内存和Nvidia的TurboCache是常用的混合图形处理单元。

流处理和通用处理GPU

这些通常被称为GPGPU。通用图形处理单元通常用作修改后的流处理器来执行计算机内核。使用这个概念,现代图形加速器着色器的巨大计算能力被用作通用计算能力。对于大规模矢量运算,这种方法比简单的CPU具有更高的性能。

外部GPU

与大型外部硬盘驱动器类似,该图形处理单元也位于计算机单元的外部。这些也与笔记本电脑外部连接。笔记本电脑通常有大量的RAM和足够强大的CPU。笔记本电脑嵌入了功能较弱但更节能的板载图形芯片,而不是功能强大的图形处理器。这些功能不足以执行游戏图形,也不支持更高图形的游戏。因此,这款外部GPU与笔记本电脑一起使用,以获得更高的性能。

随着对高图形和良好图像分辨率的需求不断增加,对更强大的GPU的需求也在增加。凭借强大的GPU,在机器学习和深度学习等高处理技术领域可以取得更多成就。GPU也加速了游戏行业的巨大繁荣。已经推出了许多高图形游戏,充分利用了GPU的功能。哪种类型的GPU可以外部连接到笔记本电脑?

常见问题解答

1). GPU是显卡吗?

计算机设备上的图形卡是一个完整的硬件部分。而GPU是存在于图形卡上的芯片。

2). 哪个是更快的CPU还是GPU?

如今,与传统CPU相比,GPU具有更大的存储单元、更高的处理能力和更大的内存带宽。因此,GPU被发现比CPU快大约50到100倍。

3). 一个GPU有多少内核?

GPU进行并行计算。它有数百个较小的核心在一起工作。这种大规模的并行计算为GPU提供了卓越的计算能力。

4). RTX还是GTX更好?

与GTX 1080 Ti相比,RTX 2080具有更新的技术,并提供更好、更快的性能。与GTX相比,RTX的成本更低。

5). GPU可以取代CPU吗?

GPU比CPU快。他们一次执行许多任务,执行任务的速度非常快。但它只能执行某些更高频率的操作,以及所有其他执行,如中断、数据存储等,都由CPU完成。不,GPU无法取代CPU。