본문 바로가기
IT magazine

그래픽카드 스펙 보는법(용어 정리, 개념 이해)

by 테크 인사이더스 2024. 4. 1.

'그래픽카드 스펙 보는법'에 대한 설명은 다양한 용어와 개념을 간단하게 정리하여 쉽게 이해할 수 있도록 안내하고 있습니다. 이 글은 GPU 스펙 항목을 자세히 설명하고, 독자들이 그래픽 카드의 성능 및 기능을 더 잘 이해할 수 있도록 도와줍니다. 자세한 내용은 아래 포스팅을 확인해 주세요.

 

그래픽카드-스펙-보는법-용어-정리-개념-이해

목차
1. 그래픽카드 스펙 보는법(용어 정리, 개념 이해)
쿠다 코어(CUDA Cores) - 부스트 클럭(Boost Clock) - AITOPS - 메모리크기(Memory size) - 메모리타입(Memory Type) - 메모리버스(Memory Bus) - 대역폭(Bandwidth) - 텐서/AI 코어(Tensor/AI Cores) - TMU - ROP - Pixel Fillrate - Texture Fillrate -  L1 캐시 - L2 캐시 - PCIe -  DirectX - OpenGL - OpenCL - Vulkan - 쿠다 기능(CUDA Features) - 쉐이더모델(Shader Model)
참고
NVIDIA GeForce RTX 4050 →
NVIDIA GeForce RTX 4060 →
NVIDIA GeForce RTX 4070 →
엔비디아 RTX |  엔비디아 네모 | 엔비디아 아바타 클라우드 엔진 →
NVIDIA Nsight 업데이트 →
글로벌 일루미네이션 | 포톤 매핑 →

 

그래픽카드 스펙 보는법(용어 정리, 개념 이해)

그래픽카드-스펙-보는법-용어-정리-개념-이해-설명-이미지

본문에 들어가기 전에 간단히 요약하자면, 대부분의 항목은 높은 수치가 긍정적인 결과를 보이는 경향이 있습니다. 그러나 일부 항목에서는 반대의 경우도 있을 수 있으며, 스펙을 이해하기 위해서는 각 항목이 어떤 역할을 하는지를 이해하는 것이 중요합니다.

 

최근 기술의 발전으로 항목의 수는 계속해서 늘어나고 있지만, 이번 콘텐츠는 주로 AI 성능을 확인할 수 있는 항목과 기존의 대표적인 항목을 중점으로 작성했습니다.

 

*아래 항목은 NVIDIA GeForce RTX 그래픽 스펙을 기준으로 합니다.

 

 

그래픽카드-스펙-보는법-용어-정리-개념-이해-설명-이미지
NVIDIA GPU

쿠다 코어(CUDA Cores)

NVIDIA GPU에서 사용되는 병렬 처리 코어입니다. 이 코어들은 병렬 컴퓨팅 작업에 사용되며, 그래픽 처리 및 일반적인 계산 작업을 가속화하는 데 사용됩니다.

 

부스트 클럭(Boost Clock)

GPU의 클럭 속도 중 최대 속도를 나타냅니다. 이는 제품의 사양에 따라 자동으로 증가하여 성능을 향상시킬 수 있습니다.

 

AITOPS(AI Tera Operations Per Second)

AITOPS는 인공지능 작업을 수행하는 능력을 측정하는 지표로, 초당 연산 횟수(tera operations)를 나타냅니다. 따라서 높은 AITOPS 값은 해당 장치가 더 높은 인공지능 작업 성능을 가진다는 것을 의미합니다.

 

메모리크기(Memory Size)

GPU에 탑재된 메모리의 용량을 나타냅니다. 메모리 용량이 클수록 더 많은 데이터를 처리할 수 있습니다.

 

메모리타입(Memory Type)

GPU에 사용되는 메모리의 종류를 나타냅니다. 예를 들어, GDDR6은 그래픽 메모리로 널리 사용되는 고속 메모리 유형 중 하나입니다.

 

메모리 버스(Memory Bus)

메모리 버스는 GPU와 메모리 간의 데이터 전송을 담당하는 통로로, 이 통로의 폭이 데이터의 전송 속도와 대역폭을 결정합니다. 넓은 메모리 버스는 더 많은 데이터를 한 번에 전송할 수 있기 때문에 더 높은 대역폭을 제공하여 성능을 향상시킵니다.

 

대역폭(Bandwidth)

GPU의 메모리 시스템이 단위 시간당 전송할 수 있는 데이터 양을 나타냅니다. 높은 대역폭은 더 빠른 데이터 전송을 의미합니다.

 

텐서/AI코어(Tensor/Ai Cores)

그래픽카드-스펙-보는법-용어-정리-개념-이해-설명-이미지
예시) 좌 FP 16(Baseline), 우 NVIDIA TensorRT INT8

인공지능 작업을 수행하는 데 사용되는 코어의 수를 나타냅니다. 높은 수의 텐서 코어는 더 높은 AI 성능을 제공합니다.

 

TMU(Texture Mapping Units)

TMU는 그래픽 처리 단위에서 텍스처 매핑 작업을 처리하는 단위의 수를 나타냅니다. 이는 3D 그래픽에서 텍스처를 렌더링 하는 데 사용되며, TMU의 수가 많을수록 그래픽 처리량이 향상되고 더욱 세부적이고 현실적인 그래픽을 생성할 수 있습니다.

 

ROP(Raster Operations Pipelines)

그래픽 처리 단위에서 화면에 렌더링 되는 픽셀의 수와 속도를 결정하는 파이프라인의 수를 나타냅니다.

 

Pixel Fillrate

그래픽 카드가 초당 처리할 수 있는 픽셀 수를 나타냅니다. 더 높은 GPixel/s은 더 빠른 그래픽 처리를 의미합니다.

 

Texture Fillrate

그래픽 카드가 초당 처리할 수 있는 텍스처 매핑 작업의 수를 나타냅니다. 높은 GTexel/s은 고해상도 텍스처나 다양한 그래픽 효과를 처리하는 데 도움이 됩니다.

 

L1 캐시(L1 Cache)

GPU 내부의 작은 용량의 캐시 메모리로, 코어들 간의 데이터 공유와 빠른 액세스를 위해 사용됩니다.

 

L2 캐시(L2 Cache)

GPU 내부의 더 큰 용량의 캐시 메모리로, 메모리와 코어 사이의 데이터 전송을 중재하고 메모리 액세스의 지연을 감소시키는 데 사용됩니다.

 

 

PCIe(Peripheral Component Interconnect Express)

컴퓨터에 장치를 연결하는 데 사용되는 표준 인터페이스입니다. PCIe 4.0 ×16은 넓은 대역폭을 제공하여 높은 성능의 그래픽 카드와의 통신을 지원합니다.

 

DirectX

마이크로소프트에서 개발한 그래픽 API 중 하나로, 윈도우 플랫폼에서 게임 및 멀티미디어 애플리케이션을 지원하는 API 집합입니다.

 

OpenGL(Open Graphics Library)

공개 그래픽 라이브러리로, 다양한 플랫폼에서 그래픽 애플리케이션을 개발하기 위한 표준 API를 제공합니다.

 

OpenCL(Open Computing Language)

다양한 디바이스에서 병렬 컴퓨팅 작업을 수행하기 위한 프로그래밍 언어 및 API입니다.

 

Vulkan

그래픽 및 컴퓨팅 작업을 위한 크로스 플랫폼 3D 그래픽 및 컴퓨팅 API입니다.

 

쿠다 기능(CUDA Features)

NVIDIA의 병렬 컴퓨팅 아키텍처인 CUDA의 기능에 대한 지원 수준을 나타냅니다.

 

쉐이더모델(Shader Model)

그래픽 카드에서 사용되는 쉐이더 프로그래밍 모델의 버전을 나타냅니다. 높은 쉐이더 모델은 더 고급의 그래픽 효과를 지원할 수 있습니다.

 

그래픽카드-스펙-보는법-용어-정리-개념-이해-설명-이미지