본문 바로가기

컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

조회 수 158 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

수정 삭제

단축키

Prev이전 문서

Next다음 문서

수정 삭제
Extra Form

지난 2011년 라데온 HD 7000 시리즈를 시작으로 사용된 AMD GPU의 대표 아키텍처인 GCN(Graphic Core Next)는 3D 연산과 GPGPU를 모두 잡겠다는 설계 이념을 도입, 당시에는 나름 혁신적인 아키텍처였지만 GPU가 모든 일을 처리하는 방식을 고집하면서 GPU의 부담이 크고, 이는 발열과 소비전력 상승으로 이어졌다.

GCN은 라데온 RX 400 시리즈까지 4세대의 변화를 거쳤지만, 근본적인 아키텍처의 한계상 게이밍 성능에 집중하고 CPU 의존도를 높인 엔비디아의 지포스 그래픽 카드에 비해 하이엔드 경쟁에서 맥을 추지 못했고, 결국 게이밍은 지포스라는 인식이 깊게 뿌리박히는데 한 몫했다.

그러던 AMD가 마침내 GCN 아키텍처를 버리고 RDNA라는 새로운 아키텍처를 도입한 Navi GPU를 7월 7일 출시한다는 내용을 E3에서 밝혔다. 당시 내용에 따르면 RDNA 아키텍처는 Vega 아키텍처 대비 IPC는 25%, 소비전력대 성능은 50% 향상되었다.

Navi GPU가 전세대 라데온 RX 500 시리즈와 같이 메인스트림 게이밍 그래픽 카드에 대응하는 제품이고, 라데온 RX 500 시리즈는 당시 지포스 GTX 1060 6GB급의 성능이 한계였다는 것을 감안할 때, 결과적으로 엔비디아의 최신 준하이엔드급 그래픽 카드인 지포스 RTX 2070에 비교할 수 있는 성능을 끌어낸 RDNA 아키텍처의 잠재력을 짐작할 수 있다.

특히, 이번에 공개된 제품이 라데온 RX 5700 시리즈로, 보다 고성능의 라데온 RX 5800 시리즈도 예상되는 만큼, 이제 하이엔드 게이밍 그래픽 시장에서의 본격적인 경쟁을 기대할 수 있을 것이다.

이번 기사에서는, CPU 시장에서 인텔의 독주에 제동을 건 라이젠에 이어 하이엔드 게이밍 그래픽 카드 시장에서 엔비디아의 독주에 제동을 걸어줄 것으로 기대를 모으고 있는 AMD Navi GPU의 핵심인 RDNA 아키텍처에 대해 조금 심도 있는 내용을 정리했다.

명령 처리 방식 변경으로 CU 효율 증가

AMD가 RDNA를 발표하며 강조한 것은 8년간 사용되면서 구식이 되어버린 GCN 아키텍처의 효율 개선 작업이었다. 이를 위해 CU 디자인의 변경과 다층 캐시 구조, 그래픽 파이프라인의 간소화를 강종했으며, RDNA 아키텍처에 대해 알아보는 이번 기사 역시 이들 세 가지를 위주로 진행한다.

AMD가 RDNA 아키텍처의 주요 변경 사항으로 내세운 CU(compite Unit) 디자인을 보면, 스칼라 유닛과 스케쥴러를 조절해 확대해 명령어 처리 능력을 두 배로 높였고, SIMD 유닛을 16way에서 32way로 확대한 대신 4개의 SIMD 유닛으로 구성되던 GCN과 달리 2개의 SIMD 유닛으로 구성된다.

공유 스칼라 유닛과 벡터 유닛도 1개에서 2개로 늘렸고, 이를 통해 AMD GPU에서 한 번에 처리하는 스레드 처리 단위인 Wavefront를 64개에서 32개로 줄이면서 CU 2개를 묶은 '듀얼 CU' 구조를 택해 효율을 높였다. 

이러한 구조를 통해 최대 2배의 ALU, 2배의 레지스터와 4배의 캐시 대역폭 접근이 가능해졌다.

예를 들어, GCN 아키텍처는 1개의 Wavefront 64 처리를 위해 GCN 아키텍처에서는 16way SIMD이 1개의 스칼라 유닛을 사용해 3개의 SIMD가 유휴 상태에 빠진 상태로 작업 처리에 4사이클이 소요되는 반면, RDNA 아키텍처는 스칼라 유닛을 확대해 32개 단위로 Wavefront를 사용하고 32way SIMD 두 개가 동시에 작업을 처리할 수 있어 1 사이클에 작업을 처리하게 된다.


RDNA는 GCN에서와 같이 64개 스레드 단위 처리 지원을 위해 CU 2개를 바인딩한 '듀얼 CU' 구조를 택했는데, 이 경우 SIMD 유닛이 서로 다른 레지스터를 사용하기에 처리 사이클이 한 번 더 늘어나지만 여전히 GCN에 비해 높은 효율을 기대할 수 있다.

또한, GCN 아키텍처에서는 일반적인 비동기 컴퓨트 작업 중 비동기 엔진이 그래픽 파이프라인을 완전히 정지 시킬 수 없던 것과 달리, RDNA 아키텍처는 완전 정지가 가능하도록 개선되어 비동기 엔진이 진행 중인 컴퓨트 작업을 완료하는 동안 또 다른 작업 스케쥴링이 이뤄지는 것을 방지해, 우선 순위가 높은 작업에 대한 처리 효율을 높였다.


여기에 중앙화된 지오메트리 프로세서를 통한 균등 작업 배분, GCN의 32보다 두 배 늘어난 Vega 56// 64급의 64 ROP를 지원해 렌더링 성능을 끌어 올렸다. 직접적인 비교는 어렵지만, 이번 라데온 RX 5700 시리즈의 성능 개선에는 그동안 엔비디아 지포스 시리즈에 비해 부족했던 ROP 확보도 큰 영향을 미친 것으로 판단된다.

CU와 메모리 사이 캐쉬 추가, GPU 내부에도 압축 기술 적용

AMD가 RDNA에서 강조한 부분 중 하나가 바로 다층 캐시 구성을 통한 레이턴시 개선과 대역폭 증가, 소비전력 개선이다.

이를 위해 AMD의 RDNA 아키텍처에는 CU에 종속된 L1 캐시, 메모리와 직접 연결된 L2 캐시 사이에 새로운 캐시를 적용했다. RDNA 아키텍처에서는 캐시 계층을 추가하면서 GCN에서의 L1 캐시는 L0 캐시로, 새롭게 추가된 중간 캐시를 L1 캐시로 명명했다.

모든 CU가 L2 캐시로 연결된 GCN과 달리, RDNA는 다섯 개의 CU를 한 단위로 데이터를 공유하는 L1 캐시 구조로 적중율을 높여 레이턴시가 23% 개선되었고, L0 캐시와 ALU 사이의 대역폭을 2배로 늘려 21%의 레이턴시 개선 효과를 이루어냈다.

RDNA의 또 다른 변화는 GPU 내부 데이터 전송에도 활용하도록 수정된 DCC(Delta Color Compression) 정책이다.

지금까지 DCC는 메모리 컨트롤러와 메모리 버퍼 사이에만 적용했던 압축 기술이지만, RDNA에서는 GPU 내부의 DCC 처리를 위해 메모리 컨트롤러에 연결 됐던 랜더 백 앤드를 CU 구조에 통합해 쉐이더가 압축된 컬러 데이터를 처리할 수 있게 되었다.

덕분에 DCC 데이터를 랜더링 파이프 라인 전반에 사용할 수 있게 되면서, 그만큼 GPU 내부 데이터 전송 효율 개선 효과를 기대할 수 있다.

미디어 엔진, 아직은 부족한 8K 미디어 가속 지원

그래픽 성능과는 별도로, AMD는 GCN 아키텍처의 플루이드 모션 덕에 엔비디아와 비교해 멀티미디어 PC로 높은 평가를 받고 있다. 하지만 영상 컨텐츠가 단순 4K를 넘어 더욱 고품질 추구를 위해 HDR과 8K 대응이 요구되는 상황에서, GCN (폴라리스) 아키텍처로는 한계가 있다.

라데온 RX 400 시리즈에 지원된 미디어 엔진의 인코딩 성능은 H.264에서 최대 4K30, HEVC에서 4K60을 지원하며, 디코딩 면에서는 H.264 4K120과 HEVC 4K60(Main-10)을 지원했는데, RDNA의 미디어 엔진은 이를 더욱 강화했다.

H.264은 최대 4K150 디코딩과 4K90 인코딩을, HEVC 영상은 최대 8K24 디코딩 및 4K60 인코딩, VP9에 대해서는 4K90 및 8K24 디코딩이 가능해졌다. 추가 확인된 바에 따르면 H.264에서는 8K30 디코드가 가능하지만, 관련 업계에서 준비 중인 8K 시대 대응에는 아쉬운 면이 있다.

한편, RDNA 미디어 엔진은 HDMI 2.0 및 DP 1.4 HDR 규격과 Dispaly Stream Compression 1.2a, MPO(multi-plane overlay protocol)를 통한 저전력 모드로 아이들 상태와 비디오 재생시 소비전력을 줄여준다.

RDNA의 실시간 레이트레이싱 대응, 쉐이더로 처리

사전에 알려진 바와 같이 AMD의 RDNA 아키텍처는 실시간 레이트레이싱을 위한 별도 하드웨어 지원은 없는 것으로 확인되었다.

아직 AMD의 레이트레이싱 지원은 GCN과 RDNA 모두 쉐이더 기반으로 지원하지만 프로렌더와 라데온 레이로 구현하는 방식이라서 현재로써는 DXR 기반의 레이트레이싱은 사용이 불가능하다.

차세대 RDNA 아키텍처에서는 전담 프로세서를 통한 하드웨어 가속 지원을 약속하였는데, 이후 AMD의 레이트레이싱 비전에는 클라우드 컴퓨팅을 통한 풀 스크린 레이트레이싱 지원이 포함된 것이 눈길을 끈다.

구체적인 내용은 알려지지 않았지만 엔비디아의 DLSS와 같이 딥러닝을 통해 사용자 시스템의 자원 소모를 최소화하는 기법이 쓰일 것으로 예상해볼 수 있다. 특히, 2020년 출시 예정인 MS와 소니의 차세대 콘솔은 AMD의 Zen2 CPU와 Navi 기반 GPU가 통합된 커스텀 SoC가 쓰인다.

이들 콘솔에는 별도의 레이트레이싱 가속 하드웨어가 추가될 것으로 예상되고 있는데, PC에 비해 성능 제약이 심한 콘솔을 포함한 메인스트림급 PC에서의 원활한 레이트레이싱 지원을 위한 전략으로 예상된다.

더욱 나은 게이밍 경험을 위해, 라데온 안티 랙(Radeon Anti-Lag)

AMD가 RDNA 아키텍처와 라데온 RX 5700 시리즈를 발표하며 언급한 내용 중 게이머들의 관심이 높은 내용을 꼽자면, 게이머의 입력이 화면에 실제 반영되기까지의 레이턴시(Latency), 다른 말로 지연 시간이나 인풋 랙(Input Lag)이라고도 불리는 시간 차이를 줄여주는 안티 랙 기능을 들 수 있다.

기존에는 CPU와 GPU가 각자의 사이클로 작업하기에 게이머가 화면을 보고 입력하는 사이 프레임이 추가되어 사용자의 입력 반응이 밀려 랙이 발생하며, GPU 부하가 늘어나 게임 FPS 낮아지면 랙이 커지는 경향이 있다.

AMD 라데온 안티 랙은 GPU 프레임 비율에 맞춰 CPU의 게임 처리 사이클을 동적으로 조정, 게이머의 조작이 다음 렌더링에 반영되는 시간을 줄여 랙을 감소 시킨다는 컨셉의 기술이다.

드라이버에서 API를 호출할 때 안티 랙이 적용되므로 API에서 직접 그래픽 파이프라인을 제어하는 DX12나 벌칸에서는 안티 랙 지원이 어렵고, RDNA 아키텍처 GPU에서는 DX9 및 DX11, Vega 이전 세대 아키텍처에서는 DX11 게임을 지원하는 것으로 알려졌다.

기술 특성상 프레임과 게이머의 반응 속도가 중요한 이스포츠 타이틀에서 특히 유용할 것으로 기대된다.

화면 품질 Up, AMD FidelityFX & Radeon Image Sharpening

AMD는 RDNA와 라데온 RX 5700 시리즈를 발표하며 GPU 부하를 최소화하며 이미지 품질 향상을 가능케하는 AMD FidelityFX와 이미지 샤프닝 기술도 발표했다.

오픈 소스 이미지 퀄리티 툴깃으로 개발된 AMD FidelityFX는 AMD의 RDNA와 Vega, GCN 및 NVIDIA GPU에서도 사용 가능하기 때문에 RDNA 한정 기술은 아니지만, 양사의 경쟁 관계를 감안할 때 엔비디아에서 지원할 가능성은 높지 않을 것으로 판단되므로, 현 시점에서는 AMD 전용 기술로 정착될 가능성이 높다.

AMD FidelityFX는 CAS(Contrast Adaptive Sharpening) 필터를 포함한 포스트 이펙트 쉐이더 라이브러리의 명칭으로 GPUOpen을 통해 공개될 예정이며, 범용 라이브러리이기는 하지만 AMD Navi와 Vega 아키텍처의 Rapid Packed Match에서 최상의 결과물을 제공하도록 개발되었다.

AMD Radon Image Sharpening은 AMD FidelityFX의 CAS 필터를 라데온 그래픽 카드의 드라이버인 라데온 소프트웨어의 설정에서 바로 적용할 수 있도록 만든 것으로 볼 수 있는데, 픽셀 주변의 휘도 변화를 파악하고 실제 렌더링 해상도보다 높게 렌더링했을 때 주변 픽셀 밝기 변화를 추측해 주변 픽셀에 적용한다.

AMD의 발표에 따르면 Radeon Image Sharpening 적용시 그래픽 성능에 미치는 영향은 1% 내외이며, 성능을 위해 그래픽 옵션을 하향 조정하는 게이머들에게 좀 더 나은 게이밍 경험을 제공해줄 수 있을 것으로 기대된다.


컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

List of Articles
번호 분류 제목 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 1384 2024.12.12
HOT글 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 237 2025.05.20
공지 사랑LOVE 포인트 만렙! 도전 4660 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25848 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20431 2025.01.21
10640 일반 Synology의 4 베이 NAS 장비 "DiskStation DS416j" 1456 2016.02.08
10639 일반 태블릿 PC의 충전을하면서 주변 기기를 사용할 수있는 OTG 지원 USB 허브 1434 2016.02.08
10638 일반 카페베네 상장 난항에 투자자 눈물 776 2016.02.15
10637 일반 주식, 욕심은 화를 부르고. 그 화는 고스란히 가족들에게 짜증을 부릴겁니다 789 2016.02.22
10636 일반 원익IPS 추천합니다 676 2016.02.22
10635 일반 장이 너무 안좋네요 ㅜㅜ 707 2016.02.22
10634 일반 주식투자와 관련된 주식명언 999 2016.02.22
10633 일반 i5-6600 i5-6500 비교 1 1434 2016.02.22
10632 일반 ssd좀봐주세요 2 906 2016.02.27
10631 일반 크라운제과 어떻게 보시나요? 458 2016.02.28
10630 일반 흑자예상하며 기다린보람이 있군 471 2016.02.28
10629 일반 세계 주식 주요 지수 보는곳 입니다.모르시는분들을 위해 646 2016.02.28
10628 일반 한 2월 말쯤 총선테마가 시작될걸로 예상합니다. 562 2016.02.28
10627 일반 대중관계 악화로 중국에서 돈버는 기업들 급락이네요 684 2016.02.28
10626 일반 주식 생초보인데 알려주실수 있으신가요? 515 2016.02.28
10625 일반 11시정도만 잘 넘기면 될거같은데.. 478 2016.02.28
10624 일반 요즘 한종목에 꽂혀서 분할매수하는데요. 565 2016.02.28
10623 일반 본인 명의로 핸드폰 두개 개설 하면 문제 생기나요? 1 1154 2016.03.01
10622 일반 단말기대금 일시불납 가능한가요? 1 781 2016.03.05
10621 일반 노트4 배터리 공유?? 1 1749 2016.03.05
10620 일반 금호타이어 어떻게 보시나요? 650 2016.03.05
10619 일반 해외에서 사용하던 도메인을 구입했는데 헉.. 568 2016.03.09
10618 일반 축구 페널티킥 선방 탑10 469 2016.03.12
10617 일반 SSD의 성능을 유지하기위한 유지 관리 기술 1068 2016.03.15
10616 일반 저렴한 Skylake 버전 Xeon 마더보드 'GA-X150M-PRO ECC」 874 2016.03.15
10615 일반 G5 vs S7 1 626 2016.03.18
10614 일반 스테레오믹스 소리가 안납니다 1 1104 2016.03.19
10613 일반 스피커를 항상 켜 놓는데요. 노이즈??? 소리가 납니다. 1 850 2016.03.19
10612 일반 M2 메모리 추천 1 911 2016.03.19
10611 일반 모니터 단자 HDMI, DP & 오디오 관련 문의 1 865 2016.03.19
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 355 Next
/ 355