본문 바로가기

컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

조회 수 2474 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

수정 삭제

단축키

Prev이전 문서

Next다음 문서

수정 삭제
Extra Form

 

GeForce GTX 1080의 특징

 NVIDIA는 5 월 6 일 (현지 시간), Pascal 아키텍처를 채용 한 하이 엔드 GPU "GeForce GTX 1080 '을 발표했다. 그리고 17 일에 미디어에 의한 벤치마킹을 해금하고, 새로운 정보를 공개했다.

 이번 미디어 용으로 배포 된 자료는 방대 백서는 55 페이지 검토 와즈 가이드는 61 페이지에 이른다. 이 프로그램은 Pascal에서 혁신적인 기술이 다수 투입된 것을 시사하고 있지만, 그 중에서 6 일 발표 시점에서 공개되지 않은 정보 등을 요약 해 소개하기로하자.

GeForce GTX 780의 3 배의 전력 성능비

 우선 GeForce GTX 1080 개요에서 복습 해 두자. GTX 1080는 소비자 용 GPU로는 처음으로 16nm FinFET 공정을 채용. 이 때문에 추측에, 제조는 TSMC가 담당 할 것으로 보인다. 트랜지스터 수는 이전 세대의 GeForce GTX 980의 52 억에서 72 억으로 증가했지만, 다이 크기는 398 평방 mm에서 314 평방 mm로 축소하고있다.

 CUDA 코어 수는 2,048 개에서 2,560 개로 25 % 증가,베이스 클럭은 1,607MHz, Boost 클럭은 1,733MHz와 GPU로서는 전례없는 영역에 달성했다. CUDA 코어 수와 클럭의 두 증가로 최대 연산 성능은 8,873GFLOPS에 달해도 GTX 980 4,981GFLOPS에서 78 % 향상하고있다.

 CUDA 코어 수의 증가에 따라 텍스처 유닛도 GTX 980의 128 개에서 160 개로 늘었다. 메모리는 10Gbps 구동 GDDR5X 동일한 256bit의 버스 폭을 유지하면서 대역폭은 224GB / sec에서 320GB / sec로 42 % 증가했다. 한편 L2 캐시의 크기는 2MB로 지연되고, TDP는 165W에서 180W의 미증에 그쳤다.

 결과적으로 GTX 1080은 전력 효율이 매우 높은 GPU가되었다. GTX 980에 비해 전력 효율은 1.5 배가되고 있지만, GTX 780과 비교하면 3 배의 전력 성능비를 실현했다고한다. Kepler 아키텍처는 등장 당초 Fermi에 비해 전력 효율을 실현할 수 있었다고 화제가 일세를 풍미했지만 아직 GTX 780 세대의 GPU를 사용하고 있다면, 이제 GTX 1080에 대한 교체를 고려해야 할 것이다.

src="http://pc.watch.impress.co.jp/img/pcw/docs/757/832/2_s.jpg" />

 

GeForce GTX 1080의 블록 다이어그램

새로운 GDDR5X 메모리와 메모리 압축 기술

 기보대로, GTX 1080에서는 "GDDR5X"라는 새로운 메모리를 채택한다. 기본적으로 GDDR5 기술을 기반으로하고 있지만, 10Gbps라는 데이터 속도를 제공하려고하면 지금까지의 GDDR5 대응 회로이라고 전달이 늦어 데이터 전송을 마치기 전에 다음의 데이터가 전송되는 것을 된다.

 그래서 NVIDIA는 높은 클럭을위한 새로운 I / O 회로를 설계하고 GDDR5X의 탑재를 실현했다. 1.35V보다 낮은 전압과 새로운 프로세스 기술을 채용함으로써 종래와 동등한 소비 전력을 유지하면서 43 % 높은 클럭을 달성했다. 또한 GPU 다이 및 메모리 다이 사이의 채널을 최적화하고 신호의 혼선과 손실을 억제한다. 그 결과, 신호의 '눈'을 충분히 확보 할 수있어 데이터의 캡처에 여유를 갖게 할 수 있었다고한다.

 

GDDR5X의 채용

 이만큼 빠른 메모리를 사용하고 있지만, Pascal에서는 메모리 대역폭을 효율적으로 사용하기 위해 새로운 무손실 데이터 압축 기술을 채용했다.

 Maxwell 세대까지 블록이있는 화소에 인접 화소가 그 색에 가까운 색이면 GPU가 계산을 수행 차분으로 기록하여 용량을 2 분의 1로 "2 : 1 압축 "을 갖추고 있었지만, Pascall 세대는 또한 동일한 블록에서 차이가 더 작아 몇 비트로 표현할 수있는 경우 원래의 4 분의 1까지 압축하는 '4 : 1 델타 컬러 압축"고 2 × 2 픽셀 블록의 4 : 1 한결 컬러 압축과 2 : 1 압축을 결합하여 데이터 크기를 8 분의 1로 억제 "8 : 1 델타 컬러 압축 '을 탑재했다.

 이 결과 Pascal에서는 Maxwell과 비교하여 메모리 대역폭의 이용 효율이 20 % 향상, 메모리 클럭의 향상 분과 따라 GTX 980과 비교하여 메모리 효율이 1.7 배 증가했다고한다.

 

4 : 1 델타 컬러 압축과 8 : 1 델타 컬러 압축

 

압축 비교. 이미지는 Project CARS 런타임 테스트, 마젠타는 데이터 압축을 얻은 부분을 나타낸다. 중앙은 Maxwell 세대에서 바로 Pascal 세대. 보시는 바와 같이 대부분의 데이터를 압축 할 수있다

 

압축을 통해 메모리 대역폭의 이용 효율이 20 % 높아졌다

SLI 인터페이스를 쇄신

 Pascal 세대에서는 SLI 인터페이스가 일신되었다. GTX 1080에서는 SLI 커넥터를 2 개 갖추고있다. 이 점 이전 세대 하이 엔드와 동일한 것이지만, 지금까지 2-way SLI를 구축하는 경우 중 하나 만 연결하여도 좋다 것으로되어 있었다. 그러나 GTX 1080는 2 개의 커넥터를 동시에 사용 "Dual-link SLI」모드가 표준으로 클럭이 400MHz에서 650MHz로 향상 기존에 비해 2 배 이상의 대역폭을 제공 할 수 있다고한다.

 오래된 표준적인 SLI 브릿지를 이용하여 하나만 연결해도 좋지만,이 경우 다소 속도가 향상되지만 성능은 제한된다. 기존의 LED가있는 SLI 브릿지를 사용하면 최대 650MHz로 동작하지만, Single-link하기 때문에 역시 성능이 제한된다. Dual-link SLI를 사용하기 위해서는 새로 개발 된 "SLI HB"라는 브릿지를 이용할 필요가있다.

 

새로운 SLI HB

 

SLI HB 장착 이미지

 더 구체적으로 말하면, 스탠다드 브릿지를 사용했을 경우, 2,560 × 1,440 도트 @ 60Hz의 해상도 밖에 권장되지 않지만 LED가 들어가 타입의 브릿지는 이것이 4K 해상도까지 향상된다. 한편, SLI HB 브리지를 이용하면 5K와 3 대의 디스플레이에 의??한 서라운드 환경으로 권장이 펼쳐진다.

 백서에도 신구 브리지 이용시 성능 비교가 공개되어 있는데, 이에 따르면 새 브리지에서보다 안정적인 프레임 속도를 실현할 수있어 셔터 링 현상을 억제한다.

 

SLI 브릿지의 차이에 따른 권장 해상도의 차이

 

새로운 브리지는 SLI 프레임 레이트가 더 안정 될 것이라는

 또한이 사양 변경으로 3way 또는 4way SLI는 비추천되었다. 비추천보다는 기본적으로 비 대응으로, Pascal 이후에도 기본적으로 3way와 4way는 지원되지 않는다. 그래도 3way와 4way을 사용하고 싶은 매니아는 NVIDIA의 사이트에서 신청 "Enthusiast Key"라는 키를 발급 받아야 키를 설치하고 처음 3way와 4way 구성이 활성화된다는 .

새로운 멀티 GPU 모드

 위의 2way SLI 모드의 제한은 사실 DirectX 12의 멀티 GPU 처리 변경에 의한 것이 크다. DirectX 12에서는 여러 개의 GPU가있는 경우 3 가지 모드를 이용할 수있게 되었기 때문이다.

 첫 번째는 Multi Display Adapter (MDA) 모드이다. 이것은 거의 읽어 글자처럼 비디오 카드 각각을 개별적으로 인식시키는 모드에서 각각의 비디오 메모리는 분리되어 상호 GPU가 서로의 메모리에 직접 액세스 할 수 없습니다. MDA 모드에서는 개발자가 신중하게 각각의 GPU의 메모리를 관리 할 필요가 있지만, GPU 개수의 제한은 없다.

 한편, 2 개의 GPU가 메모리를 상호에 액세스 할 수 Linked Display Adapter 모드도 준비되어 있는데, Implicit LDA라는 SLI 같은 구조에 가세 해 새롭게 Explicit LDA라는 구조가 준비되었다.

 Explicit LDA 모드는 Implicit LDA 모드와는 달리, 게임 개발자가보다 자유롭게 GPU를 제어 할 수있게된다. 예를 들어, 제조사가 다른 디스크리트 GPU와 CPU 내장 GPU조차 쌍으로 짤 수있게 각각의 비디오 메모리를 하나의 메모리 풀로 취급이 가능하다. 이 Explicit LDA 모드에서도 GPU 수에 제한이 없다. 앞으로이 Explicit LDA 모드 및 MDA 모드가 주류가 될 것으로 전망되기 때문에 SLI를 2way로 제한하기로 한 것으로 보인다.

 물론, 2-way SLI를 다하고도 지금 그대로 PhysX GPU를 별도로 추가한다고 것은 계속 가능하다.

 

DirectX 12에 탑재 된 새로운 멀티 GPU 모드

수직 동기화가 켜져 있는데 입력에서 반응 할 때까지의 대기 시간을 줄일 「FAST SYNC "

 지금까지 그래픽 렌더링은 일련의 "흐름"이 있었다. 게임 엔진의 렌더링 요구는 먼저 드라이버를지나 GPU로 렌더링 된 프레임 버퍼에 모은 후 디스플레이에 출력된다. 이들은 분리 할 수??없는 "흐름"이었다. 그러나 Pascal 세대에서는 렌더링 파이프 라인의 프론트 엔드 및 디스플레이 출력에 관련된 백엔드를 분리시켰다.

 이를 통해 실현 한 것이 "게임의 설정은 수직 동기화를 해제하지만 실제로 출력되는 이미지는 수직 동기화 On"라는 "FAST SYNC"라는 특이한 기능이다.

 FAST SYNC는 구체적으로 어떤 장점이 있는가. 아시다시피, 수직 동기화가 해제라고 게임 엔진은 디스플레이 동기화를 기다리지 않고 다음에서 다음으로 렌더링을한다. 따라서 키보드와 마우스의 입력에서 디스플레이 출력까지의 지연을 최소화 할 수있다. 그러나 디스플레이의 재생률 이상의 프레임 속도가 출력되는 이미지의 위아래가 어긋나 "스티어링 '현상이 발생한다.

 스티어링을 피하기 위해 수직 동기화를 선택하면 좋지만이 경우 지금까지의 "흐름"는 게임 엔진 전체가 디스플레이 출력을 기다릴 필요가 있었다. 따라서 키보드와 마우스의 입력도 디스플레이 새로 고침이 걸릴 타이밍까지 기다려야 지연이 발생하는 원인이되고 있었다.

 FAST SYNC를 활성화하면 전술 한 바와 같이, 프론트 엔드와 백엔드가 분리되기 때문에 게임 엔진을 포함한 프런트 엔드 파이프 라인은 수직 동기화가 꺼져있을 때와 마찬가지로 빠르게 작동 할 수있는 분 동작한다. 따라서 입력 지연의 최소화와 스티어링의 해소를 양립 할 수 있다는 것이 NVIDIA의 말이다.

 그러나 지금까지의 렌더링 흐름에 그대로 FAST SYNC의 구조를 도입해도 효과가 없다. 아시다시피, 3D 이미지 디스플레이에 출력하기 전에 일단 버퍼에 저장된다. 버퍼는 전체 이미지로 출력 할 수있는 상태에있는 「프런트 버퍼」(FB)과 현재 렌더링 중의 「??백 버퍼」(BB)의 2 종류가 있지만, FB가 디스플레이에 출력되지 않는 한 BB에 새로운 렌더링을주는 것은 없다. 즉, 결국은 재생 빈도로 제한되며, 게임 엔진은 "실속"해 버린다.

 그래서 NVIDIA는 새로운 '라스트 렌더링되지 않은 버퍼 "(LRB)라는 버퍼를 마련했다. 게임 엔진은이 버퍼는 직접 보이지 않는 것이지만, BB의 렌더링이 끝나면 자동으로 LRB되고, FB가 될 때까지 기다렸다가 지금까지 LRB였던 것이 BB되고 다음의 렌더링을 받는다. LRB가 FB 때까지 (즉 FB가 디스플레이에 출력되는)이 사이클은 반복 게임 엔진은 항상 빈 BB가 있다고 판단된다. 이는 게임 엔진의 실속을 방지하는 것이다.

 

FAST SYNC의 구조. 우선 프런트 엔드 및 백 엔드를 분리시켜 버퍼에 새롭게 LRB를 마련했다

 

NVIDIA 제어판에서 FAST SYNC를 선택하면

 이 FAST SYNC의 장점은 특히 부하가 가벼운 DirectX 9 게임에서 눈에 띄는 수직 동기 오프시와 비교하여 입력에서 지연 + 8ms 이내로 억제하면서, 스티어링이나 불안감을 해소 할 수있다. 이것은 수직 동기화가 켜져있을 때의 지연과 비교하여 약 2 분의 1에서 4 분의 1 짧은한다.

 

입력에서 출력까지의 지연 비교. 수직 동기화가 꺼진 상태에 가까운 낮은 지연을 얻을 수있다

VR위한 새로운 구조 나 GPGPU의 개선, 4K 비디오, HDR에의 대응 등

 이처럼 GTX 1080에서는 3D 렌더링에 대해 상당히 많은 개선이되어있는 것을 알 수있다. 과연 초대 Maxwell (GeForce GTX 750 Ti)의 등장에서 2 년 이상은되었을 수도 있고, Pascal 세대의 3D 게임을위한 진화는 눈 부시다.

 그러나 이에 그치지 않고 보드의 최적화, GPU Boost 3.0이라는 새로운 오버 클럭의 구조, VR을위한 최적화, GPGPU의 개선, 그리고 비디오 디코더의 개선, HDR 게임에 대한 대응 등 다양한 요소가 포함 있다. 이들은 내일 (18 일) 또 원고를 재차 소개하고 싶다.

 여담이지만, 백서 및 레뷰 즈 가이드를 보면 라이벌 GPU에 대한 언급은 일절없고, Pascal에 강한 자신감을 가지고있는 것이 엿 보인다.


컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

List of Articles
번호 분류 제목 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 1389 2024.12.12
HOT글 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 237 2025.05.20
공지 🚨(뉴비필독) 전체공지 & 포인트안내 3 file 25862 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20435 2025.01.21
10640 Intel 12세대 i3-12100YouTube 10비트 HDR 8K60 AV1 비디오를 원활하게 재생가능? 1 4540 2024.11.10
10639 블루투스 헤드셋 질문좀~ 50 2021.01.31
10638 e4000이랑 560s랑 음질차이 71 2021.01.28
10637 未检测到我的手机MTP。 1 29 2019.12.24
10636 amd 라이젠 1700 > 인텔 i5 12400f cpu 변경후 드라이브 오류 1 1122 2022.06.14
10635 윈도우 11 에러 중에 이런 종류가 있나요? 2 1085 2022.06.14
10634 마소계정에 정품인증 420 2022.06.14
10633 4k나 1080p 동영상 보면 렉이 걸리는데... 2 482 2022.06.14
10632 제가쓰던 놋북 윈도우가 리테일이래요 그러니까 fpp 윈도우라는거 맞죠?? 1 401 2022.06.14
10631 윈도우 10 왜 버벅일까요..? 1 348 2022.06.14
10630 오피스 정품 판매 맞을까요? 1 170 2022.06.14
10629 윈도우11 더 많은 옵션 항상사용하는 방법 264 2022.06.09
10628 윈도우 11 22H2 RTM 빌드 확정됨 224 2022.05.30
10627 해킹 대회에서 윈도우 11의 취약점 6개가 발견됨 237 2022.05.30
10626 ProtonMail, 통합 브랜드로 다양한 서비스를 제공 186 2022.05.30
10625 가상머신에 윈도우95 설치하기 631 2022.04.22
10624 구글 크롬 100 버전 공개 840 2022.04.04
10623 윈도우 11+다이렉트스토리지, 게임 로딩 시 CPU 부하가 최대 40% 감소 709 2022.04.04
10622 애플, 위조된 법적 증명에 속아 사용자 데이터를 제공? 640 2022.04.04
10621 윈도우 탐색기 대체 대안 프로그램 8가지 906 2022.04.04
10620 인터넷은 어떻게 작동되는지 알아보자 676 2022.04.02
10619 크롬 취약점 발견 Chrome 업데이트 빨리 해야 765 2022.03.30
10618 GPU-Z, 인텔 아크 알케미스트 그래픽 지원 148 2022.03.26
10617 아프리카 TV가 트위치보다 데이터를 훨씬 많이 쓰는군요 225 2022.03.26
10616 애플, 미국 애리조나 주에서 월렛에 신분증 기능 제공 152 2022.03.26
10615 macOS 12.3에서 외장 모니터 연결 문제, 게임 패드 연결 문제 165 2022.03.26
10614 비트코인 오브 아메리카, ATM에서 도지코인을 취급 153 2022.03.26
10613 1990년대 중후반에 나온 PowerVR PC GPU의 소스 코드 공개 159 2022.03.26
10612 NVIDIA, 삼성, MS를 해킹한 Lapsus$. 알고보니 10대 소년이 주범? 160 2022.03.26
10611 통신사 직원 수십억원 갖고 잠적 365 2022.03.26
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 355 Next
/ 355