본문 바로가기

컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

조회 수 92 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

수정 삭제

단축키

Prev이전 문서

Next다음 문서

수정 삭제
Extra Form

Threadripper패키지

단일 다이에서 제품을 파생시키는 AMD

AMD는 16코어/32스레드의 데스크 톱 CPU"Ryzen Threadripper"의 아키텍처 개요를 밝혔다.Threadripper는 AMD에게 3계통째의 Zen아키텍처 구성이 된다.

아래 블록 그림과 같이 2개의 다이(반도체 본체)를 패키지 내에서 접속한 구성으로 되어 있다. 각각의 다이는 Ryzen 7와 마찬가지로 8코어.그래서 Threadripper는 Ryzen 7의 8코어/16스레드의 2배의 16코어/32스레드로 구성되어 있다.

Threadripper의 전체 구성

Threadripper의 소켓은 새로운 "sTR4"에서 대응 칩셋은 "AMD X399". DRAM인터페이스는 Ryzen의 2배의 4채널.PCI Express에 이르면 gen3이 60레인, gen2이 8레인이라는 방대하고 있다.

이는 다이가 2개인 데다 Ryzen 7에서는 무효화되고 있다. 일부 PCI Express레인이 Threadripper에서는 활성화되고 있기 때문이다.본래 Ryzen 7의 다이에는 PCI Express가 64레인 탑재되고 있다.

Threadripper와 Ryzen의 대비

Threadripper시스템 구성도

2개의 다이를 새로운 인터 커넥트 Infinity Fabric으로 접속한 Threadripper

Threadripper의 다이(반도체 본체)자체는 "Zeppelin(젯페링)"라 불리는 Ryzen 7(Summit Ridge:정상 회의 리지)의 다이옥신과 같다.AMD는 반도체 마스크 비용을 낮추기 위해서, 다이 변화를 억제하고 다이(매스 밤 비전은 다른 경우가 있다)에서 복수의 제품을 파생시키는 전략을 채택하고 있다.

현재의 Ryzen 7/5/3은 이 다이며, EPYC패밀리도 이 다이이다. 구조의 차이는 다이 수와 다이상에서 유효하게 되어 있는 코어 수와 캐시 양이 된다.다이 간 인터 커넥트는 Threadripper와 EPYC에서 구조가 다르다.

AMD의 Ryzen, Threadripper, EPYC의 차이

Summit Ridge의 다이 Zeppelin

기존 AMD CPU보다 52%나 클락인당 명령 실행 수가 늘어난 Zen

Intel CPU코어와 비교해서 CPU코어의 크기가 줄어드는 Zen

상위 5%의 높은 퍼포먼스 다이를 선별

Threadripper와 Ryzen 7의 차이는 다이의 개수만 아니다.우선 다이의 선별이 다르다.

반도체 칩은 같은 웨이퍼에서 나온 다이(반도체 본체)에서도 성능에 차이가 있다. 저 전압에서도 고 클럭으로 동작하는 다이도 있고, 고전압을 걸어도 동작 클럭이 낮은 다이도 있다. 칩 벤더는 차이가 있는 다이를 선별해서 제품 SKU에 할당하다.같은 밭에서 나온 야채를 수 있는 물건과 나쁜 물건을 선별해서 출하하는 것과 같다.

이번에 AMD는 Threadripper의 제품화에 있어서, Ryzen의 다이 중 최상위 5%를 Threadripper용으로 선별했다고 한다. 이 퍼센티지는 설명자마다 다르며 2%라는 설명도 있었지만 실제 Threadripper의 출하 수를 따지면 2%도 있을지도 모른다. 고성능인 다이는 전력에 대한 성능 효율이 높아진다.성능이 높은 다이옥신을 선별하고 Threadripper에

양품 다이를 선별한 Threadripper

Threadripper의 공식의 작동 주파수는 16코어/32스레드의 Ryzen Threadripper 1950X로 16코어가 베이스 3.4GHz, 부스터 클록은 4GHz.12코어/24스레드의 Ryzen Threadripper 1920X에서는 베이스 3.5GHz, 부스트 4GHz.8코어/16스레드의 Ryzen Threadripper 1900X에서 베이스가 3.8GHz, 부스트 4GHz.선별 다이라는 하지만 이 정도의 CPU코어 개수에서 동작 주파수를 높게 유지할 수 있는 점이 Zen마이크로 아키텍처의 이점이다.

Zen마이크로 아키텍처
PDF판은이쪽

AMD의 Zeppelin다이는 1,300이상의 크리티컬 패스 모니터(핵심 경로의 레플리카 회로), 48의 파워 서플라이 모니터, 20의 서멀 다이오드, 9개 도루ー프디텍타을 탑재한다.2개의 Zeppelin염색을 사용 Threadripper에서는 센서 수는 2 배이다.

Threadripper에서는 이러한 센서를 사용하고 꼼꼼히 CPU코어의 동작 주파수를 조작한다.

16코어/32스레드의 Ryzen Threadripper 1950X의 경우 베이스 3.4GHz에서 동작. 4코어만 작동하면 최고 4GHz까지 부스터 수 있다. Ryzen에서는 2액티브 코아에서 부스터 클럭이었다. Threadripper에서는 각 다이에 2코어씩의 부스터 코어에서 합계 4코어를 부스터 수 있다.동작 주파수는 Ryzen역시 25MHz씩으로 제어된다.

Threadripper의 센서와 클럭 제어

2개의 다이로 분산된 DRAM인터페이스

Threadripper의 DRAM인터페이스는 DDR4이 4채널.공식 지원 DRAM의 전송 속도는 DRAM등급과 DIMM매수에 의해서 지원이 바뀐다.

듀얼 등급 DIMM을 각 채널에 2장씩 합계 8 DIMM을 꽂은 경우는 전송 속도는 1,866Mtps에 억제된다. 싱글 순위 DIMM 8장에서 2,133Mtps, 듀얼 등급 DIMM 4장에서 2,400Mtps싱글 순위 DIMM 4장에서 2,667Mtps이다.2,667Mtps시 대역은 85.3GB/s이다.

Threadripper의 공식 지원 DRAM속도

Threadripper에서는 DRAM채널은 4채널이지만 2채널씩 2개의 다이(반도체 본체)에 분산되고 있다.그래서 채널에 의해서 메모리 액세스 레이튼 시가 다르다.

메모리 액세스 트랜잭션을 벌이는 CPU코어가 타고 있는 다이의 메모리 콘트롤러에 접속된 DRAM메모리"니어 메모리(near memory)"에 대해서는 78ns의 레이턴시에서 메모리 액세스가 가능하다.반면 CPU코어 다이라는 다른 다이에 접속된 DRAM메모리"파 메모리(far memory)"에 대해서는 133ns의 메모리 액세스 레이튼 시가 걸린다.

Threadripper의 DRAM인터페이스와 레이턴시

무엇보다, Threadripper의 파 메모리 액세스 레이튼 시는 다이 간 통신이 있다 하고는 짧다.이는 다이 투 다이 온 패키지의 인터 커넥트를 낮은 레이턴시에 설계하고 있기 때문이다.

저 레이턴시고 광대역의 다이 간 Infinity Fabric

AMD의 현재 CPU와 GPU는 모두 인터 커넥트 직물에 "Infinity Fabric"를 채용하고 있다. Infinity Fabric에서는 데이터 조직에 대해서는 상위의 프로토콜 층에 AMD의 오랜"Coherent HyperTransport"를 확장한 프로토콜을 사용하고 있다.그러나 하위의 물리 실장은 각층에 맞춘 것이다.

우선 다이 내부에서는 CPU클러스터와 메모리 컨트롤러, I/O컨트롤러의 접속을 Infinity Fabric에서 하고 있다.온 다이에서는 256-bit폭이 넓은 인터페이스를 쓰고 있다.

Threadripper의 다이 간 Infinity Fabric

한편 다이 투 다이 접속은 1고리가 한쪽 방향 32-bit로 전송 속도를 높인 병렬 인터페이스를 쓰고 있다. 심플한 싱글엔 없어진 신호등에서 클락 포워딩 인터 커넥트이다.패키지에서 배선 거리가 짧은 기판의 제어가 되어 배선 간 간섭이나 크롯크스 큐를 막기 위해서라고 한다.

시리얼 전송 방식을 취하지 않기로 인코딩의 레이턴시를 줄인. 소비 에너지도 2pj/bit로 매우 낮다.참고로, Ryzen에도 이 인터페이스는 탑재되는데, 사용되지 않는다.

AMD의 Infinity Fabric

AMD는 고속 인터페이스 간 FIFO버퍼를 최대한 줄이는 데도 레이턴시를 단축하고 있다. 원래 Ryzen은 CPU코어 외의 유닛을 메모리 클럭에 동기화하는 설계가 되고 있어 온 다이의 Infinity Fabric나 메모리 컨트롤러도 메모리 클럭 동작한다. 함께 EPYC에서는 다이 간 Infinity Fabric도 메모리 클럭과 동기화 하고 2배의 전송 속도에서 동작하는 사양이다.Threadripper도 마찬가지라고 본다.

Threadripper의 온 패키지의 다이 간 Infinity Fabric의 대역은 쌍방향으로 최고 102.22GB/s이다. EPYC에서는 다이 간 Infinity Fabric으로 각 다이가 한쪽 방향 32-bit링크를 3짝을 갖추고 있다. 3짝의 링크에서 4개의 다이를 상호 접속하고 있다. Threadripper에서는 다이의 수는 2개로 적어 2짝을 쓰고 2다이 간을 연결하고 있다고 추정된다.2페어에서는 단 방향 64-bit의 인터 커넥트가 된다.

EPYC의 구성

EPYC에서는 다이 간 Infinity Fabric의 전송 속도는 최대 5.33Gtps에서 DDR4-2666과 동기화 하고 있었다. 1링크의 메모리 대역은 양방향 모두 42.6GB/s. 반면 Threadripper의 다이 간 Infinity Fabric의 대역은 최대 102.2GB/s. 인터페이스 폭이 64-bit 한다고 계산상의 전송 속도는 최대 6.38Gtps.이는 DDR4-3200의 데이터 전송 속도와 동기화한다.

Threadripper의 다이 간 접속의 추측도

Threadripper의 2개의 메모리 액세스 모드

Threadripper는 2개의 메모리 액세스 모드를 갖는다. 1개는 "UMA(Uniform Memory Access)"또는"Distributed Mode(디스토리뷰ー텟도 모드)"와 AMD가 부르는 모드. 이제 1개는 "NUMA(Non-uniform Memory Access)"또는"Local Mode(로컬 모드)"와 AMD가 부르는 모드이다.차이는 4개의 DRAM메모리 채널로의 액세스 제어가 된다.

UMA/Distributed모드에서는 메모리 액세스 트랜잭션이 Threadripper의 4개의 DRAM채널에 분산된다. 4채널은 리니어로 동등하게 취급되고 인터 리ー빙그에서 4채널에 동시에 분산 접속한다.그래서, 애플리케이션이 4메모리 채널의 메모리 대역을 최대한 살릴 수 있다.

무엇보다, 현실에는 접속된 다이로 메모리 액세스의 레이턴시가 다르기 때문에 평균 메모리 레이튼 시는 약간 늘어난다. 레이턴시보다 메모리 대역이 중요한 어플리케이션 전용이다.3D CG도구"Maya"처럼 워킹 세트의 큰 애플리케이션에서 효과를 발휘한다고 한다.

Threadripper의 UMA/Distributed모드

반면 NUMA/Local모드에서는 메모리 액세스는 그 어플리케이션이 달리고 있는 CPU코어의 다이(반도체 본체)에 연결되어 있는 2개의 DRAM메모리 채널이 우선된다. 기본적으로 메모리 액세스 트랜잭션은 다이에 직결된 2개의 DRAM채널만으로 이뤄진다.메모리로 칼리 티를 이용하고 메모리 액세스의 레이턴시가 단축된다.

NUMA/Local모드에서는 기본 메모리 액세스는 2채널이 되기 때문에 애플리케이션인당 메모리 대역은 반감한다. 메모리 대역보다 메모리 레이튼 시가 중요한 어플리케이션 전용이다.AMD에 따르면"Battlefield"시리즈 같은 게임은 NUMA/Local모드에서 성능이 올라간다는.

Threadripper의 NUMA/Local모드

UMA/Distributed모드와 NUMA/Local모드 사이의 전환은 동적으로 행할 수 없다. 부팅 시에 선택한다.평균 메모리 접근 레이튼 시는 벤치 마크에서는 DDR4-3200시에 UMA/Distributed모드 시에 86.9ns, NUMA/Local모드 시에 66.2ns과 UMA/Distributed모드가 3할 정도 늦어지고 있다.

UMA/Distributed모드와 NUMA/Local모드의 평균 메모리 접근 레이튼 시

x86계열 CPU의 멀티 소켓으로 구성의 메모리 액세스는 원래 UMA형이었다. 메모리 컨트롤러를 내장하는 1개의 노스 브리지 칩에 여러 디스크 리트 CPU가 접속되어 있었다.각 CPU는 노스 브리지에 접속된 DRAM메모리를 공유하는 UMA였다.

거기에 AMD가 CPU측에 DRAM컨트롤러를 통합한 Opteron을 투입, 그 때 CPU에 접속된 니어 메모리와 또 다른 CPU에 접속된 모피 메모리의 구별이 있는 NUMA형의 메모리 아키텍처를 들여온 바 있다.2개의 다이를 낮은 레이턴시에 접속한 Threadripper에서는, 어느 쪽의 메모리 액세스 모드도 선택을 할 수 있다.

Opteron의 멀티 소켓 구성

메모리 액세스 모드의 전환과 유산 호환 모드

Threadripper에서는 AMD의 CPU세팅 콘솔 소프트웨어"Ryzen Master"의 Threadripper버전으로 미세한 세팅을 치를 수 있다.

Threadripper용 세팅으로 2가지 모드 단추가 준비되어 있다.일부 기존 게임 소프트를 위한 "Legacy Compatibility Mode(유산 호환 모드)" 온/오프와 "Memory Access Mode(메모리 액세스 모드)"의 전환이다.

레거시 호환 모드(Legacy Compatibility Mode)를 켜면 Threadripper스레드 수가 절반이 된다.레거시 호환 모드는 고 스레드 수를 통제할 수 없는 레가시게ー무용 모드에서 CPU하드웨어 쓰레드 중 절반이 무효로 한다.

즉, Threadripper의 32스레드 중 16스레드만 이용하지 못하도록 제어된다. 기본적으로는 CPU코어가 무효화된다.다만 이 모드에서도 4개의 DRAM인터페이스와 64레인의 PCI Express는 모두 이용할 수 있다.

Threadripper에서 세팅

Ryzen Master for Threadripper아래 쪽에 유산 호환 모드와 메모리 액세스 모드 전환 스위치가 있는

메모리 액세스 모드(Memory Access Mode)세팅은 메모리 액세스를 UMA/Distributed모드와 NUMA/Local모드 중 하나에 전환할 수 있다.기본적으로 UMA/Distributed이다.

Ryzen Master의 Threadripper용 설정 프로파일로서 "Game Mode(게임 모드)"과 "Creator Mode(제작자 모드)"이 제공되고 있다.게임 모드(Game Mode)에서는 CPU의 동작 모드는 유산 호환 모드, 메모리 액세스는 NUMA/Local이다.

크리에이터 모드(Creator Mode)은 게임 모드의 대극인 프로파일이다. 제작자 모드에서는 레거시 호환 모드는 오프로 메모리 액세스는 UMA/Distributed가 된다. CPU쓰레드 수와 메모리 대역이 풀이다.쓰레드 수와 메모리 대역이 중요한 어플리케이션 전용의 프로파일이다.

게임 모드와 제작자 모드의 프로파일

Threadripper와 3색 Radeon Vega의 조합

Threadripper는 합계 64레인의 PCI Express gen3을 갖추고 최대 8개의 PCI Express기기를 접속할 수 있다. 실제로는 X399 I/O칩도 x4 PCI Express로 접속되고 있어 유효한 PCI Express는 60레인, 7장치이다. PCI Express에서는 4-way의 CrossFire/SLI접속 구성이 가능하다.Threadripper의 강도의 1개는 이 강력한 I/O에 있다.

64레인의 PCI Express gen3을 갖춘 Threadripper

가령 AMD가 렌더 팜용으로 제안하는 것은 2개 x16그래픽 카드 2개 x8그래픽, 3개의 x4스토리지와 같은 구성. 그래픽은 푸른 Radeon의 "Radeon Pro Vega"을 권장하고 있다.3D CG콘텐츠 밤 에이팅용 구성이다.

렌 다 팜용 AMD가 부르고 있다 Threadripper의 구성

코어 게이머용 AMD가 위치하는 구성은 2개 x16그래픽 카드, 1개의 x4스토리지의 구성. GPU는 당연히 붉은 라 데온의 "Radeon RX Vega"이다.다른 세션에서는 이에 더욱이 x8의 캡처 카드와 x4의 10G Ethernet을 거쳤다.

코어 게이머용 Threadripper+Radeon Vega의 구성 예

데이터 과학자용은 6개의 x8 GPU콤퓨ー토카ー도, 1개의 x4스토리지의 구성. GPU카드는 노란 Radeon의 "Radeon Instinct MI25".즉, 적색, 청색, 황색의 Radeon 3색이라고 조합으로 각각 특화된 파워풀한 플랫폼이 된다는 설명이다.

이 밖에 4K이상의 비디오 편집을 위한 콘텐츠 크리에이터용 구성도 AMD는 소개했다.

데이터 과학자용으로도 Threadripper+Radeon Instinct의 구성 예

비디오 콘텐츠 크리에이터용의 구성 예

스트리머용의 구성 예

cap:각사의 Threadripper대응 머더 보드

AMD는 Threadripper을 오로지 고성능을 요구하는 익스트림 PC유저 뿐만이 아니라 3D콘텐츠 제작자와 4K이상의 비디오 제작자 등 창조적 분야의 유저도 목표로 한다.

또 단체 PC에 다수의 GPU을 싣고 돌리고 싶고 GPU콤퓨ー토 이용자도 추구한다. 이러한 시장에서의 CPU와 GPU성능 요구는 천정부지이다.그리고 AMD는 그 시장에서는 Intel의 Core i9에 대해서 Threadripper이 우위를 갖는다고 보고 있다.

Threadripper 같은 고성능 CPU에 대한 요구가 있다고 주장하는 AMD


컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

List of Articles
번호 분류 제목 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 1384 2024.12.12
HOT글 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 new 119 2025.05.20
공지 사랑LOVE 포인트 만렙! 도전 4642 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25845 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20431 2025.01.21
10640 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 new 119 2025.05.20
10639 일반 저렴한 중국산 외장 SSD의 실체 file 515 2025.05.17
10638 일반 인텔 애로우레이크의 CPU 내부 다이 모습 file 600 2025.05.10
10637 일반 스카이프, 오늘 서비스 종료 file 602 2025.05.10
10636 일반 SKT "보상 시 고객도 입증책임" file 630 2025.05.10
10635 정보 KISA, 신규 악성코드 위협 공지...SKT 내부 서버에서 ‘BPF도어’ 악성코드 변종 8종 추가 발견 576 2025.05.10
10634 일반 “SK하이닉스 내부자에 뚫렸다” 中이직 앞두고 1만여건 기술 유출 file 572 2025.05.10
10633 일반 기가바이트, 12년만에 메인보드에 새로운 기능을 추가 file 588 2025.05.10
10632 일반 SKT “위약금 면제 시 수백만명 해지… 분위기 휩쓸려 시장 대혼란” file 594 2025.05.10
10631 일반 CUDA 툴킷, 맥스웰, 파스칼, 볼타 지원 중단 595 2025.05.10
10630 일반 그래픽카드를 활용한 암호 해독 벤치마크 file 598 2025.05.10
10629 일반 애즈락 X870 스틸 레전드 메인보드에서 라이젠 9 9950X CPU가 사망 file 584 2025.05.10
10628 일반 코어 울트라 200 메인보드, PCIe 5.0 M.2 성능 제한이 있음 file 561 2025.05.10
10627 일반 시게이트, 2030년까지 100TB 하드디스크 출시 file 581 2025.05.10
10626 정보 MS가 인텔 18A 공정 계약을 체결? 1 file 596 2025.05.10
10625 정보 블루투스 6.1 발표. 전력 효율과 보안 향상 file 615 2025.05.10
10624 정보 중국 Hygon, 128코어 512스레드의 서버 프로세서 로드맵 공개 file 576 2025.05.10
10623 정보 인텔, 컴퓨텍스에서 아크 프로 B60 24GB를 발표? file 617 2025.05.10
10622 일반 지포스 RTX 5060의 리뷰용 드라이버가 없음 file 624 2025.05.10
10621 일반 젠슨황이 사인한 리바 TNT 엔지니어링 프로토타입 키트, 도시락 상자 file 565 2025.05.10
10620 일반 SSD랑 HDD 가격 요즘 진짜 헬이다… 업체들 때문에 미쳐버릴 듯 4 4657 2025.04.18
10619 일반 컴퓨터 메인보드용 ddr6 메모리는 언제나올지 찾아봤는데 594 2025.04.08
10618 일반 갤럭시탭 S10 FE 4월 3일 출시했습니다. 혜택 나쁘지 않네요 841 2025.04.05
10617 수리/AS 절대 공개하지 않는 메인보드 AS센터의 전설의 기술 1 file 926 2025.03.30
10616 수리/AS 메인보드 수리방법 가감없이 공유합니다! #shorts file 863 2025.03.30
10615 일반 라이카와 협업한 샤오미 15 울트라 실버 크롬 언박싱 971 2025.03.29
10614 일반 어도비 비정품 알림 Adobe 앱 라이선스 관련 알림창 없애기 606 2025.03.28
10613 일반 윈도우 12, 과연 등장할까? (예상 및 루머 정리) 898 2025.03.21
10612 일반 메인보드중에 고장률이 가장 낮은 회사 681 2025.03.19
10611 일반 벽 콘센트 꼽는거 구멍 위치가 정해져있었네 file 1439 2025.03.14
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 355 Next
/ 355