본문 바로가기

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

AMD Radeon RX 7000 AI.jpg

▶ AMD, 3rd RDNA GPU 마이크로아키텍처 기반 ROCm(5.7) 및 PyTorch(파이토치) 지원 리눅스 드라이버 발표

- 지원 대상 GPU 마이크로아키텍처 : AMD 3rd RDNA(라데온 7000 라인업)

- 지원 대상 GPU : 라데온 RX 7900XTX, 라데온 프로 W7900

- 지원 대상 리눅스 : 우분투[AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) 5.7 버전 사용]

※ PyTorch(파이토치 - 딥 러닝 라이브모델)를 사용한 '머신 러닝 모델 및 알고리즘'의 연구원(개발자)들은 사용이 가능함

(GPU의 병렬 컴퓨팅 성능을 활용이 가능함)

 

① AMD '라데온 테크놀로지 그룹' 제품 관리 담당 부사장, Dan Wood(댄 우드)

- 3rd RDNA GPU(라데온 RX 7900XTX, 라데온 프로 W7900)와 ROCm 오픈 소스 플랫폼 기반으로 구축한 PyTorch(파이토치)를 사용하여 AI(인공지능) 커뮤니티에 머신 러닝 개발의 지원을 제공하게 되었음

 

- 3rd RDNA GPU(라데온 RX 7900XTX, 라데온 프로 W7900)의 병렬 GPU 컴퓨팅 성능으로 PyTorch(파이토치)를 연구가 가능하게 되어 '이전 클라우드 기반 솔루션'에 의존했던 개발자 및 효율적 워크플로우를 구현이 가능함(머신-러닝 교육 & 추론)

 

AMD ROCm 5.7.jpg

② AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) 5.7 버전 기반의 데스크탑 GPU에서 머신 러닝 플랫폼 개발(아래부터 위로)

- H/W(GPU) : AMD 3rd RDNA GPU 마이크로아키텍처(라데온 RX 7900XTX, 라데온 프로 W7900)

- 리눅스 OS : 우분투 리눅스(22.04.3)

- 런타임, 컴파일러 & 도구, 라이브러리 : AMD ROCm 5.7(입증된 소프트웨어 스택)

- 모델 & 딥러닝 플랫폼[PyTorch(파이토치) & 머신 러닝 모델 + 알고리즘] : AMD에 최적화된 '프레임워크 및 AI(인공지능)' 모델

 

③ 데스크탑 PC의 머신-러닝 가속화

- 현재 모델 : AI(인공지능)용으로 미설계된 표준 H/W & S/W의 기능을 쉽게 초과됨

 

- 라데온 7900[RX, W(워크스테이션) GPU] : RX 7900XTX(24GB) & W7900(48GB)의 대용량 GPU 메모리 덕분에 늘어나는 워크플로우 문제를 저렴하면서도 유능하게 해결이 가능한 솔루션임

 

- 3rd RDNA GPU 마이크로아키텍처 : 최대 192개의 'AI(인공지능) 가속기'를 탑재 / 이전 세대(2nd RDNA) 비해 1개 CU당 AI(인공지능) 성능이 2배 이상 향상됨

 

④ 데스크탑 & 서버(데이터센터)를 위한 통합 S/W 스택

- AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) : GPU 프로그래밍을 위한 개방형 AMD S/W 스택

[GPGPU(범용 GPU), 고성능 컴퓨팅, 이기종 컴퓨팅 등 다중 도메인에 걸쳐 있음]

 

- PyTorch(파이토치) & ROCm(5.7) : 3rd RDNA GPU의 대규모 병렬 컴퓨팅 성능을 잠금 해제함

[동일한 통합 S/W 스택은 'AMD 인스팅트 서버(데이터센터) GPU'도 지원함]

 

⑤ 자유로운 커스터마이징

- AMD 'R'adeon 'O'pen 'C'ompute platfor'm'(ROCm) : 오픈-소스 S/W(OSS)로서 개발자는 필요에 맞게 'GPU S/W'를 커스터마이징 및 조정이 가능하고, 다른 개발자 커뮤니티와 협력하여 민첩성 & 유연성을 지닌 빠른 방식으로 찾을 수 있음.

 

- AMD ROCm 목표 : GPU H/W의 투자 극대화, S/W 생태계에 도움을 주기 위해서 설계[무료 오픈 소스, 통합 및 보안 S/W 생태계의 'GPU 가속 기반 HPC', AI(인공지능), 과학 컴퓨팅, CAD 및 기타 애플리케이션을 개발, 테스트 및 배포]

 

※ AMD 3rd RDNA GPU 마이크로아키텍처 : 머신 러닝 개발을 위한 로컬 클라이언트의 기반 설정을 혜택을 누리면서, 개발자(연구자)가 AI(인공지능)에 쉽게 접근할 수 있도록 하기 위한 GPU(업계가 광범위한 시스템, 프레임워크 및 가속기 지원을 지원하는 생태계로 이동함)

 

 

 

https://community.amd.com/t5/ai/amd-extends-support-for-pytorch-machine-learning-development-on/ba-p/637756




List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 3934 2024.04.14
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 4978 2024.02.14
344 정보/소식 가성비 있는 게이밍 PC를 위한 프로세서! Intel Core i5-14400F file 😀컴덕074 10 2024.05.20
343 정보/소식 중국산 미니PC 주의 비밀번호 터는 '악성코드' 심어 판매 역시 중국은 의심해봐야 돼 file 😀컴덕510 322 2024.04.06
342 정보/소식 펌) 점보 프레임뽕이 와서 과연 유용한가 테스트를 해보았습니다 😀컴덕814 420 2024.04.06
341 정보/소식 ASUS Tornado TUF-AX3000v2 분해, MU-MIMO 및 1G 병목 현상 file 😀컴덕440 313 2024.02.08
340 정보/소식 ASUS TUF-AX3000V2 2.5G 네트워크 포트는 WAN 포트로만 사용할 수 있습니다 file 😀컴덕209 266 2024.02.08
339 정보/소식 ASUS GT-AX6000 소형 패킷 포워딩 성능 테스트, USB 포트, D포인트 충족 file 😀컴덕927 325 2024.02.07
338 정보/소식 Xiaomi 13 Pro 및 7TR13090을 사용하여 MLO 효과 측정 file 😀컴덕491 305 2024.02.07
337 정보/소식 ASUS GT-AX6000 및 XDR6080 무선 비교 테스트 file 😀컴덕853 321 2024.02.07
336 정보/소식 TP-LINK BE5100 7DR5130 분해, 새로운 6nm 칩 file 😀컴덕262 308 2024.02.07
335 정보/소식 코어 i9-14900T의 긱벤치 성능 file 😀컴덕106 315 2024.02.07
334 정보/소식 애즈락, AMD 7nm FP6 모바일 프로세서 탑재 메인보드 발표 file 😀컴덕153 645 2024.01.15
333 정보/소식 NVIDIA의 중국 시장 AI 프로세서 판매량이 줄어들 듯 😀컴덕554 690 2024.01.15
332 정보/소식 라이젠 8000G, 스위트 스팟은 DDR5-6000 메모리 file 😀컴덕078 665 2024.01.15
331 정보/소식 지포스 RTX 4090D, 4090보다 6% 느림 file 😀컴덕223 629 2024.01.15
330 정보/소식 세계 최초 DP 2.1 UHBR20 탑재 OLED 게이밍 모니터 file 😀컴덕566 670 2024.01.15
329 정보/소식 중국 대신 인도 회사가 NVIDiA AI GPU를 대량 구매 😀컴덕257 713 2024.01.15
328 정보/소식 AMD 라이젠 9 7940HX 5.2GHz 프로세서 file 😀컴덕002 681 2024.01.15
327 정보/소식 피닉스 2 다이의 라이젠 8000G, PCIe 대역폭 제한 file 😀컴덕660 623 2024.01.15
326 정보/소식 글로벌 웹사이트 전세계 순위 (정확함) 😀컴덕104 601 2024.01.15
325 정보/소식 엔비디아, '지포스 RTX 4000 슈퍼 GPU 라인업' 슬라이드 유출(사양 및 출시 가격 공식 확인) file 😀컴덕536 323 2024.01.09
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 18 Next
/ 18