조회 수 1429 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

Extra Form

자료를 바탕으로 RISC-V Xiangshan Yanqi Lake 아키텍처 다이어그램을 다시 그려 ARM A76의 마이크로 아키텍처 다이어그램과 비교했습니다. 전후 비교는 대략 다음과 같습니다.

디코드 6 실행 대 4 실행

ROB 192 항목 vs128 항목

포트 17 대 8 발행

심드? vs 지원 - 벡터 연산을 수행하고 행렬 연산이 포함됩니다.

캐시 라인 64B 대 32B

버퍼 16개 항목 저장 vs 72개 항목 저장

로드 버퍼 없음 대 68개 항목

TLB 32 항목과 48 항목 비교

L1 캐시(16KB(4방향)+128KB(8방향))+32KB(8방향) 대 64KB(4방향)+64KB(4방향)

L2 캐시 1MB/8way 대 512KB/8way

Yanqi Lake에는 16KB 명령 캐시를 가속화하는 데 사용되는 추가 L1plus 캐시가 있으며 이는 ARM 및 Intel/AMD의 아키텍처 다이어그램에서는 거의 볼 수 없습니다.

Xiangshan Yanxi Lake 마이크로아키텍처

몇 가지 관련 질문이 발생합니다.

1. A77 아키텍처의 하드웨어 지표를 비교해봐도 부침이 있는데, 성능 병목 현상은 어디에서 발생하는가? 예를 들어 6발사, 이 사양은 상대적으로 높지만 성능은 2발사 A73만큼 좋지는 않은데요? 또한, 캐시라인 폭도 64byte에 L2 캐시도 1MB로 A76보다 2배 크다. 설명에 의해 기록된 문서의 공개 정보: "A73의 전력 대 성능 비율은 매우 좋으며 두 번의 출시 폭에서 Xiangshan 프로세서보다 더 높은 성능에 도달합니다. Xiangshan은 현재 6번의 출시가 있으므로 Xiangshan의 효율성은 A73만큼 좋지 않습니다."

2. CPU 마이크로 아키텍처는 시스템 모델링에 매우 적합합니다. 자연히 디지털 시스템이므로 외부 정보와의 상호 작용이 비교적 명확합니다. 또한 특정 구성 요소의 조정은 종종 CPU의 전체 성능에 영향을 미칩니다. 특정 제약 조건 하에서 솔루션을 찾기 위한 시스템 모델 바오 선생님과 그의 팀은 최적의 솔루션(tradeoff)에 대해 고민했을 것입니다. 돌파해야 할 어려움은 무엇입니까?

3. A76에서 A77로 MOP 캐시가 추가되어 더 많은 전력을 소비하고 더 많은 물을 필요로 하는 페치/디코드 링크를 건너뛸 수 있습니다. risc-v 명령이 더 간결해지고 건너뛸 수 있어 효율성을 크게 향상시킬 수 있을 것입니다. 프론트엔드의? 또한, MOP 캐시를 사용하면 캐시된 명령어가 직접 uOP로 변환되어 해당 포트의 실행 구성 요소에 배포됩니까?

4. 엔터티와 해당 컨트롤러 간의 관계를 저장하기 위해 DTLB가 데이터 캐시에 직접 연결되지 않는 이유는 무엇입니까?

5. L1plus 캐시가 명령어 캐시를 가속화합니까? 여기서 레지스터를 사용하여 CPU 코어와 동일한 주파수를 구현해야 하는데 꼭 필요한 것은 아니지만 병합 설계에 어려움은 없나요?

6. 액추에이터에는 17개의 포트가 있습니까? 각 실행기는 특정 작업만 개별적으로 구현합니까, 아니면 각 포트에 대해 다중화됩니까? 이 부분은 일반적인 ARM과 Intel CPU 마이크로아키텍처를 참고하여 그릴 수 있나요?

7. 오픈 소스 소개 자료에서는 슬라이드 디렉토리의 전체 자료 외에도 다른 소개를 논리적으로 배열하거나 자료 소개의 번호를 전체 아키텍처 다이어그램에 배치할 수 있습니다. 번호에 따라 전체 그림이 선명하게 보입니다. 아키텍처 다이어그램을 통해 더 많은 디자인 세부 사항을 보여줍니다. 가능하다면 개인적으로 도움을 드리고 싶습니다.

 

원래 Xiangshan 프로세서를 자세히 살펴보니 오픈소스라 하더라도 아직 이해하고 확인해야 할 부분이 많다는 걸 알게 됐는데 큰 함정이군요O(∩_∩)O

참고 자료 의 주요 출처 : 

새로운 메인라인 버전의 문서가 20220321년 오후에 공개되었습니다. 다시 도면을 비교해 보았는데 변경된 부분이 많은 것을 발견했습니다. 일부 문서를 추가해야 합니다.

Xiangshan Nanhu 마이크로아키텍처

오후에야 출시를 봐서 급했습니다. 먼저 그려봤는데 아직 궁금한 점이 많아서 시간을 내서 다시 분석해보겠습니다. 일반적인 CPU 아키텍처와 매우 유사합니다.


0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 덕후냥이 1427 2024.12.12
공지 🚨(뉴비필독) 전체공지 & 포인트안내 10 무명의덕질 26234 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 무명의덕질 20660 2025.01.21
10642 일반 윈도우10이 곧 지원 종료 예정 (윈도우11 PowerToys 설치해보세) file 덕후냥이 390 2025.06.10
10641 일반 윈도우에서 바로가기 버튼으로 모니터 화면 자동 전환(가로/세로) 방법 덕후냥이 531 2025.06.05
10640 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 덕후냥이 278 2025.05.20
10639 일반 저렴한 중국산 외장 SSD의 실체 file 덕후냥이 553 2025.05.17
10638 일반 인텔 애로우레이크의 CPU 내부 다이 모습 file 덕후냥이 628 2025.05.10
10637 일반 스카이프, 오늘 서비스 종료 file 덕후냥이 631 2025.05.10
10636 일반 SKT "보상 시 고객도 입증책임" file 덕후냥이 652 2025.05.10
10635 정보 KISA, 신규 악성코드 위협 공지...SKT 내부 서버에서 ‘BPF도어’ 악성코드 변종 8종 추... 덕후냥이 616 2025.05.10
10634 일반 “SK하이닉스 내부자에 뚫렸다” 中이직 앞두고 1만여건 기술 유출 file 덕후냥이 593 2025.05.10
10633 일반 기가바이트, 12년만에 메인보드에 새로운 기능을 추가 file 덕후냥이 620 2025.05.10
10632 일반 SKT “위약금 면제 시 수백만명 해지… 분위기 휩쓸려 시장 대혼란” file 덕후냥이 612 2025.05.10
10631 일반 CUDA 툴킷, 맥스웰, 파스칼, 볼타 지원 중단 덕후냥이 631 2025.05.10
10630 일반 그래픽카드를 활용한 암호 해독 벤치마크 file 덕후냥이 620 2025.05.10
10629 일반 애즈락 X870 스틸 레전드 메인보드에서 라이젠 9 9950X CPU가 사망 file 덕후냥이 616 2025.05.10
10628 일반 코어 울트라 200 메인보드, PCIe 5.0 M.2 성능 제한이 있음 file 덕후냥이 587 2025.05.10
10627 일반 시게이트, 2030년까지 100TB 하드디스크 출시 file 덕후냥이 605 2025.05.10
10626 정보 MS가 인텔 18A 공정 계약을 체결? 1 file 덕후냥이 615 2025.05.10
10625 정보 블루투스 6.1 발표. 전력 효율과 보안 향상 file 덕후냥이 633 2025.05.10
10624 정보 중국 Hygon, 128코어 512스레드의 서버 프로세서 로드맵 공개 file 덕후냥이 597 2025.05.10
10623 정보 인텔, 컴퓨텍스에서 아크 프로 B60 24GB를 발표? file 덕후냥이 643 2025.05.10
Board Pagination Prev 1 2 3 4 5 ... 533 Next
/ 533