본문 바로가기
조회 수 1201 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

자료를 바탕으로 RISC-V Xiangshan Yanqi Lake 아키텍처 다이어그램을 다시 그려 ARM A76의 마이크로 아키텍처 다이어그램과 비교했습니다. 전후 비교는 대략 다음과 같습니다.

디코드 6 실행 대 4 실행

ROB 192 항목 vs128 항목

포트 17 대 8 발행

심드? vs 지원 - 벡터 연산을 수행하고 행렬 연산이 포함됩니다.

캐시 라인 64B 대 32B

버퍼 16개 항목 저장 vs 72개 항목 저장

로드 버퍼 없음 대 68개 항목

TLB 32 항목과 48 항목 비교

L1 캐시(16KB(4방향)+128KB(8방향))+32KB(8방향) 대 64KB(4방향)+64KB(4방향)

L2 캐시 1MB/8way 대 512KB/8way

Yanqi Lake에는 16KB 명령 캐시를 가속화하는 데 사용되는 추가 L1plus 캐시가 있으며 이는 ARM 및 Intel/AMD의 아키텍처 다이어그램에서는 거의 볼 수 없습니다.

Xiangshan Yanxi Lake 마이크로아키텍처

몇 가지 관련 질문이 발생합니다.

1. A77 아키텍처의 하드웨어 지표를 비교해봐도 부침이 있는데, 성능 병목 현상은 어디에서 발생하는가? 예를 들어 6발사, 이 사양은 상대적으로 높지만 성능은 2발사 A73만큼 좋지는 않은데요? 또한, 캐시라인 폭도 64byte에 L2 캐시도 1MB로 A76보다 2배 크다. 설명에 의해 기록된 문서의 공개 정보: "A73의 전력 대 성능 비율은 매우 좋으며 두 번의 출시 폭에서 Xiangshan 프로세서보다 더 높은 성능에 도달합니다. Xiangshan은 현재 6번의 출시가 있으므로 Xiangshan의 효율성은 A73만큼 좋지 않습니다."

2. CPU 마이크로 아키텍처는 시스템 모델링에 매우 적합합니다. 자연히 디지털 시스템이므로 외부 정보와의 상호 작용이 비교적 명확합니다. 또한 특정 구성 요소의 조정은 종종 CPU의 전체 성능에 영향을 미칩니다. 특정 제약 조건 하에서 솔루션을 찾기 위한 시스템 모델 바오 선생님과 그의 팀은 최적의 솔루션(tradeoff)에 대해 고민했을 것입니다. 돌파해야 할 어려움은 무엇입니까?

3. A76에서 A77로 MOP 캐시가 추가되어 더 많은 전력을 소비하고 더 많은 물을 필요로 하는 페치/디코드 링크를 건너뛸 수 있습니다. risc-v 명령이 더 간결해지고 건너뛸 수 있어 효율성을 크게 향상시킬 수 있을 것입니다. 프론트엔드의? 또한, MOP 캐시를 사용하면 캐시된 명령어가 직접 uOP로 변환되어 해당 포트의 실행 구성 요소에 배포됩니까?

4. 엔터티와 해당 컨트롤러 간의 관계를 저장하기 위해 DTLB가 데이터 캐시에 직접 연결되지 않는 이유는 무엇입니까?

5. L1plus 캐시가 명령어 캐시를 가속화합니까? 여기서 레지스터를 사용하여 CPU 코어와 동일한 주파수를 구현해야 하는데 꼭 필요한 것은 아니지만 병합 설계에 어려움은 없나요?

6. 액추에이터에는 17개의 포트가 있습니까? 각 실행기는 특정 작업만 개별적으로 구현합니까, 아니면 각 포트에 대해 다중화됩니까? 이 부분은 일반적인 ARM과 Intel CPU 마이크로아키텍처를 참고하여 그릴 수 있나요?

7. 오픈 소스 소개 자료에서는 슬라이드 디렉토리의 전체 자료 외에도 다른 소개를 논리적으로 배열하거나 자료 소개의 번호를 전체 아키텍처 다이어그램에 배치할 수 있습니다. 번호에 따라 전체 그림이 선명하게 보입니다. 아키텍처 다이어그램을 통해 더 많은 디자인 세부 사항을 보여줍니다. 가능하다면 개인적으로 도움을 드리고 싶습니다.

 

원래 Xiangshan 프로세서를 자세히 살펴보니 오픈소스라 하더라도 아직 이해하고 확인해야 할 부분이 많다는 걸 알게 됐는데 큰 함정이군요O(∩_∩)O

참고 자료 의 주요 출처 : 

새로운 메인라인 버전의 문서가 20220321년 오후에 공개되었습니다. 다시 도면을 비교해 보았는데 변경된 부분이 많은 것을 발견했습니다. 일부 문서를 추가해야 합니다.

Xiangshan Nanhu 마이크로아키텍처

오후에야 출시를 봐서 급했습니다. 먼저 그려봤는데 아직 궁금한 점이 많아서 시간을 내서 다시 분석해보겠습니다. 일반적인 CPU 아키텍처와 매우 유사합니다.




List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 5219 2024.04.14
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 5207 2024.02.14
5309 일반 ? 페어폰? file 😀16675494 33 2022.03.03
5308 일반 ???: 핫딜 올려봐~~~ 😀컴덕205 70 2022.02.09
5307 일반 .exe 파일을 추출 하는 프로그램 😀컴덕436 466 2023.03.27
5306 정보/소식 ‘도둑 시청’ 새 누누티비 문 열었다…OTT 업계 '한숨' 😀컴덕974 182 2023.06.24
5305 일반 ‘테라’ 권도형 “싱가포르 있다”더니…현지 사무실 폐쇄 😀익명353 538 2022.12.31
5304 일반 “넷플릭스보다 디즈니+” 냉정한 美 월가, 디즈니 손든 이유 😀익명650 37 2023.03.27
5303 일반 “몸값 시한 지나면 자동 삭제”··· 랜섬웨어 ‘로키로커’가 당신을 노린다 😀익명191 507 2022.12.31
5302 일반 “몸값 시한 지나면 자동 삭제”··· 랜섬웨어 ‘로키로커’가 당신을 노린다 😀컴덕후786 37 2023.03.27
5301 일반 ㈜아이티스노우볼, 투자용 신용평가서 최상위급 'Ti-2' 등급 획득 😀컴덕후910 89 2023.03.27
5300 일반 (개발자분들을 위한 익스 호환성 태그) X-UA-Compatible Meta Tag Description and Uses: 😀컴덕435 43 2023.03.27
5299 일반 (꿀팁) 현재 핸드폰(스마트폰) 배터리수명을 체크하는 방법 😀컴덕753 1103 2023.03.27
5298 일반 (루머) 구글 픽셀 4 디자인 유출 😀익명792 1076 2023.03.27
5297 일반 (루머) 아이패드 7세대 & 아이패드 미니5 주요 스펙 😀익명827 966 2023.03.27
5296 일반 (루머)인텔 신규 제온 24C CPU는 AMD 쓰레드리퍼 24C보다 느려 file 😀익명926 1816 2023.02.07
5295 일반 (리눅스) 네트워크 경로 추적, DNS 네임서버 추적 😀컴덕147 53 2023.03.27
5294 일반 (밑에서 이어짐) 병원 실려갔음 😀컴덕후454 43 2022.02.14
5293 일반 (생방)네이버 라이브 쇼핑 준비중- 잠시 후 아래 링크에서 WD_BLACK 특판 시작합니다 σ(^○^) file 😀컴덕후307 41 2023.03.27
5292 일반 (생방으로 컴수리) 램이 귀신이 씌인거 같았요. 16기가 램이 8기가 램이랑 안붙어요 o(〒﹏〒)o file 😀컴덕042 40 2023.03.27
5291 일반 (수정)i5 11500, i7 11700K 게임 벤치마크 유출 😀컴덕후669 74 2023.03.27
5290 일반 (컴알못/모니터 관련 질문많음..) 조립pc랑 모니터 따로 사도 돼?? 😀컴덕094 33 2020.12.28
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 266 Next
/ 266