본문 바로가기

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

예전에 SD888데브킷으로 징징거리던 글을 썼던 적이 있었습니다만...

 

그 때는 GPU위주였고, CPU쪽 작업을 할 일이 있어서 대충 성능이 어느정도 되나 뽑아봤습니다. 

 

뽑는김에....가지고 있는 기기들을 모아서... 대충 실제 프로그램에서 성능이 어떻게 변화하였나 경향성도 봤습니다. 

 

테스트 프로그램은 직접 작성한 행렬곱 (Matrix Mul)프로그램이며, 기본 A[MxK] * B[KxN] = C[MxN] 에서, M,N,K모두 1000으로 테스트 했습니다. (fp32기준)

 

NDK를 사용해서 C 네이티브 코드로 작성했기 때문에 JAVA&Kotlin에서는 더 느릴 듯 합니다. 

 

(모든 단위는 초(second) 기준, 5회 시행 평균값)

 

- 코드설명 - 

Basic : K열을 기준으로 반복문을 돌며 아무런 최적화가 이루어지지 않은 코드

OPT : 반복문의 순서를 바꾸어서 cache 최적화가 추가된 코드

NEON : ARM의 SIMD 명령어를 활용한 코드 (vec-4)

 

- 테스트기기 -

SD750G (Tab s7 lite) : Cortex-A77@2.21Ghz mp2 + Cortex-A55@1.8Ghz mp6

SD855 (V50) : Cortex-A76@2.84Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD860 (Mipad 5) : Cortex-A76@2.96Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD865 (S20) : Cortex-A77@2.84Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD865+ (Fold2) : Cortex-A77@3.09Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD888 (SD888 devkit) : Cortex-X1@2.84Ghz mp1 + Cortex-A78@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

 

- 테스트 결과 - 

 

리틀코어 (3년간의 플래그쉽과 미들레인지 사이 공평한 성능)

image.png

 

미들코어

image.png

 

빅코어

image.png

 

LITTLE이 big대비 몇 배의 시간을 사용했는가?

image.png

 

MIDdle이 big대비 몇 배의 시간을 사용했는가?

image.png

 

미들레인지(750G)의 성능으로 normalize

image.png

 

 

값은 보시는 대로 이며...

 

소감은

 

  1. ARM의 리틀코어.... 너무하다. 빅 코어는 어느정도 성능이 올라가는데 리틀은 동결이니.... 생각없이 코드를 짜면 무려...13.5배 느리다. 
  2. 그나마 NEON같이 SIMD를 사용하는 특정 상황에서는 big코어의 3~4배로 격차가 좁혀진다. 
  3. 스냅드래곤의 MIDdle은 거의 같은 클럭을 유지하기 때문에 비교가 편한데, 꾸준히 향상은 하지만 근본적으로 cache나 ALU숫자는 비슷해서 NEON같은거 쓰면 비슷해지는거 같다. 

  4. 생각보다 연말에 나오는 +붙거나 +5된 모델이 공정안정화 클럭 업 치고는 성능이 오르기는 한다, 특히 최근 새 아키텍처의 싱글 IPC 향상이 적어서 두드러지는 것일지도...

  5. SD888결과 중....NEON에서 성능이 더 떨어지는 경우가 있다. devkit에는 공랭 FAN도 달아두었는데...;; 아마 AVX같이 클럭 유지가 안 되는 것 일지도... 

  6. 생각없이 짠 코드에서는 X1의 성능 향상이 두드러진다 (...)

  7. 생각보다 빅과 미들의 차는 20~30%정도, 디멘시티 9000이 X2@3.0Ghz+A710@2.8Ghz 조합인데 미들코어 클럭이 높아서 한동안 격차가 날 것 같음.

 

생각보다.... 테스트하기 힘들군요. 스크립트를 짜서 해도 adb 연결하는게 일입니다(...)

 

멀티코어 최적화를 해야하는데 리틀코어가 고심입니다. NEON까지 써야 겨우 1/3 성능이니.... 토이 케이스로 실험 좀 더 해보고 성능 안 나오면 리틀은 배제해도 되지 않을까 합니다..;

 

 

 

P.S 그렇다고 빅 코어 아키텍처를 옹호하기는 힘든것이... Fugaku같이 작정하고 매니코어 구성을 하지 않는 이상 ARM CPU로 ML을 ??!? ARM v9에 왕창 추가된 명령어셋도 그렇고. 정상적으로 IPC를 올리기 힘드니 눈 가리고 아웅거리는 꼴이네요(...)

 

 

 

 


List of Articles
번호 분류 제목 날짜 조회 수
공지 유머 🚨(뉴비필독) 전체공지 & 포인트안내 10 2024.11.04 26575
공지 이슈 URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 20955
379961 배고픈데 뭐 먹을지 추천좀 3 new 2025.06.21 47
379960 디스크 브레이크 패드 자가 교체 방법 요약 정리 newfile 2025.06.21 53
379959 자전거 유압브레이크 오일보충 블리딩 초보자도 쉽게 따라하기 2 newfile 2025.06.21 60
379958 픽시 브레이크 쉽게 탈부착 하는 방법 #픽시 newfile 2025.06.21 59
379957 비는 안온다 1 new 2025.06.21 79
379956 비는 안온다 new 2025.06.21 61
379955 기사/뉴스 [서울가요대상 D-Day] 별들의 잔치, 인천에 뜬다 newfile 2025.06.21 81
379954 실내는 춥네요 new 2025.06.21 86
379953 일반 라이젠3600이랑 5600 똥값됐네 new 2025.06.21 120
379952 날좋네 1 new 2025.06.21 106
379951 효도 선물로 딱좋아음 콜롬비아 구스다운 75,880원 무배 newfile 2025.06.21 500
379950 배구파 1 new 2025.06.21 109
379949 이슈 갓태어난 송아지 밥주는 법 알려주는 고등학교jpg newfile 2025.06.21 173
379948 유머 릴스 알고리즘 터졌다는 이준영 빙의한 스윙스 newfile 2025.06.21 187
379947 유머 보던 시청자들 깜짝 놀란 이찬원이 직접 만들었다는 거대 바베큐 newfile 2025.06.21 197
379946 미국 콘도나 타운하우스 사는 덕들 있나? 2 2025.06.20 357
379945 미국 덕들 영어 액센트 어때? 2 2025.06.20 347
379944 미국 한국에서 짜파게티 어떻게 해먹니? 2 2025.06.20 346
379943 미국 20년 동안 캘리에서만 살아서 그냥 캘리 촌사람 됨 2 2025.06.20 352
379942 미국 집에서 밥 뭘로 해먹어? 2 2025.06.20 355
379941 미국 중학교 때 미국 와서 지금까지 10년 넘게 살았는데 1 2025.06.20 334
379940 일본 일덕들아 집에서 뭐하고 지내? 3 2025.06.20 356
379939 미국 한국가면 뭐 먹고싶어? 2025.06.20 327
379938 일본 일본에서 조별과제하면 진심 복장터짐 시발ㅋㅋㅋ 2 2025.06.20 350
379937 일본 내 한국 리턴을 망설이게 되는이유가 2 2025.06.20 340
379936 일본 일본어 진짜 네이티브급으로 잘하면 징그럽다 이런 소리 들음 1 2025.06.20 329
379935 중국 광저우에서 한국 여행객들끼리 막 “이거 뭐야?” “아닌가?” 하고 궁금해하면 1 2025.06.20 329
379934 일본 교무슈퍼 진짜 좋지 않냐 1 2025.06.20 350
379933 미국 혐오 범죄, 침묵은 공범이다 뉴욕·뉴저지 신고 절차와 실질 대응 가이드 file 2025.06.20 344
379932 잡담 애들아 생리안하기vs기온 맘대로 조절하기 3 2025.06.20 379
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 12666 Next
/ 12666