본문 바로가기

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

예전에 SD888데브킷으로 징징거리던 글을 썼던 적이 있었습니다만...

 

그 때는 GPU위주였고, CPU쪽 작업을 할 일이 있어서 대충 성능이 어느정도 되나 뽑아봤습니다. 

 

뽑는김에....가지고 있는 기기들을 모아서... 대충 실제 프로그램에서 성능이 어떻게 변화하였나 경향성도 봤습니다. 

 

테스트 프로그램은 직접 작성한 행렬곱 (Matrix Mul)프로그램이며, 기본 A[MxK] * B[KxN] = C[MxN] 에서, M,N,K모두 1000으로 테스트 했습니다. (fp32기준)

 

NDK를 사용해서 C 네이티브 코드로 작성했기 때문에 JAVA&Kotlin에서는 더 느릴 듯 합니다. 

 

(모든 단위는 초(second) 기준, 5회 시행 평균값)

 

- 코드설명 - 

Basic : K열을 기준으로 반복문을 돌며 아무런 최적화가 이루어지지 않은 코드

OPT : 반복문의 순서를 바꾸어서 cache 최적화가 추가된 코드

NEON : ARM의 SIMD 명령어를 활용한 코드 (vec-4)

 

- 테스트기기 -

SD750G (Tab s7 lite) : Cortex-A77@2.21Ghz mp2 + Cortex-A55@1.8Ghz mp6

SD855 (V50) : Cortex-A76@2.84Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD860 (Mipad 5) : Cortex-A76@2.96Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD865 (S20) : Cortex-A77@2.84Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD865+ (Fold2) : Cortex-A77@3.09Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD888 (SD888 devkit) : Cortex-X1@2.84Ghz mp1 + Cortex-A78@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

 

- 테스트 결과 - 

 

리틀코어 (3년간의 플래그쉽과 미들레인지 사이 공평한 성능)

image.png

 

미들코어

image.png

 

빅코어

image.png

 

LITTLE이 big대비 몇 배의 시간을 사용했는가?

image.png

 

MIDdle이 big대비 몇 배의 시간을 사용했는가?

image.png

 

미들레인지(750G)의 성능으로 normalize

image.png

 

 

값은 보시는 대로 이며...

 

소감은

 

  1. ARM의 리틀코어.... 너무하다. 빅 코어는 어느정도 성능이 올라가는데 리틀은 동결이니.... 생각없이 코드를 짜면 무려...13.5배 느리다. 
  2. 그나마 NEON같이 SIMD를 사용하는 특정 상황에서는 big코어의 3~4배로 격차가 좁혀진다. 
  3. 스냅드래곤의 MIDdle은 거의 같은 클럭을 유지하기 때문에 비교가 편한데, 꾸준히 향상은 하지만 근본적으로 cache나 ALU숫자는 비슷해서 NEON같은거 쓰면 비슷해지는거 같다. 

  4. 생각보다 연말에 나오는 +붙거나 +5된 모델이 공정안정화 클럭 업 치고는 성능이 오르기는 한다, 특히 최근 새 아키텍처의 싱글 IPC 향상이 적어서 두드러지는 것일지도...

  5. SD888결과 중....NEON에서 성능이 더 떨어지는 경우가 있다. devkit에는 공랭 FAN도 달아두었는데...;; 아마 AVX같이 클럭 유지가 안 되는 것 일지도... 

  6. 생각없이 짠 코드에서는 X1의 성능 향상이 두드러진다 (...)

  7. 생각보다 빅과 미들의 차는 20~30%정도, 디멘시티 9000이 X2@3.0Ghz+A710@2.8Ghz 조합인데 미들코어 클럭이 높아서 한동안 격차가 날 것 같음.

 

생각보다.... 테스트하기 힘들군요. 스크립트를 짜서 해도 adb 연결하는게 일입니다(...)

 

멀티코어 최적화를 해야하는데 리틀코어가 고심입니다. NEON까지 써야 겨우 1/3 성능이니.... 토이 케이스로 실험 좀 더 해보고 성능 안 나오면 리틀은 배제해도 되지 않을까 합니다..;

 

 

 

P.S 그렇다고 빅 코어 아키텍처를 옹호하기는 힘든것이... Fugaku같이 작정하고 매니코어 구성을 하지 않는 이상 ARM CPU로 ML을 ??!? ARM v9에 왕창 추가된 명령어셋도 그렇고. 정상적으로 IPC를 올리기 힘드니 눈 가리고 아웅거리는 꼴이네요(...)

 

 

 

 




List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
공지 덕질 공통 이용규칙 및 안내 (업데이트중+ 2024-04-13) 😀컴덕824 2024.04.14 3851
공지 1000P를 모으면 다이소 상품권 1000원을 신청할 수 있습니다. file Private 2024.02.14 4949
1277 일반 ‘갤럭시S21’을 3만원에?…통신3사, 최대 61만원 불법 지원 - 조선비즈 익명 2023.03.27 9
1276 일반 ‘삼성폰 언박싱’ 유튜버의 한탄 “정말 열심히 만들었는데…” [IT선빵!] - 헤럴드경제 뉴스 - 헤럴드경제 익명 2023.03.27 14
1275 일반 ‘아이폰12 15만원→갤S21 17만원’ 구매 가격 낮아진다 [IT선빵!] - 헤럴드경제 뉴스 - 헤럴드경제 익명 2023.03.27 14
1274 일반 ‘초저렴한’ 갤럭시 나온다…‘갤럭시 A25 5G’ 출시 file 😀갤덕509 2024.01.09 344
1273 일반 “5G는 갤럭시”… 美 다운로드 속도 측정서 아이폰 압도 - 머니S - Money S 익명 2023.03.27 26
1272 일반 “SSD도 고장 난다” 토발즈의 발견에 대한 검증 익명 2023.03.27 10
1271 일반 “갤럭시폴드2와 너무 똑같다?” 궁지에 몰린 화웨이 막 베낀다! 😀익명753 2023.03.27 1199
1270 일반 “설마했는데, 다 유출됐네” 난리난 삼성 제품 ‘이렇게’ 생겼다 file 😀익명986 2023.05.29 242
1269 일반 “이걸 257만원에 사? 순식간에 완판” 삼성도 긴장한 ‘접는폰’ 등장 file 😀익명740 2023.05.29 316
1268 일반 (루머) 삼성, 스마트폰 AMOLED 번인 보증정책 변경 😀익명362 2023.03.27 1044
1267 정보공유 (스마트폰 배터리 차이) 리튬-이온 배터리 VS 리튬-폴리머 배터리 file 😀갤덕505 2023.12.20 415
1266 일반 [11번가] 긴급공수 & 타임딜 안내 익명 2023.03.27 13
1265 일반 [11번가]HGST DeskStar IDK CoolSpin 4TB(HMS5C4040ALE640) 3.5형 HDD 익명 2023.03.27 13
1264 일반 [11번가]디지털 페스티벌 삼성전자 F24T350 136,890 외 6모델 익명 2023.03.27 15
1263 일반 [50% 할인]워치페이스 할인합니다. file 😀갤덕240 2023.11.24 10
1262 일반 [IT하는법] 원치않는 알림, 안보이게 설정하는 법 😀익명430 2023.03.27 1207
1261 정보공유 [VoLTE] 미10T 프로, 미11 등 KT VoLTE 강제활성화 방법 😀갤덕616 2023.08.31 424
1260 일반 [WIS 2014 영상] 실스타, '오! 아티스트 브러쉬 스타일러스' 선보여 😀익명846 2023.03.27 1386
1259 일반 [갤럭시 탭s9 시리즈 루머] 처음으로 디테일한 스팩 유출 😀익명032 2023.07.14 582
1258 일반 [갤럭시 활용하기] "엣지가 자꾸 오작동돼서 불편해요", '엣지 터치'로 해결하기 익명 2023.03.27 1188
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 64 Next
/ 64