단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

예전에 SD888데브킷으로 징징거리던 글을 썼던 적이 있었습니다만...

 

그 때는 GPU위주였고, CPU쪽 작업을 할 일이 있어서 대충 성능이 어느정도 되나 뽑아봤습니다. 

 

뽑는김에....가지고 있는 기기들을 모아서... 대충 실제 프로그램에서 성능이 어떻게 변화하였나 경향성도 봤습니다. 

 

테스트 프로그램은 직접 작성한 행렬곱 (Matrix Mul)프로그램이며, 기본 A[MxK] * B[KxN] = C[MxN] 에서, M,N,K모두 1000으로 테스트 했습니다. (fp32기준)

 

NDK를 사용해서 C 네이티브 코드로 작성했기 때문에 JAVA&Kotlin에서는 더 느릴 듯 합니다. 

 

(모든 단위는 초(second) 기준, 5회 시행 평균값)

 

- 코드설명 - 

Basic : K열을 기준으로 반복문을 돌며 아무런 최적화가 이루어지지 않은 코드

OPT : 반복문의 순서를 바꾸어서 cache 최적화가 추가된 코드

NEON : ARM의 SIMD 명령어를 활용한 코드 (vec-4)

 

- 테스트기기 -

SD750G (Tab s7 lite) : Cortex-A77@2.21Ghz mp2 + Cortex-A55@1.8Ghz mp6

SD855 (V50) : Cortex-A76@2.84Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD860 (Mipad 5) : Cortex-A76@2.96Ghz mp1 + Cortex-A76@2.42Ghz mp3 + Cortex-A55@1.79Ghz mp4

SD865 (S20) : Cortex-A77@2.84Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD865+ (Fold2) : Cortex-A77@3.09Ghz mp1 + Cortex-A77@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

SD888 (SD888 devkit) : Cortex-X1@2.84Ghz mp1 + Cortex-A78@2.42Ghz mp3 + Cortex-A55@1.80Ghz mp4

 

- 테스트 결과 - 

 

리틀코어 (3년간의 플래그쉽과 미들레인지 사이 공평한 성능)

image.png

 

미들코어

image.png

 

빅코어

image.png

 

LITTLE이 big대비 몇 배의 시간을 사용했는가?

image.png

 

MIDdle이 big대비 몇 배의 시간을 사용했는가?

image.png

 

미들레인지(750G)의 성능으로 normalize

image.png

 

 

값은 보시는 대로 이며...

 

소감은

 

  1. ARM의 리틀코어.... 너무하다. 빅 코어는 어느정도 성능이 올라가는데 리틀은 동결이니.... 생각없이 코드를 짜면 무려...13.5배 느리다. 
  2. 그나마 NEON같이 SIMD를 사용하는 특정 상황에서는 big코어의 3~4배로 격차가 좁혀진다. 
  3. 스냅드래곤의 MIDdle은 거의 같은 클럭을 유지하기 때문에 비교가 편한데, 꾸준히 향상은 하지만 근본적으로 cache나 ALU숫자는 비슷해서 NEON같은거 쓰면 비슷해지는거 같다. 

  4. 생각보다 연말에 나오는 +붙거나 +5된 모델이 공정안정화 클럭 업 치고는 성능이 오르기는 한다, 특히 최근 새 아키텍처의 싱글 IPC 향상이 적어서 두드러지는 것일지도...

  5. SD888결과 중....NEON에서 성능이 더 떨어지는 경우가 있다. devkit에는 공랭 FAN도 달아두었는데...;; 아마 AVX같이 클럭 유지가 안 되는 것 일지도... 

  6. 생각없이 짠 코드에서는 X1의 성능 향상이 두드러진다 (...)

  7. 생각보다 빅과 미들의 차는 20~30%정도, 디멘시티 9000이 X2@3.0Ghz+A710@2.8Ghz 조합인데 미들코어 클럭이 높아서 한동안 격차가 날 것 같음.

 

생각보다.... 테스트하기 힘들군요. 스크립트를 짜서 해도 adb 연결하는게 일입니다(...)

 

멀티코어 최적화를 해야하는데 리틀코어가 고심입니다. NEON까지 써야 겨우 1/3 성능이니.... 토이 케이스로 실험 좀 더 해보고 성능 안 나오면 리틀은 배제해도 되지 않을까 합니다..;

 

 

 

P.S 그렇다고 빅 코어 아키텍처를 옹호하기는 힘든것이... Fugaku같이 작정하고 매니코어 구성을 하지 않는 이상 ARM CPU로 ML을 ??!? ARM v9에 왕창 추가된 명령어셋도 그렇고. 정상적으로 IPC를 올리기 힘드니 눈 가리고 아웅거리는 꼴이네요(...)

 

 

 

 


0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 일반 커뮤니티 활동 secret 덕후냥이 752 2025.03.30
공지 🚨(뉴비필독) 전체공지 & 포인트안내 22 무명의덕질 29084 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 무명의덕질 23130 2025.01.21
1578 일반 ‘갤럭시S21’을 3만원에?…통신3사, 최대 61만원 불법 지원 - 조선비즈 덕후냥이 49 2023.03.27
1577 일반 ‘삼성폰 언박싱’ 유튜버의 한탄 “정말 열심히 만들었는데…” [IT선빵!] - 헤럴드경제 뉴... 덕후냥이 31 2023.03.27
1576 일반 ‘아이폰12 15만원→갤S21 17만원’ 구매 가격 낮아진다 [IT선빵!] - 헤럴드경제 뉴스 - ... 덕후냥이 41 2023.03.27
1575 일반 ‘초저렴한’ 갤럭시 나온다…‘갤럭시 A25 5G’ 출시 file 덕후냥이 382 2024.01.09
1574 일반 “5G는 갤럭시”… 美 다운로드 속도 측정서 아이폰 압도 - 머니S - Money S 덕후냥이 50 2023.03.27
1573 일반 “AI폰” 갤럭시S24, 울트라모델도 아이폰보다 NPU 10배 느려 file 덕후냥이 48 2024.08.25
1572 일반 “SSD도 고장 난다” 토발즈의 발견에 대한 검증 덕후냥이 367 2023.03.27
1571 일반 “갤럭시폴드2와 너무 똑같다?” 궁지에 몰린 화웨이 막 베낀다! 덕후냥이 1217 2023.03.27
1570 일반 “선진국 일본에 가까워진다” 한국도 애플페이 교통카드 가능 file 덕후냥이 45 2024.08.25
1569 일반 “설마했는데, 다 유출됐네” 난리난 삼성 제품 ‘이렇게’ 생겼다 file 덕후냥이 276 2023.05.29
1568 일반 “이건 못 베끼겠네” 삼성, 소니 마이크로올레드 주문한다 file 덕후냥이 40 2024.08.25
1567 일반 “이걸 257만원에 사? 순식간에 완판” 삼성도 긴장한 ‘접는폰’ 등장 file 덕후냥이 395 2023.05.29
1566 일반 (루머) 삼성, 스마트폰 AMOLED 번인 보증정책 변경 덕후냥이 1068 2023.03.27
1565 정보공유 (스마트폰 배터리 차이) 리튬-이온 배터리 VS 리튬-폴리머 배터리 file 덕후냥이 640 2023.12.20
1564 일반 [11번가] 긴급공수 & 타임딜 안내 덕후냥이 99 2023.03.27
1563 일반 [11번가]HGST DeskStar IDK CoolSpin 4TB(HMS5C4040ALE640) 3.5형 HDD 덕후냥이 180 2023.03.27
1562 일반 [11번가]디지털 페스티벌 삼성전자 F24T350 136,890 외 6모델 덕후냥이 51 2023.03.27
1561 일반 [50% 할인]워치페이스 할인합니다. file 덕후냥이 53 2023.11.24
1560 일반 [IT하는법] 원치않는 알림, 안보이게 설정하는 법 덕후냥이 1240 2023.03.27
1559 일반 [S24U] AXL3 소프트웨어 업데이트 있습니다 file 덕후냥이 382 2025.01.22
Board Pagination Prev 1 2 3 4 5 ... 79 Next
/ 79