본문 바로가기
조회 수 345 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

 

 

AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다

몇년뒤에는 정말 현실화 될것같다

 

4:45부터

 

↓https://www.youtube.com/watch?v=mni4_Ktwvhw

 

공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.

하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.

많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.

직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.

현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.

한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.

예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다. 

 

실제 구동 동영상은 아래 엑스에서 볼수 있다.

 

DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)

 

↓https://x.com/awnihannun/status/1881412271236346233

 

X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4

 


List of Articles
번호 분류 제목 날짜 조회 수
공지 사진📸 사랑LOVE 포인트 만렙! 도전 2025.03.19 4660
공지 안내 🚨(뉴비필독) 전체공지 & 포인트안내 2 2024.11.04 25848
공지 System URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 20431
47 잡담 이산수학 책이나 강의 추천해줘ㅠ 2024.08.11 101
46 잡담 풀스택 만드는 중인데 기능 하나 갖고 하루 끙끙거리는 듯 2024.08.11 79
45 잡담 임베디드sw 현직자 있어??? 제발 있어줘ㅠㅠ🥹 1 2024.08.11 74
44 잡담 모던자바스크립트 deep dive 2024.08.11 73
43 잡담 해외익 여긴 php 잘 쓰던데 이유가 뭘까 1 2024.08.11 59
42 잡담 프론트엔드 일 하는 익 있어?? 1 2024.08.11 75
41 잡담 익들아 대외활동 신청 포폴에서 뭐 빼야할까? 포폴 첨이라 2 file 2024.08.11 85
40 잡담 코틀린이랑 c++ 중에 뭘 깊게 공부해볼까.. 1 2024.08.11 82
39 잡담 맥os에서 opencv 원래 잘 안돌아가? 2024.08.11 61
38 잡담 전산직으로 취업한 사람 있어? 2024.08.11 87
37 잡담 컴공다니면서 느낀거 2024.08.11 81
36 잡담 인턴 면접보는데 내 바닥이 드러날까봐 무서워ㅠㅠ 2024.08.11 78
35 잡담 백엔드 질문…! 2024.08.11 80
34 잡담 개발자의 진짜 포지션은 소프트웨어 개발이 아님 2024.08.14 92
33 잡담 실수로 들어갈 수 없는 그 곳, 다크웹을 알아보자 file 2024.10.22 1755
32 잡담 간호직 공무원 혼자서 700일 동안 만든 프로그램 1 file 2024.12.08 64
31 잡담 AMD 노트북 쓰시는 분들 amd_pstate 활성화 방법이요. 2 file 2024.12.10 67
30 잡담 유료 사이트들의 비밀 file 2025.01.18 249
29 잡담 윈도우 프로그램들 [비정품 Adobe 앱이 곧 차단됩니다] 포토샵, 일러스트 인증창 해결하는 방법 file 2025.01.21 730
28 잡담 글 무단복사를 코드로 막을 수 있을까? 1 file 2025.01.22 333
27 잡담 이런 하찮은걸로 어떻게 봇인지 판단함? 2 file 2025.01.22 341
26 잡담 PHP 8.0이 기본으로 내장된 우분투 버전 2025.01.24 228
25 잡담 PHP 버전 7.4부터 8.3까지의 주요 개선사항, 속도 차이, 컴파일 차이 2025.01.24 245
24 잡담 우분투 엔진엑스 로그 안남기는 방 2025.01.24 242
23 잡담 우분투에서 불필요한 로그 사용하지 않는 방법 2025.01.24 235
22 잡담 서버를 구동하는데 굳이 ecc메모리를 써야할 이유없음 2025.01.24 232
21 잡담 스마트폰(핸드폰)으로 게임할때 광고없이 하는 방법 file 2025.01.24 350
20 잡담 Ivacy는 PureVPN으로 인수됨 이제는 LIFETIME 장기결제자 로그인 불가능함 2025.01.26 166
19 잡담 스피커에서 고주파소리가 나면 공유기와 멀티탭을 의심해보자 2025.01.26 183
18 잡담 KT, 조직적 해킹팀 꾸려 통신망 감청·악성코드 유포 Kt진짜 뻔뻔하다 3 file 2025.01.27 233
Board Pagination Prev 1 2 Next
/ 2