본문 바로가기
조회 수 347 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

 

 

AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다

몇년뒤에는 정말 현실화 될것같다

 

4:45부터

 

↓https://www.youtube.com/watch?v=mni4_Ktwvhw

 

공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.

하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.

많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.

직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.

현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.

한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.

예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다. 

 

실제 구동 동영상은 아래 엑스에서 볼수 있다.

 

DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)

 

↓https://x.com/awnihannun/status/1881412271236346233

 

X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4

 


List of Articles
번호 분류 제목 날짜 조회 수
공지 유머 🚨(뉴비필독) 전체공지 & 포인트안내 10 2024.11.04 26506
공지 이슈 URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 20898
379946 미국 콘도나 타운하우스 사는 덕들 있나? 2 new 2025.06.20 114
379945 미국 덕들 영어 액센트 어때? 2 new 2025.06.20 109
379944 미국 한국에서 짜파게티 어떻게 해먹니? 2 new 2025.06.20 98
379943 미국 20년 동안 캘리에서만 살아서 그냥 캘리 촌사람 됨 2 new 2025.06.20 96
379942 미국 집에서 밥 뭘로 해먹어? 2 new 2025.06.20 101
379941 미국 중학교 때 미국 와서 지금까지 10년 넘게 살았는데 1 new 2025.06.20 103
379940 일본 일덕들아 집에서 뭐하고 지내? 3 new 2025.06.20 110
379939 미국 한국가면 뭐 먹고싶어? new 2025.06.20 95
379938 일본 일본에서 조별과제하면 진심 복장터짐 시발ㅋㅋㅋ 2 new 2025.06.20 87
379937 일본 내 한국 리턴을 망설이게 되는이유가 2 new 2025.06.20 98
379936 일본 일본어 진짜 네이티브급으로 잘하면 징그럽다 이런 소리 들음 1 new 2025.06.20 95
379935 중국 광저우에서 한국 여행객들끼리 막 “이거 뭐야?” “아닌가?” 하고 궁금해하면 1 new 2025.06.20 94
379934 일본 교무슈퍼 진짜 좋지 않냐 1 new 2025.06.20 108
379933 미국 혐오 범죄, 침묵은 공범이다 뉴욕·뉴저지 신고 절차와 실질 대응 가이드 newfile 2025.06.20 100
379932 잡담 애들아 생리안하기vs기온 맘대로 조절하기 3 new 2025.06.20 152
379931 이슈 [속보] 160억개 비밀번호 유출 - 애플 구글 페이스북 외 다수 2 newfile 2025.06.20 142
379930 잡담 이효리 시험관은 안 한댔다가 욕 먹는중 2 newfile 2025.06.20 140
379929 유머 [속보] 전국민 소비쿠폰 지급…최대 50만원, 지역화폐 확대·채무조정도 병행2 2 newfile 2025.06.20 136
379928 잡담 더보이즈 소속사 측 "주학년의 일방적 허위 주장에 깊은 유감" [전문 3 newfile 2025.06.20 139
379927 유머 [단독] 토스도 뚫렸다...토스뱅크 직원 20억 횡령 후 자살 2 newfile 2025.06.20 146
379926 민생회복 소비쿠폰 지원 방안(일반국민 25만원 그거ㅇㅇ) 3 newfile 2025.06.20 144
379925 잡담 주학년 타임라인 정리 newfile 2025.06.20 143
379924 잡담 주학년 타임라인 정리 newfile 2025.06.20 151
379923 잡담 주학년 타임라인 정리 newfile 2025.06.20 126
379922 잡담 주학년 타임라인 정리 2 newfile 2025.06.20 141
379921 잡담 라이즈 은석 넴드 무슨일임? new 2025.06.20 148
379920 잡담 1억 부었는데도 있지 뮤뱅 1위 후보 아니네.... new 2025.06.20 165
379919 일반 폰세야 이스야 걍 너네 메이져 갈래? new 2025.06.20 141
379918 한화 엘지 선수가 우산을 폈는데.. .. .. Hanwha newfile 2025.06.20 145
379917 한화 밀니폼 실물이 생각보다 예쁘네? new 2025.06.20 153
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 12665 Next
/ 12665