본문 바로가기
조회 수 345 추천 수 0 댓글 0

 

 

AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다

몇년뒤에는 정말 현실화 될것같다

 

4:45부터

 

↓https://www.youtube.com/watch?v=mni4_Ktwvhw

 

공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.

하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.

많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.

직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.

현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.

한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.

예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다. 

 

실제 구동 동영상은 아래 엑스에서 볼수 있다.

 

DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)

 

↓https://x.com/awnihannun/status/1881412271236346233

 

X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4

 


List of Articles
번호 분류 제목 조회 수 날짜
공지 🚨(뉴비필독) 전체공지 & 포인트안내 6 file 25953 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20458 2025.01.21
146 .Htaccess 301 리디렉션 규칙 474 2023.05.13
145 [Linux] ethtool 명령어를 이용한 NIC(Network Interface Controller) 정보 확인 방법 526 2023.08.31
144 [Ubuntu 20.04 server] 자동으로 디스플레이 끄기 536 2023.08.31
143 [리눅스] Rocky 8.9 sysctl 옵션 수정 관련 질문 1 71 2024.08.04
142 [리눅스] 리눅스 tar, gz 압축 및 해제 520 2023.08.31
141 [초보질문]root 계정인데 dir 또는 ls 명령어를 입력해도 폴더가 표시 되지 않습니다. 1 85 2024.08.04
140 [토렌트]7월 최신 트래커 - 매일 갱신되는 사이트 (2024년 7월) 935 2024.08.09
139 잡담 '2조원대 규모', 북한의 역대 최대 규모 암호화폐 해킹 사건을 파헤치다- BBC News 코리아 file 1244 2025.03.14
138 10가지 매우 유용한 Python 라이브러리 389 2024.02.08
137 10만 개가 넘는 챗GPT 계정 정보가 다크웹에서 판매됨 file 190 2023.06.24
136 잡담 14만 인플루언서가 알려주는 인스타 성장을 위한 AI툴 총정리! file 377 2025.03.24
135 2023년 Stack Overflow 개발자 보고서 file 207 2023.06.24
134 6가지 Devin 대안 살펴보기: 프로그래밍 작업 자동화 430 2024.04.14
133 AI 엔지니어링을 위한 상위 5개 JavaScript 도 file 330 2024.02.08
132 AI로 인해, 스택오버플로우 28% 정리해고 1 file 2443 2023.10.18
131 잡담 AMD 노트북 쓰시는 분들 amd_pstate 활성화 방법이요. 2 file 67 2024.12.10
130 AMD 인셉션 취약점 패치, 최대 54%의 성능 저하 file 545 2023.08.21
129 Apache Pulsar 2023년 검토 file 295 2024.02.08
128 Avalanche로 연속학습 해본 사람 있음? 1 386 2023.05.05
127 aws amazon linux 질문입니다. 1 75 2024.08.04
126 Best Practices for MySQL(mariadb) with SSD, NVME file 569 2023.08.31
125 Q/A C6509 부팅중 에러.. ㅠㅠ 1 244 2025.01.27
124 claudebot 클로드봇 수집 공격 1 204 2024.04.18
123 cpu clock(속도) 조절 Linux CPU Frequency 516 2023.09.02
122 Debian 12 Bookworm 릴리즈 file 249 2023.06.24
121 DNS 전파를 확인하는 7가지 사이트 116 2023.11.20
120 잡담 DNS서버 구축하시는분들 DNS 등록 어떻게 하셨나요? 1 188 2025.01.29
119 잡담 ECC Unbuffered Memory가 뭔지요? 4 190 2025.01.29
118 GID와 그룹권한 1 67 2024.08.04
117 GPT-4 Turbo가 다시 왕좌에 올랐고 ChatGPT가 무료로 업그레이드되었습니다! file 436 2024.04.14
Board Pagination Prev 1 2 3 4 5 Next
/ 5