개발자 커뮤니티

쓰기

[잡담]

🕰️ 2025.01.31 13:08

딥시크 검열없이 개인PC 자체 컴퓨터로 사용하는방법

덕후냥이

조회 수 348 추천 수 0 댓글 0

AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다

몇년뒤에는 정말 현실화 될것같다

4:45부터

↓https://www.youtube.com/watch?v=mni4_Ktwvhw

공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.

하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.

많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.

직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.

현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.

한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.

예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다.

실제 구동 동영상은 아래 엑스에서 볼수 있다.

DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)

↓https://x.com/awnihannun/status/1881412271236346233

↓X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4

🗨️ 댓글 달기...

✔ 에디터 모드 ✔ 텍스트 모드

지금 익명게시판에 로그인해서 자유롭게 자신의 의견을 남기고, 다른 사람들과 기분 좋게 소통해봐요!
Log in to the anonymous board now and share your thoughts freely, while enjoying positive interactions with others!

개발자 커뮤니티

쓰기

List of Articles
번호	분류	제목	조회 수	날짜
HOT글	팁/유용/추천	블로그의 도메인 권한(DA) 향상을 위한 SEO 최적화 콘텐츠 전략	95	2025.06.27
HOT글	잡담	토렌트 다운로드 멈추거나 느릴 때 쓸만한 트래커 목록 공유 부탁드려요 3	360	2025.06.26
공지		🚨(뉴비필독) 전체공지 & 포인트안내 13	27476	2024.11.04
공지		URL만 붙여넣으면 끝! 임베드 기능	21717	2025.01.21
157		특정 문자 삭제 프로그램 (일본어,중국어,한국어,영어가 섞여있을때 편리함)	1606	2023.04.27
156		Avalanche로 연속학습 해본 사람 있음? 1	386	2023.05.05
155		.Htaccess 301 리디렉션 규칙	474	2023.05.13
154		레노버 CMOS setup 진입방법	536	2023.05.13
153		공유기 QoS로 각각의 PC 인터넷 속도 제한하기	514	2023.06.03
152		svn만 쓰다가 github 쓸려니 너무 어려웡 2	422	2023.06.06
151		2023년 Stack Overflow 개발자 보고서	208	2023.06.24
150		10만 개가 넘는 챗GPT 계정 정보가 다크웹에서 판매됨	190	2023.06.24
149		레드햇, RHEL 소스를 CentOS Stream에만 제공	202	2023.06.24
148		구글 도메인이 서비스 종료 예정입니다.	199	2023.06.24
147		Debian 12 Bookworm 릴리즈	249	2023.06.24
146		Ubuntu Pro는 이제 누구나 사용할 수 있습니다.	577	2023.08.02
145		AMD 인셉션 취약점 패치, 최대 54%의 성능 저하	545	2023.08.21
144		히토미 https://misskey.io/ 특정 유저 주소는 다운 안되는 문제	734	2023.08.26
143		노트북 모니터 시간지나면 ubuntu 화면 자동으로 꺼지기	375	2023.08.30
142		[Linux] ethtool 명령어를 이용한 NIC(Network Interface Controller) 정보 확인 방법	536	2023.08.31
141		제조사 맥 주소 확인 방법(How to check MAC address by manufacturer)	513	2023.08.31
140		메인보드 전원,리셋,LED,스피커 선 연결하는방법	835	2023.08.31
139		윈도우 파일 폴더 용량 관리 Tree size	551	2023.08.31
138		[리눅스] 리눅스 tar, gz 압축 및 해제	522	2023.08.31
137		[Ubuntu 20.04 server] 자동으로 디스플레이 끄기	537	2023.08.31
136		SQLSTATE[HY000] '***' doesn't have a default value 에러 고치기	549	2023.08.31
135		Best Practices for MySQL(mariadb) with SSD, NVME	569	2023.08.31
134		cpu clock(속도) 조절 Linux CPU Frequency	519	2023.09.02
133		취업하려는 공부는 적당히하자	700	2023.10.11
132		스프링이 취업안될정도면 학벌이 ㅈ구린가봄	696	2023.10.11
131		AI로 인해, 스택오버플로우 28% 정리해고 1	2444	2023.10.18
130		Ubuntu 23.10, 악의적인 사용자 번역으로 ISO 재배포	2485	2023.10.18
129		대기 시간을 줄이기 위해 TCP를 통한 TLS 최적화	1410	2023.10.27
128		서버 PHP용 다중 코어를 사용하는 방법 2	287	2023.11.06

쓰기