본문 바로가기
조회 수 342 추천 수 0 댓글 0

 

 

AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다

몇년뒤에는 정말 현실화 될것같다

 

4:45부터

 

↓https://www.youtube.com/watch?v=mni4_Ktwvhw

 

공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.

하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.

많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.

직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.

현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.

한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.

예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다. 

 

실제 구동 동영상은 아래 엑스에서 볼수 있다.

 

DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)

 

↓https://x.com/awnihannun/status/1881412271236346233

 

X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4

 


List of Articles
번호 분류 제목 조회 수 날짜
공지 🚨(뉴비필독) 전체공지 & 포인트안내 1 25750 2024.11.04
공지 클릭만 해도 포인트 만렙! 도전 4436 2025.03.19
공지 URL만 붙여넣으면 끝! 임베드 기능 20342 2025.01.21
145 하드웨어/네트워크 라이믹스 Rhymix 폴더 권한 소유권/퍼미 설정 스크립트 (단일 사이트용) 500 2025.05.03
144 잡담 애플 인텔리전스 한국에서도 일부 사용할 수 있네요 사용 가능 기기 참고요 file 893 2025.04.04
143 하드웨어/네트워크 서버에서 CPU의 L2, L3 캐시가 미치는 영향 765 2025.04.01
142 잡담 14만 인플루언서가 알려주는 인스타 성장을 위한 AI툴 총정리! file 369 2025.03.24
141 잡담 사전검증없는 비영리도메인 or.kr을 이용해서 돈버는 방법 (네이버 상위노출) file 690 2025.03.22
140 잡담 오픈ai에서는 유료인데 구글에서는 공짜로 풀었대 file 753 2025.03.19
139 잡담 유튜브 댓글 자동으로 삭제하는 방법 (크롬 브라우저 콘솔) file 840 2025.03.18
138 잡담 '2조원대 규모', 북한의 역대 최대 규모 암호화폐 해킹 사건을 파헤치다- BBC News 코리아 file 1239 2025.03.14
137 잡담 내 PC에서 로컬로 딥시크 (deep seek) 구동하기 345 2025.01.31
136 잡담 대황쿡: 애플 인텔리전스 한국어 4월 지원 file 345 2025.01.31
» 잡담 딥시크 검열없이 개인PC 자체 컴퓨터로 사용하는방법 file 342 2025.01.31
134 잡담 납땜과 리볼링까지 이거 보면 다 따라할 수 있어요. file 349 2025.01.30
133 잡담 ECC Unbuffered Memory가 뭔지요? 4 187 2025.01.29
132 잡담 메인보드 전원스위치를 넣어도 반응이 없는 이유... 3 183 2025.01.29
131 잡담 DNS서버 구축하시는분들 DNS 등록 어떻게 하셨나요? 1 183 2025.01.29
130 잡담 웹서버의 동시접속 수는 어떻게 산정해야하나요? 2 195 2025.01.29
129 잡담 사고를 냈는데 자동차 사이드 미러 가격이 얼마 정도 하나요? 2 201 2025.01.29
128 잡담 접지가 되어 있는 콘센트와 접지가 되어 있지 않는 콘센트 구분하는 방법 file 200 2025.01.28
127 하드웨어/네트워크 포트 스캐너(port scanner) 차단 (PSD) file 232 2025.01.27
126 하드웨어/네트워크 간단한 랜더팜/스토리지 구성 1 file 235 2025.01.27
125 가상화/딥러닝 vSphere Network 1 - vSphere에 Mikrotik RouterOS 설치 226 2025.01.27
124 하드웨어/네트워크 Mikrotik Winbox 맥OS 에서 편리하게 사용하기 file 225 2025.01.27
123 하드웨어/네트워크 미크로틱장비 L4스위치로 사용 1 218 2025.01.27
122 Q/A 포트스캔 차단방법? 214 2025.01.27
121 팁/유용/추천 링크시스 EA6900 공유기에 아수스 AC68U 펌웨어 올리기 233 2025.01.27
120 Q/A NAS 기가랜 여러개로 속도증가 성공입니다. file 230 2025.01.27
119 Q/A 리눅스 서버간 렌카드 직접 연결 문의? 1 242 2025.01.27
118 Q/A iptables로 80포트를 특정 도메인만 허용하고 싶습니다. 1 235 2025.01.27
117 Q/A C6509 부팅중 에러.. ㅠㅠ 1 239 2025.01.27
116 잡담 KT, 조직적 해킹팀 꾸려 통신망 감청·악성코드 유포 Kt진짜 뻔뻔하다 3 file 232 2025.01.27
Board Pagination Prev 1 2 3 4 5 Next
/ 5