단축키
Prev이전 문서
Next다음 문서
단축키
Prev이전 문서
Next다음 문서
AI봇의 습격과 의적 홍딥식이라는애플코딩님의 이야기를 듣고 찾아봤다
몇년뒤에는 정말 현실화 될것같다
4:45부터
↓https://www.youtube.com/watch?v=mni4_Ktwvhw
공식 홈페이지에서 DeepSeek 모델을 사용하면 각종 주제에 대한 검열이 있을 수 있다.
하지만 R1을 비롯한 DeepSeek의 LLM 모델들은 전부 오픈 소스로 자유롭게 개방되어 있으므로 누구나 직접 LLM 모델을 자신의 기기에 내려받아서 구동시킬 수 있다. 이 경우 인터넷 연결 없이도 LLM 모델을 사용할 수 있으므로 앞서 언급한 다양한 문제를 상당 부분 해결할 수 있으나, 동시에 검색 기능을 지원하지 않아 직접 구현해야 한다는 단점도 존재한다.
많은 화제를 끈 R1 원본 모델의 경우 약 500GB 수준에 이르는 메모리 용량을 요구하지만 추론 패턴 전이 및 양자화(비트넷)를 비롯한 다양한 경량화 기법들이 적용된 가벼운 모델들도 폭넓게 제공되고 있다.
직접 로컬 환경에서 DeepSeek 모델을 사용해보고 싶다면, GGUF 형태로 변환된 모델을 내려받아 이를 구동할 수 있는 프로그램이나 애플리케이션을 통해 사용하면 된다.
현재 Windows, MacOS, Linux 환경에서는 Ollama가, 그리고 iOS 환경에서는 PocketPal, Private LLM 등의 애플리케이션이 R1 기반 모델을 지원하고 있으며, 8GB 수준의 메모리 용량을 갖춘 기기라면 Llama-8B 내지는 Qwen-7B에 기반한 모델이 권장된다.
한편, R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하고 싶다면 Apple Silicon이 탑재된 Mac을 클러스터링하는 방법이 있다. Apple Silicon의 통합 메모리 용량은 옵션에 따라 정해져 있으며 사용자가 직접 용량 업그레이드를 할 수 없다는 점에서 고객들로부터 원성을 사기도 했지만, 메모리 대역폭이 엄청나게 늘어나면서 LLM을 빠르게 구동시킬 수 있다.
예시로 NVIDIA H200 SXM 141GB[11]의 경우 1개당 약 4900만원에 이르는 반면, 2023년형 Mac Studio 192GB[12]는 1대에 839만원에 불과하니 가성비(!)가 엄청난 것이다. # 예를 들어 3비트 양자화된 모델을 구동하려면 H200 구성으로는 단순계산만으로 3대(1억 4700만원 상당)가 필요하지만, Mac Studio를 쓴다면 2대(1680만 원 상당)만으로 해결할 수 있다.
실제 구동 동영상은 아래 엑스에서 볼수 있다.
DeepSeek R1 671B running on 2 M2 Ultras faster than reading speed. Getting close to open-source O1, at home, on consumer hardware. With mlx.distributed and mlx-lm, 3-bit quantization (~4 bpw)
↓https://x.com/awnihannun/status/1881412271236346233
↓X에서 Awni Hannun 님 DeepSeek R1 671B running on 2 M2 Ultras fa.mp4
번호 | 분류 | 제목 | 날짜 | 조회 수 |
---|---|---|---|---|
공지 | 사진📸 | 사랑LOVE 포인트 만렙! 도전 | 2025.03.19 | 4663 |
공지 | 안내 | 🚨(뉴비필독) 전체공지 & 포인트안내 2 | 2024.11.04 | 25850 |
공지 | System | URL만 붙여넣으면 끝! 임베드 기능 | 2025.01.21 | 20432 |
376047 | 일반 | Synology의 4 베이 NAS 장비 "DiskStation DS416j" | 2016.02.08 | 1458 |
376046 | 일반 | 태블릿 PC의 충전을하면서 주변 기기를 사용할 수있는 OTG 지원 USB 허브 | 2016.02.08 | 1435 |
376045 | 일반 | 카페베네 상장 난항에 투자자 눈물 | 2016.02.15 | 778 |
376044 | 일반 | 주식, 욕심은 화를 부르고. 그 화는 고스란히 가족들에게 짜증을 부릴겁니다 | 2016.02.22 | 790 |
376043 | 일반 | 원익IPS 추천합니다 | 2016.02.22 | 677 |
376042 | 일반 | 장이 너무 안좋네요 ㅜㅜ | 2016.02.22 | 708 |
376041 | 일반 | 주식투자와 관련된 주식명언 | 2016.02.22 | 1000 |
376040 | 일반 | i5-6600 i5-6500 비교 1 | 2016.02.22 | 1436 |
376039 | 일반 | ssd좀봐주세요 2 | 2016.02.27 | 907 |
376038 | 일반 | 크라운제과 어떻게 보시나요? | 2016.02.28 | 458 |
376037 | 일반 | 흑자예상하며 기다린보람이 있군 | 2016.02.28 | 471 |
376036 | 일반 | 세계 주식 주요 지수 보는곳 입니다.모르시는분들을 위해 | 2016.02.28 | 646 |
376035 | 일반 | 한 2월 말쯤 총선테마가 시작될걸로 예상합니다. | 2016.02.28 | 562 |
376034 | 일반 | 대중관계 악화로 중국에서 돈버는 기업들 급락이네요 | 2016.02.28 | 684 |
376033 | 일반 | 주식 생초보인데 알려주실수 있으신가요? | 2016.02.28 | 515 |
376032 | 일반 | 11시정도만 잘 넘기면 될거같은데.. | 2016.02.28 | 478 |
376031 | 일반 | 요즘 한종목에 꽂혀서 분할매수하는데요. | 2016.02.28 | 565 |
376030 | 잡담 | 국정원에서 해킹 프로그램을 구매한 내용들 (영상) | 2016.03.01 | 807 |
376029 | 일반 | 본인 명의로 핸드폰 두개 개설 하면 문제 생기나요? 1 | 2016.03.01 | 1154 |
376028 | 잡담 | 샤오미5 Xiaomi5 | 2016.03.02 | 815 |
376027 | 일반 | 단말기대금 일시불납 가능한가요? 1 | 2016.03.05 | 781 |
376026 | 일반 | 노트4 배터리 공유?? 1 | 2016.03.05 | 1749 |
376025 | 일반 | 금호타이어 어떻게 보시나요? | 2016.03.05 | 650 |
376024 | 일반 | 해외에서 사용하던 도메인을 구입했는데 헉.. | 2016.03.09 | 568 |
376023 | 일반 | 축구 페널티킥 선방 탑10 | 2016.03.12 | 469 |
376022 | 일반 | SSD의 성능을 유지하기위한 유지 관리 기술 | 2016.03.15 | 1068 |
376021 | 일반 | 저렴한 Skylake 버전 Xeon 마더보드 'GA-X150M-PRO ECC」 | 2016.03.15 | 874 |
376020 | [인케이스백팩]나는 인케이스 백팩이 탐난다. | 2011.04.02 | 602 | |
376019 | 잡담 | 이쁜 얼굴 만드는 미용 비법 53가지 - 얼굴 예뻐지는 법 - [피부 관리] 3 | 2011.04.23 | 609 |
376018 | 유이-애프터스쿨 유이 사진모음-[유이 애프터스쿨] | 2011.04.29 | 504 |