본문 바로가기
조회 수 71 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

Extra Form

AWS가 기업 고객을 위한 새로운 Bedrock 기능을 공개했습니다.
re:Invent 2024에서 발표된 이번 업데이트는 AI 모델의 환각 현상 감지와 작은 규모의 모델 구축 효율성 향상에 초점을 맞추었습니다.
 

이번에 프리뷰로 공개된 기능은 Amazon Bedrock 모델 디스틸레이션과 자동 추론 검사입니다. 

모델 디스틸레이션은 대형 AI 모델의 지식을 작은 모델로 전달하는 기술입니다. 

Llama 3.1 405B와 같은 대형 모델은 풍부한 지식을 보유하고 있으나 속도가 느리고 운영이 어렵다는 단점이 있습니다. 

반면 작은 모델은 빠른 응답이 가능하지만 제한된 지식을 가지고 있어 활용에 한계가 있었습니다. 

 

AWS는  Bedrock Model Distillation을 사용하면 응답 시간을 희생하지 않고도 더 큰 모델의 지식을 더 작은 모델로 전송하는 프로세스가 가능해질 것이라고 밝혔습니다. 

사용자들은 원하는 대형 모델을 선택하고 같은 계열 내의 작은 모델을 찾아 샘플 프롬프트를 작성할 수 있습니다. 

Bedrock은 이를 바탕으로 응답을 생성하고 작은 모델을 미세 조정하며, 지속적으로 샘플 데이터를 생성하여 대형 모델의 지식을 전달합니다. 

현재 모델 디스틸레이션은 Anthropic, Amazon, Meta 모델들에서 작동하며, Bedrock 모델 디스틸레이션은 현재 프리뷰 상태입니다.

 

대부분 모델 제공업체인 많은 조직들이 더 작은 모델을 학습시키기 위해 모델 디스틸레이션을 사용합니다. 

하지만 AWS는 이 과정이 보통 많은 머신 러닝 전문 지식과 수동 미세 조정을 필요로 한다고 말했습니다.

 Meta와 같은 모델 제공업체들은 더 작은 모델에 더 넓은 지식 기반을 가져오기 위해 모델 디스틸레이션을 사용해왔습니다. 

Nvidia는 디스틸레이션과 가지치기 기술을 활용하여 Llama 3.1-Minitron 4B를 만들었는데, 이는 비슷한 크기의 모델들보다 더 나은 성능을 보인다고 합니다.


환각 현상 문제 해결을 위해 AWS는 Bedrock의 자동 추론 검사 기능도 함께 공개했습니다. 

이는 Bedrock의 자동 추론 검사로 수학적 검증을 통해 응답의 정확성을 보장하는 기능입니다.
AWS는 "자동 추론 검사는 논리적으로 정확하고 검증 가능한 추론을 사용하여 환각으로 인한 사실 오류를 방지하는 최초이자 유일한 생성 AI 보호 장치입니다."라고 말했습니다.
 

이 기능은 Amazon Bedrock Guardrails를 통해 제공되며, 사용자들은 데이터를 업로드하면 Bedrock이 모델이 따라야 할 규칙을 개발하고 응답을 검증합니다. 

부정확한 응답이 발견될 경우 새로운 답변을 제안하는 시스템도 갖추고 있습니다.

 

AWS의 CEO Matt Garman은 이러한 자동 검사 시스템이 기업의 데이터를 차별화 요소로 유지하면서 AI 모델이 이를 정확하게 반영할 수 있게 해준다고 강조했습니다.


List of Articles
번호 분류 제목 날짜 조회 수
공지 안내 🚨(뉴비필독) 전체공지 & 포인트안내 8 file 2024.11.04 25987
공지 System URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 20464
1499 정보 마이크론 2023회계연도 2분기 실적 발표 file 2023.03.30 1827
1498 정보 사파이어 래피드의 AMX를 사용해 스테이블 디퓨전 성능을 10배 향상 file 2023.03.30 1578
1497 정보 AMD/인텔 메인보드 가격이 최근 2년 반 사이에 35~40% 증가 2023.03.30 1551
1496 정보 바이든 미국 대통령, PCB 생산을 위해 국방물자생산법을 발동 2023.03.30 1710
1495 정보 인텔 데이터센터 / AI 인베스터 웨비나. 차세대 제온의 계획 file 2023.03.30 1820
1494 정보 Puget Systems의 2022년 하드웨어 동향 file 2023.03.30 1624
1493 정보 MSI A620 메인보드가 유럽에 87유로로 등록 file 2023.03.30 1523
1492 정보 지포스 RTX 4060 Ti/4060 출시일 2023.03.30 1372
1491 정보 TCL CSOT 초슬림 베젤 디스플레이 양산 중 file 2023.03.30 1432
1490 정보 화웨이 토크밴드 B7, 스마트밴드+이어셋 file 2023.03.30 2224
1489 정보 레노버, LOQ이라는 게이밍 브랜드를 도입 file 2023.03.30 1915
1488 정보 지포스 RTX 4060 Ti의 박스 탬플릿 유출 file 2023.03.30 1819
1487 정보 필립스, 44.5인치 듀얼 QHD 커브드 디스플레이 file 2023.03.30 1818
1486 정보 DRAM 평균 판매 가격이 올해 2분기에 10~15% 하락 file 2023.03.30 1645
1485 정보 NVIDIA, AI를 써서 최대 30배 빠르게 칩 설계를 최적화하는 AutoDMP file 2023.03.30 1996
1484 정보 트위터, 개발자용 API의 세로운 요금 체계 발표 file 2023.03.31 1723
1483 정보 머스크 등 전문가 1000명 'AI 개발 잠정 중단' 촉구 2023.03.31 1684
1482 정보 AMD 라이젠9-5세대 7950X 라파엘 스파이더 차트를 확인해보세요! file 2023.04.02 1804
1481 정보 AMD APU가 특별한 이유!! (세잔, 르누아르, 피카소, 레이븐릿지) file 2023.04.02 1653
1480 정보 ASUS, ROG Hero, ROG Strix 및 TUF Gaming의 새로운 X670E 메인보드 3종 발표 file 2023.04.02 2165
1479 정보 AMD Ryzen™ 9 7950X 및 Ryzen 7 7700X Zen 4 CPU 벤치마크 유출 [루머] file 2023.04.02 1670
1478 정보 [루머] AMD Ryzen™ Zen4 3D는 게임에서 일반 Zen 4보다 최대 30% 더 빠를 수 있 file 2023.04.02 1831
1477 정보 ASUS, AMD AM5 플랫폼을 위한 최초의 X670E Micro-ATX 및 Mini-ITX 메인보드 출시 file 2023.04.02 2196
1476 정보 AMD Together We Advance_PC(라이젠 7000 CPU 컨퍼런스 댓글 생중계) file 2023.04.02 1676
1475 정보 AMD Together We Advance_PC(라이젠 7000 CPU 컨퍼런스) 댓글 생중계 전체정리본 file 2023.04.02 1723
1474 정보 라이젠™ 7000 출시가 다가오면서, 라이젠™ 5000 CPU 가격이 떨어지고 있습니다 file 2023.04.02 1700
1473 정보 AMD CPB가 비활성화된 Ryzen™ 5 7600X 시네벤치 R23 테스트 file 2023.04.02 1814
1472 정보 AMD Ryzen™ 7 7700X CPU-Z 및 긱벤치 벤치마크 유출 file 2023.04.02 1654
1471 정보 AMD Ryzen™ 9 7900X 12코어 CPU 벤치마크 유출, Intel의 Core i9-12900K보다 빠름 file 2023.04.02 1781
1470 정보 AMD, 10월 4일에 B650/B650E 메인보드를 선보일 예정 file 2023.04.02 1825
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 50 Next
/ 50