본문 바로가기

컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

조회 수 62 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

Extra Form

AWS가 기업 고객을 위한 새로운 Bedrock 기능을 공개했습니다.
re:Invent 2024에서 발표된 이번 업데이트는 AI 모델의 환각 현상 감지와 작은 규모의 모델 구축 효율성 향상에 초점을 맞추었습니다.
 

이번에 프리뷰로 공개된 기능은 Amazon Bedrock 모델 디스틸레이션과 자동 추론 검사입니다. 

모델 디스틸레이션은 대형 AI 모델의 지식을 작은 모델로 전달하는 기술입니다. 

Llama 3.1 405B와 같은 대형 모델은 풍부한 지식을 보유하고 있으나 속도가 느리고 운영이 어렵다는 단점이 있습니다. 

반면 작은 모델은 빠른 응답이 가능하지만 제한된 지식을 가지고 있어 활용에 한계가 있었습니다. 

 

AWS는  Bedrock Model Distillation을 사용하면 응답 시간을 희생하지 않고도 더 큰 모델의 지식을 더 작은 모델로 전송하는 프로세스가 가능해질 것이라고 밝혔습니다. 

사용자들은 원하는 대형 모델을 선택하고 같은 계열 내의 작은 모델을 찾아 샘플 프롬프트를 작성할 수 있습니다. 

Bedrock은 이를 바탕으로 응답을 생성하고 작은 모델을 미세 조정하며, 지속적으로 샘플 데이터를 생성하여 대형 모델의 지식을 전달합니다. 

현재 모델 디스틸레이션은 Anthropic, Amazon, Meta 모델들에서 작동하며, Bedrock 모델 디스틸레이션은 현재 프리뷰 상태입니다.

 

대부분 모델 제공업체인 많은 조직들이 더 작은 모델을 학습시키기 위해 모델 디스틸레이션을 사용합니다. 

하지만 AWS는 이 과정이 보통 많은 머신 러닝 전문 지식과 수동 미세 조정을 필요로 한다고 말했습니다.

 Meta와 같은 모델 제공업체들은 더 작은 모델에 더 넓은 지식 기반을 가져오기 위해 모델 디스틸레이션을 사용해왔습니다. 

Nvidia는 디스틸레이션과 가지치기 기술을 활용하여 Llama 3.1-Minitron 4B를 만들었는데, 이는 비슷한 크기의 모델들보다 더 나은 성능을 보인다고 합니다.


환각 현상 문제 해결을 위해 AWS는 Bedrock의 자동 추론 검사 기능도 함께 공개했습니다. 

이는 Bedrock의 자동 추론 검사로 수학적 검증을 통해 응답의 정확성을 보장하는 기능입니다.
AWS는 "자동 추론 검사는 논리적으로 정확하고 검증 가능한 추론을 사용하여 환각으로 인한 사실 오류를 방지하는 최초이자 유일한 생성 AI 보호 장치입니다."라고 말했습니다.
 

이 기능은 Amazon Bedrock Guardrails를 통해 제공되며, 사용자들은 데이터를 업로드하면 Bedrock이 모델이 따라야 할 규칙을 개발하고 응답을 검증합니다. 

부정확한 응답이 발견될 경우 새로운 답변을 제안하는 시스템도 갖추고 있습니다.

 

AWS의 CEO Matt Garman은 이러한 자동 검사 시스템이 기업의 데이터를 차별화 요소로 유지하면서 AI 모델이 이를 정확하게 반영할 수 있게 해준다고 강조했습니다.


컴퓨터/노트북/인터넷

IT 컴퓨터 기기를 좋아하는 사람들의 모임방

List of Articles
번호 분류 제목 조회 수 날짜
공지 뉴스 구글 최신 뉴스 file 1388 2024.12.12
HOT글 일반 아 진짜 요새 SKT 해킹 뭐시기 때문에 신경 쓰여 죽겠어 ㅠㅠ 2 237 2025.05.20
공지 🚨(뉴비필독) 전체공지 & 포인트안내 3 file 25862 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20435 2025.01.21
1499 정보 마이크론 2023회계연도 2분기 실적 발표 file 1825 2023.03.30
1498 정보 사파이어 래피드의 AMX를 사용해 스테이블 디퓨전 성능을 10배 향상 file 1576 2023.03.30
1497 정보 AMD/인텔 메인보드 가격이 최근 2년 반 사이에 35~40% 증가 1549 2023.03.30
1496 정보 바이든 미국 대통령, PCB 생산을 위해 국방물자생산법을 발동 1708 2023.03.30
1495 정보 인텔 데이터센터 / AI 인베스터 웨비나. 차세대 제온의 계획 file 1819 2023.03.30
1494 정보 Puget Systems의 2022년 하드웨어 동향 file 1624 2023.03.30
1493 정보 MSI A620 메인보드가 유럽에 87유로로 등록 file 1523 2023.03.30
1492 정보 지포스 RTX 4060 Ti/4060 출시일 1372 2023.03.30
1491 정보 TCL CSOT 초슬림 베젤 디스플레이 양산 중 file 1432 2023.03.30
1490 정보 화웨이 토크밴드 B7, 스마트밴드+이어셋 file 2224 2023.03.30
1489 정보 레노버, LOQ이라는 게이밍 브랜드를 도입 file 1915 2023.03.30
1488 정보 지포스 RTX 4060 Ti의 박스 탬플릿 유출 file 1819 2023.03.30
1487 정보 필립스, 44.5인치 듀얼 QHD 커브드 디스플레이 file 1818 2023.03.30
1486 정보 DRAM 평균 판매 가격이 올해 2분기에 10~15% 하락 file 1645 2023.03.30
1485 정보 NVIDIA, AI를 써서 최대 30배 빠르게 칩 설계를 최적화하는 AutoDMP file 1996 2023.03.30
1484 정보 트위터, 개발자용 API의 세로운 요금 체계 발표 file 1723 2023.03.31
1483 정보 머스크 등 전문가 1000명 'AI 개발 잠정 중단' 촉구 1683 2023.03.31
1482 정보 AMD 라이젠9-5세대 7950X 라파엘 스파이더 차트를 확인해보세요! file 1803 2023.04.02
1481 정보 AMD APU가 특별한 이유!! (세잔, 르누아르, 피카소, 레이븐릿지) file 1653 2023.04.02
1480 정보 ASUS, ROG Hero, ROG Strix 및 TUF Gaming의 새로운 X670E 메인보드 3종 발표 file 2165 2023.04.02
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 75 Next
/ 75