본문 바로가기

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

 

Abstract

The Segment Anything Model 2 (SAM 2) has demonstrated strong performance in object segmentation tasks but faces challenges in visual object tracking, particularly when managing crowded scenes with fast-moving or self-occluding objects. Furthermore, the fixed-window memory approach in the original model does not consider the quality of memories selected to condition the image features for the next frame, leading to error propagation in videos. This paper introduces SAMURAI, an enhanced adaptation of SAM 2 specifically designed for visual object tracking. By incorporating temporal motion cues with the proposed motion-aware memory selection mechanism, SAMURAI effectively predicts object motion and refines mask selection, achieving robust, accurate tracking without the need for retraining or fine-tuning. SAMURAI operates in real-time and demonstrates strong zero-shot performance across diverse benchmark datasets, showcasing its ability to generalize without fine-tuning. In evaluations, SAMURAI achieves significant improvements in success rate and precision over existing trackers, with a 7.1% AUC gain on LaSOT-ext and a 3.5% AO gain on GOT-10k. Moreover, it achieves competitive results compared to fully supervised methods on LaSOT, underscoring its robustness in complex tracking scenarios and its potential for real-world applications in dynamic environments.

Embodied agent interface overview.
Figure 1: The overview of our SAMURAI visual object tracker.

Results

Embodied agent interface overview.
Table 1: Zero-shot tracking results on LaSOT, LaSOT-ext, and GOT-10k.
 
Embodied agent interface overview.
Table 2: Zero-shot tracking results on additional benchmarks: TrackingNet, NFS, and OTB-100.
 
Embodied agent interface overview.
Table 3: Comparison between proposed SAMURAI and the baseline SAM 2 on LaSOT and LaSOT-ext.

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

List of Articles
번호 분류 제목 조회 수 날짜
공지 일반 프롬프트 쉽게 검색하는 방법 file 116 2024.12.13
공지 이미지 사진 분석 A·I 모델 사용방법 file 154 2024.10.21
공지 인공지능 기본 A·I 모델 사용방법 file 177 2024.10.21
공지 일반 AI 인공지능 논문 사이트 모음 file 770 2024.04.08
HOT글 일반 gpt vs 제미나이, 구글이 아무리 잘만들어도 선택은 gpt 2 file 584 2025.05.09
공지 사랑LOVE 포인트 만렙! 도전 4623 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25844 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20427 2025.01.21
195 일반 "4년 뒤 인류 멸종 위협" 경고…'사이코패스 AI'도 재조명 / SBS / 뉴블더 file 869 2024.03.14
194 그림/사진 "AI로 생사람 잡혔다"… 기술 오류로 절도범 누명 쓴 美 남성 file 1763 2023.04.03
193 일반 "IBM, 인텔도 못 한 기술" ...韓, 세계 최초 'AI 반도체' 개발 [지금이뉴스] / YTN file 724 2024.03.08
192 일반 "딥시크보다 싼데 왜 말 안했나"…LG 깜짝 발표에 '술렁' 1 file 582 2025.05.09
191 GPT "삼성은 매우 비범한 기업"…젠슨 황 한마디에 치솟은 주가 / SBS 8뉴스 file 535 2024.03.20
190 일반 "엔비디아보다 625배 뛰어나"…카이스트가 내놓은 반도체 file 599 2024.03.07
189 팁/정보 2030년, AI는 어떤 모습일까? 332 2024.10.16
188 일반 2주 만에 50만 명이 봤다…"함께 훈련, 이게 오픈소스 힘" / SBS 8뉴스 2 file 9943 2025.03.05
187 일반 3분 만에 논문자료 완성하는 AI file 613 2025.05.09
186 프롬프트 4chan 형들 근황 3 file 1557 2024.11.20
185 AI 서비스 7년차 사업가가 애용하는 ai 직원 file 52 2024.12.08
184 그림/사진 a beautiful Asian woman, dressed in medieval warrior costume, golden metal armor, in the middle of the dark forest file 39 2024.08.10
183 일반 A100, H100등 고성능 GPU를 무료로 사용 할 수 있는 곳 file 33 2024.08.10
182 GPT AgentGPT에 이은 또다른 오토 GPT 입니다 782 2023.04.19
181 GPT AGI Q*, 자작극, 사적 복수 등 오픈AI 사태에 대한 6가지 이유와 썰들 file 818 2024.03.15
180 프롬프트 AI 난이도 존나 높아졌네 2 file 1514 2024.11.20
179 GPT AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 file 315 2024.12.29
178 GPT AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 등 file 5255 2025.01.10
177 일반 AI 뉴스 - GPT-5 최신 소식, 뉴럴링크 시연, GTC 2024, 오픈소스 Devin, 빌붙는 애플 AI, 축구감독 AI 등 file 445 2024.04.06
176 일반 AI 뉴스 - 엔비디아 Fugatto, 소라 유출, 딥마인드 Cat-4D, 오픈AI 로스차일드 음모론, 옵티머스 22 DoF, KLING TRY-ON 등 1 file 1446 2024.12.03
175 팁/정보 AI 대장, 엔비디아 CEO의 예측 "프로그래머 될 필요 없다…생물학 연구해야" / SBS / #D리포트 file 65 2024.12.26
174 AI 서비스 AI 비디오 영상 만드는 사이트 KLING AI file 4615 2024.11.22
173 일반 AI 시대, ‘비판적 사고’가 필요하다 353 2024.10.16
172 일반 ai 이미지 생성 사이트 무료 유료 비교 Dreamina vs Midjourney file 877 2025.03.29
171 일반 AI 인공지능 논문 사이트 모음 file 770 2024.04.08
170 그림/사진 AI 재구성으로 재구성된 센과 치히로의 행방불명 주요 장면 file 1462 2024.11.12
169 프롬프트 AI 짤 딸깍 중독이 마약보다 위험한 이유 file 1571 2024.11.20
168 일반 AI 텍스트 최적화를 위한 효율적인 권장 도구: BEXI.ai 592 2025.05.09
167 프롬프트 AI 툴 검색하는 사이트 프롬프트 1897 2024.11.20
166 팁/정보 AI 툴들을 검색하는 사이트 763 2023.04.19
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7