본문 바로가기

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

 

Abstract

The Segment Anything Model 2 (SAM 2) has demonstrated strong performance in object segmentation tasks but faces challenges in visual object tracking, particularly when managing crowded scenes with fast-moving or self-occluding objects. Furthermore, the fixed-window memory approach in the original model does not consider the quality of memories selected to condition the image features for the next frame, leading to error propagation in videos. This paper introduces SAMURAI, an enhanced adaptation of SAM 2 specifically designed for visual object tracking. By incorporating temporal motion cues with the proposed motion-aware memory selection mechanism, SAMURAI effectively predicts object motion and refines mask selection, achieving robust, accurate tracking without the need for retraining or fine-tuning. SAMURAI operates in real-time and demonstrates strong zero-shot performance across diverse benchmark datasets, showcasing its ability to generalize without fine-tuning. In evaluations, SAMURAI achieves significant improvements in success rate and precision over existing trackers, with a 7.1% AUC gain on LaSOT-ext and a 3.5% AO gain on GOT-10k. Moreover, it achieves competitive results compared to fully supervised methods on LaSOT, underscoring its robustness in complex tracking scenarios and its potential for real-world applications in dynamic environments.

Embodied agent interface overview.
Figure 1: The overview of our SAMURAI visual object tracker.

Results

Embodied agent interface overview.
Table 1: Zero-shot tracking results on LaSOT, LaSOT-ext, and GOT-10k.
 
Embodied agent interface overview.
Table 2: Zero-shot tracking results on additional benchmarks: TrackingNet, NFS, and OTB-100.
 
Embodied agent interface overview.
Table 3: Comparison between proposed SAMURAI and the baseline SAM 2 on LaSOT and LaSOT-ext.

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

List of Articles
번호 분류 제목 조회 수 날짜
공지 일반 프롬프트 쉽게 검색하는 방법 file 124 2024.12.13
공지 이미지 사진 분석 A·I 모델 사용방법 file 163 2024.10.21
공지 인공지능 기본 A·I 모델 사용방법 file 183 2024.10.21
공지 일반 AI 인공지능 논문 사이트 모음 file 815 2024.04.08
HOT글 일반 사람을 왜 채용하죠? AI 쓰면 되는데? 최재천의 아마존 3 file 676 2025.06.26
공지 🚨(뉴비필독) 전체공지 & 포인트안내 20 28635 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 22745 2025.01.21
203 그림/사진 “AI의 유토피아, 끔찍할 수도”…억만장자의 경고 file 1785 2023.04.03
202 일반 “자료 좀 찾아줘”…로봇과 AI가 바꾼 사무실 풍경 / KBS 2024.03.01. file 710 2024.03.08
201 GPT [무료] 인공지능 AI 서비스 6종 총 정리 | 챗GPT 퍼플렉시티 미드저니 대체! file 66 2024.11.14
200 일반 [벙커1특강] 박태웅 AI 강의 1부 file 717 2024.03.08
199 GPT [신조어 사전] 인공지능 할루시네이션(Hallucination) 509 2024.03.12
198 일반 [해외야구] 메츠는 질려고 노력하나? 115 2024.10.21
197 일반 "4년 뒤 인류 멸종 위협" 경고…'사이코패스 AI'도 재조명 / SBS / 뉴블더 file 875 2024.03.14
196 그림/사진 "AI로 생사람 잡혔다"… 기술 오류로 절도범 누명 쓴 美 남성 file 1772 2023.04.03
195 일반 "IBM, 인텔도 못 한 기술" ...韓, 세계 최초 'AI 반도체' 개발 [지금이뉴스] / YTN file 728 2024.03.08
194 일반 "딥시크보다 싼데 왜 말 안했나"…LG 깜짝 발표에 '술렁' 1 file 591 2025.05.09
193 GPT "삼성은 매우 비범한 기업"…젠슨 황 한마디에 치솟은 주가 / SBS 8뉴스 file 540 2024.03.20
192 일반 "엔비디아보다 625배 뛰어나"…카이스트가 내놓은 반도체 file 601 2024.03.07
191 일반 #Veo3 further blurs the lines between reality and imagination with audio, stronger text file 476 2025.05.24
190 팁/정보 2030년, AI는 어떤 모습일까? 336 2024.10.16
189 일반 2주 만에 50만 명이 봤다…"함께 훈련, 이게 오픈소스 힘" / SBS 8뉴스 2 file 9947 2025.03.05
188 일반 3분 만에 논문자료 완성하는 AI file 620 2025.05.09
187 프롬프트 4chan 형들 근황 3 file 1559 2024.11.20
186 AI 서비스 7년차 사업가가 애용하는 ai 직원 file 52 2024.12.08
185 그림/사진 a beautiful Asian woman, dressed in medieval warrior costume, golden metal armor, in the middle of the dark forest file 40 2024.08.10
184 일반 A100, H100등 고성능 GPU를 무료로 사용 할 수 있는 곳 file 34 2024.08.10
183 GPT AgentGPT에 이은 또다른 오토 GPT 입니다 784 2023.04.19
182 GPT AGI Q*, 자작극, 사적 복수 등 오픈AI 사태에 대한 6가지 이유와 썰들 file 824 2024.03.15
181 프롬프트 AI 난이도 존나 높아졌네 2 file 1515 2024.11.20
180 GPT AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 file 319 2024.12.29
179 GPT AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 등 file 5259 2025.01.10
178 일반 AI 뉴스 - GPT-5 최신 소식, 뉴럴링크 시연, GTC 2024, 오픈소스 Devin, 빌붙는 애플 AI, 축구감독 AI 등 file 450 2024.04.06
177 일반 AI 뉴스 - 엔비디아 Fugatto, 소라 유출, 딥마인드 Cat-4D, 오픈AI 로스차일드 음모론, 옵티머스 22 DoF, KLING TRY-ON 등 1 file 1449 2024.12.03
176 팁/정보 AI 대장, 엔비디아 CEO의 예측 "프로그래머 될 필요 없다…생물학 연구해야" / SBS / #D리포트 file 70 2024.12.26
175 AI 서비스 AI 비디오 영상 만드는 사이트 KLING AI file 4635 2024.11.22
174 일반 AI 시대, ‘비판적 사고’가 필요하다 367 2024.10.16
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7