단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

 

Abstract

The Segment Anything Model 2 (SAM 2) has demonstrated strong performance in object segmentation tasks but faces challenges in visual object tracking, particularly when managing crowded scenes with fast-moving or self-occluding objects. Furthermore, the fixed-window memory approach in the original model does not consider the quality of memories selected to condition the image features for the next frame, leading to error propagation in videos. This paper introduces SAMURAI, an enhanced adaptation of SAM 2 specifically designed for visual object tracking. By incorporating temporal motion cues with the proposed motion-aware memory selection mechanism, SAMURAI effectively predicts object motion and refines mask selection, achieving robust, accurate tracking without the need for retraining or fine-tuning. SAMURAI operates in real-time and demonstrates strong zero-shot performance across diverse benchmark datasets, showcasing its ability to generalize without fine-tuning. In evaluations, SAMURAI achieves significant improvements in success rate and precision over existing trackers, with a 7.1% AUC gain on LaSOT-ext and a 3.5% AO gain on GOT-10k. Moreover, it achieves competitive results compared to fully supervised methods on LaSOT, underscoring its robustness in complex tracking scenarios and its potential for real-world applications in dynamic environments.

Embodied agent interface overview.
Figure 1: The overview of our SAMURAI visual object tracker.

Results

Embodied agent interface overview.
Table 1: Zero-shot tracking results on LaSOT, LaSOT-ext, and GOT-10k.
 
Embodied agent interface overview.
Table 2: Zero-shot tracking results on additional benchmarks: TrackingNet, NFS, and OTB-100.
 
Embodied agent interface overview.
Table 3: Comparison between proposed SAMURAI and the baseline SAM 2 on LaSOT and LaSOT-ext.

0 0 0 0 0 0 0 1 0 0 0
List of Articles
번호 분류 제목 글쓴이 조회 수 날짜
공지 일반 프롬프트 쉽게 검색하는 방법 file 덕후냥이 124 2024.12.13
공지 이미지 사진 분석 A·I 모델 사용방법 file 무명의덕질 163 2024.10.21
공지 인공지능 기본 A·I 모델 사용방법 file 덕후냥이 183 2024.10.21
공지 일반 AI 인공지능 논문 사이트 모음 file 덕후냥이 815 2024.04.08
공지 일반 사람을 왜 채용하죠? AI 쓰면 되는데? 최재천의 아마존 3 file 덕후냥이 676 2025.06.26
공지 🚨(뉴비필독) 전체공지 & 포인트안내 20 무명의덕질 28686 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 무명의덕질 22802 2025.01.21
11 AI 서비스 Civitai - Stable Diffusion 학습 모델을 공유하는 오픈 소스 웹사이트 덕후냥이 378 2024.01.12
10 AI 서비스 GitHub Copilot - 프로그래머의 수고를 덜어주는 자동 코드 인공지능 프로그램 file 덕후냥이 413 2024.01.12
9 AI 서비스 저작권 걱정 없이 무료로 PPT, 템플릿, 섬네일, 포스터 등을 만들 수 있는 웹 기반 그... file 덕후냥이 442 2024.01.12
8 AI 서비스 저작권 없는 AI 음악 만들기 사이트 프로그램 10개 덕후냥이 5442 2024.11.16
7 AI 서비스 AI 비디오 영상 만드는 사이트 KLING AI file 덕후냥이 4635 2024.11.22
6 AI 서비스 모션트래킹 모델 “사무라이(SAMURAI)”가 오픈소스로 공개되었습니다. file 덕후냥이 132 2024.12.05
» AI 서비스 SAMURAI: 모션 인식 동영상 추적 녹화 프로그램 (직캠 만들때 최고) file 덕후냥이 67 2024.12.05
4 AI 서비스 Suno AI의 경쟁 사이트. 작곡 AI 1 덕후냥이 61 2024.12.08
3 AI 서비스 7년차 사업가가 애용하는 ai 직원 file 덕후냥이 52 2024.12.08
2 AI 서비스 음악 만드는 ai 프로그램 (영구무료) AudoCraft file 덕후냥이 99 2024.12.20
1 AI 서비스 텍스트 한 줄이면 물리엔진 뚝딱 #shorts file 덕후냥이 5308 2025.01.10
Board Pagination Prev 1 Next
/ 1