단축키

Prev이전 문서

Next다음 문서

단축키

Prev이전 문서

Next다음 문서

 

Abstract

The Segment Anything Model 2 (SAM 2) has demonstrated strong performance in object segmentation tasks but faces challenges in visual object tracking, particularly when managing crowded scenes with fast-moving or self-occluding objects. Furthermore, the fixed-window memory approach in the original model does not consider the quality of memories selected to condition the image features for the next frame, leading to error propagation in videos. This paper introduces SAMURAI, an enhanced adaptation of SAM 2 specifically designed for visual object tracking. By incorporating temporal motion cues with the proposed motion-aware memory selection mechanism, SAMURAI effectively predicts object motion and refines mask selection, achieving robust, accurate tracking without the need for retraining or fine-tuning. SAMURAI operates in real-time and demonstrates strong zero-shot performance across diverse benchmark datasets, showcasing its ability to generalize without fine-tuning. In evaluations, SAMURAI achieves significant improvements in success rate and precision over existing trackers, with a 7.1% AUC gain on LaSOT-ext and a 3.5% AO gain on GOT-10k. Moreover, it achieves competitive results compared to fully supervised methods on LaSOT, underscoring its robustness in complex tracking scenarios and its potential for real-world applications in dynamic environments.

Embodied agent interface overview.
Figure 1: The overview of our SAMURAI visual object tracker.

Results

Embodied agent interface overview.
Table 1: Zero-shot tracking results on LaSOT, LaSOT-ext, and GOT-10k.
 
Embodied agent interface overview.
Table 2: Zero-shot tracking results on additional benchmarks: TrackingNet, NFS, and OTB-100.
 
Embodied agent interface overview.
Table 3: Comparison between proposed SAMURAI and the baseline SAM 2 on LaSOT and LaSOT-ext.

0 0 0 1 0 0 0 0 0 0
List of Articles
번호 분류 제목 날짜 조회 수
공지 유머 🚨(뉴비필독) 전체공지 & 포인트안내 10 2024.11.04 26199
공지 이슈 URL만 붙여넣으면 끝! 임베드 기능 2025.01.21 20635
11 AI 서비스 텍스트 한 줄이면 물리엔진 뚝딱 #shorts file 2025.01.10 5308
10 AI 서비스 음악 만드는 ai 프로그램 (영구무료) AudoCraft file 2024.12.20 98
9 AI 서비스 7년차 사업가가 애용하는 ai 직원 file 2024.12.08 52
8 AI 서비스 Suno AI의 경쟁 사이트. 작곡 AI 1 2024.12.08 60
» AI 서비스 SAMURAI: 모션 인식 동영상 추적 녹화 프로그램 (직캠 만들때 최고) file 2024.12.05 67
6 AI 서비스 모션트래킹 모델 “사무라이(SAMURAI)”가 오픈소스로 공개되었습니다. file 2024.12.05 121
5 AI 서비스 AI 비디오 영상 만드는 사이트 KLING AI file 2024.11.22 4623
4 AI 서비스 저작권 없는 AI 음악 만들기 사이트 프로그램 10개 2024.11.16 5362
3 AI 서비스 저작권 걱정 없이 무료로 PPT, 템플릿, 섬네일, 포스터 등을 만들 수 있는 웹 기반 그... file 2024.01.12 440
2 AI 서비스 GitHub Copilot - 프로그래머의 수고를 덜어주는 자동 코드 인공지능 프로그램 file 2024.01.12 413
Board Pagination Prev 1 2 Next
/ 2