본문 바로가기

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

 

Abstract

The Segment Anything Model 2 (SAM 2) has demonstrated strong performance in object segmentation tasks but faces challenges in visual object tracking, particularly when managing crowded scenes with fast-moving or self-occluding objects. Furthermore, the fixed-window memory approach in the original model does not consider the quality of memories selected to condition the image features for the next frame, leading to error propagation in videos. This paper introduces SAMURAI, an enhanced adaptation of SAM 2 specifically designed for visual object tracking. By incorporating temporal motion cues with the proposed motion-aware memory selection mechanism, SAMURAI effectively predicts object motion and refines mask selection, achieving robust, accurate tracking without the need for retraining or fine-tuning. SAMURAI operates in real-time and demonstrates strong zero-shot performance across diverse benchmark datasets, showcasing its ability to generalize without fine-tuning. In evaluations, SAMURAI achieves significant improvements in success rate and precision over existing trackers, with a 7.1% AUC gain on LaSOT-ext and a 3.5% AO gain on GOT-10k. Moreover, it achieves competitive results compared to fully supervised methods on LaSOT, underscoring its robustness in complex tracking scenarios and its potential for real-world applications in dynamic environments.

Embodied agent interface overview.
Figure 1: The overview of our SAMURAI visual object tracker.

Results

Embodied agent interface overview.
Table 1: Zero-shot tracking results on LaSOT, LaSOT-ext, and GOT-10k.
 
Embodied agent interface overview.
Table 2: Zero-shot tracking results on additional benchmarks: TrackingNet, NFS, and OTB-100.
 
Embodied agent interface overview.
Table 3: Comparison between proposed SAMURAI and the baseline SAM 2 on LaSOT and LaSOT-ext.

인공지능/AI

인공지능AI에 대한 정보와 활용 방법을 공유하는 커뮤니티입니다

List of Articles
번호 분류 제목 조회 수 날짜
공지 일반 프롬프트 쉽게 검색하는 방법 file 116 2024.12.13
공지 이미지 사진 분석 A·I 모델 사용방법 file 154 2024.10.21
공지 인공지능 기본 A·I 모델 사용방법 file 177 2024.10.21
공지 일반 AI 인공지능 논문 사이트 모음 file 770 2024.04.08
HOT글 일반 gpt vs 제미나이, 구글이 아무리 잘만들어도 선택은 gpt 2 file 584 2025.05.09
공지 사랑LOVE 포인트 만렙! 도전 4623 2025.03.19
공지 🚨(뉴비필독) 전체공지 & 포인트안내 2 25844 2024.11.04
공지 URL만 붙여넣으면 끝! 임베드 기능 20427 2025.01.21
11 AI 서비스 Civitai - Stable Diffusion 학습 모델을 공유하는 오픈 소스 웹사이트 375 2024.01.12
10 AI 서비스 GitHub Copilot - 프로그래머의 수고를 덜어주는 자동 코드 인공지능 프로그램 file 411 2024.01.12
9 AI 서비스 저작권 걱정 없이 무료로 PPT, 템플릿, 섬네일, 포스터 등을 만들 수 있는 웹 기반 그래픽 툴 미리캔버스 MiriCanvas file 436 2024.01.12
8 AI 서비스 저작권 없는 AI 음악 만들기 사이트 프로그램 10개 5268 2024.11.16
7 AI 서비스 AI 비디오 영상 만드는 사이트 KLING AI file 4615 2024.11.22
6 AI 서비스 모션트래킹 모델 “사무라이(SAMURAI)”가 오픈소스로 공개되었습니다. file 115 2024.12.05
» AI 서비스 SAMURAI: 모션 인식 동영상 추적 녹화 프로그램 (직캠 만들때 최고) file 65 2024.12.05
4 AI 서비스 Suno AI의 경쟁 사이트. 작곡 AI 1 59 2024.12.08
3 AI 서비스 7년차 사업가가 애용하는 ai 직원 file 52 2024.12.08
2 AI 서비스 음악 만드는 ai 프로그램 (영구무료) AudoCraft file 94 2024.12.20
1 AI 서비스 텍스트 한 줄이면 물리엔진 뚝딱 #shorts file 5307 2025.01.10
Board Pagination Prev 1 Next
/ 1