Sign In Get Started

Video

SAM 3.1 Video

SAM 3.1 Video by Meta tracks and segments objects across video frames using a text prompt. Returns up to 16 isolated mask tracks per video.

Segment videos with Meta SAM 3.1. Text prompt initializes detection; optional per-frame points, box, or mask refine tracking.

More models from Meta