Published May 11, 2023

读论文: Segment Anything

读论文

这是 Meta 最近发布的一篇挺火的论文，标题就是 Segment Anything，也可以称之为 Segment Anything Model，简称 SAM。这个模型的野心很大，试图建立起一个“大一统”的分割模型，可以对任意类别的元素完成像素级分割；

为了达成这个任务，作者建立了一个极为庞大的数据集，包含了 1100 万个样本上的 10 亿个 Mask。这个数据集的名字叫做 SA-1B。作者还引入了一个 promptable segmentation 的概念，即我们可以通过输入文本来控制被 Segment 标记出来的像素集合的类别，如上图 (a) 所示。

参考大语言模型中在近期取得突飞猛进的进展，如果在图像领域也构造出足够强大的通用模型成为一个新的热点。本文的目标就是为图像分割任务训练一个基础的通用模型。另一个重点是将图像分割筒 Prompt 工程集合起来。

读论文

返回 | 首页

相关文章

文章目录：