下载
登录/ 注册
主页
论坛
视频
热股
可转债
基金
下载
下载

新概念SAM、机器视觉,值得关注。

23-04-11 07:21 445次浏览
执迷不悟1998
+关注
博主要求身份验证
登录用户ID:
4月6日,Meta公司发布通用图像分割模型Segment-AnythingModel(SAM)和图像注释数据集Segment-Anything1-Billion(SA-1B)。SAM模型可根据文本指令等方式,实现零样本下对任意图像行分割,其灵活性在图像分割领域尚属首创,SAM的发布可以称为CV领域的“GPT-3时刻”,或将加速图像分割视频领域的研究。此外,Meta还开源了包含1100万张图像和11亿个掩码的训练数据集SA-1B,该数据集可用于研究目的,并且在开放许可Apache2.0下可用。

SAM支持多方式灵活执行图像分割,并且具备零样本迁移能力。尽管过去图像分割在众多领域已得到了广泛应用,但为特定任务创建准确的分割模型通常需要技术专家进行高度专业化的工作,此外,该项任务还需要大量的领域标注数据,种种因素限制了图像分割的进一步发展。而SAM已学会物体的一般概念,支持文本、关键点、边框等多种方式为任何图像和视频中的任意物体生成Mask,甚至包括训练中未遇到过的目标。SAM足够通用,涵盖广泛用例,并且可以在新的图像领域上即开即用,无需额外的训练,这种零样本迁移能力开启了CV图像分割领域的GPT-3时代。

SAM有望赋能众多垂直领域,释放AI强大潜力。从应用角度看,SAM可与其他系统灵活集成,获取输入提示,例如,从AR/VR中获取视线范围来选择对象、用文本输入检测界定对象等。目前,Meta公司内部已开始使用SAM,对其网站的图片、审核、Facebook和Instagram用户推荐内容等进行标记,同时,其官网也展示了SAM在VR/AR、智慧农业 等领域的颠覆性应用畅想。此外,在自动驾驶领域,SAM有利于检测行人、汽车、障碍物等,提升智能汽车 算法数据标注的效率,使算法迭代加速;在工业视觉领域,零部件在工业生产线包装过程中存在检测速度慢、自动化检测水平低下、检测准确率不高等问题,SAM可有效改善这些问题;在医疗领域,SAM可对医学影像进行分割标注,帮助医生进行病理分析和诊断;在数据标注领域,SAM可提高注释图像效率,新注释数据则可反过来用于更新SA,迭代改善模型和数据集。我们认为,SAM将赋能自动驾驶、工业视觉、医疗、数据标注等众多行业领域,相关领域标的将因此充分收益。
打开淘股吧APP
0
评论(0)
收藏
展开
热门 最新
提交