计算机行业SAM动态跟踪:通用的图像分割方法,降本拓新,赋能工业、自动驾驶、安防等领域
SAM动态跟踪:通用的图像分割方法,降本拓新,赋能工业、自动驾驶、安防等领域证券研究报告行业动态报告发布日期:2023年4月9日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。分析师:于芳博yufangbo@csc.com.cnSAC编号:S1440522030001分析师:金戈jinge@csc.com.cnSAC编号:S1440517110001SFC编号:BPD352分析师:阎贵成yanguicheng@csc.com.cnSAC编号:S1440518040002SFC编号:BNS315 • 核心观点:Meta发布SAM,成为CV图像分割领域的基础模型,引起产学界较大反响。SAM使用提示工程进行任务学习,能够通过交互式点击等操作实现图像物体的分割,并且具有模糊感知能力,很好解决了分割过程中产生的歧义问题,SAM在下游任务的零样本学习表现上成绩优秀,使得两种应用领域有了新的变化:一是原来采用计算机视觉技术,但是因为长尾场景多,需要大量标签数据,因此训练成本较高,有了大模型后可以大幅降低定制化开发产品成本,带来毛利率提升,比如工业中的机器视觉、自动驾驶、安防等行业;二是原来没有用计算机视觉技术的领域,主要因为过去样本少难以应用深度学习等AI算法,由于SAM在零样本或者少量样本上表现优秀,一些新的应用领域将被拓展,比如从代码驱动变为视觉驱动的机器人领域、流程工业场景等。• 4月5日,Meta发布Segment Anything Model,即SAM,用来处理CV领域的图像分割,引起学界/业界较大反响。SAM由一个图像编码器、一个提示编码器和一个掩码解码器组成,具有以下特点:1)使用提示工程进行任务学习,交互式点击、选择框甚至文本操作进行物体分割;2)具有模糊感知功能,面对分割对象存在歧义时,可以输出多个有效掩码;3)与ChatGPT类似,SAM巧妙的将人工标注与大数据结合(数据引擎),最终实现了“分割一切”的功能。SAM在下游任务领域表现优秀,虽然在某些领域不如当前最优模型的表现,但其良好的zero-shot泛化能力依旧证明该模型性能的强悍。英伟达人工智能科学家Jim Fan更是认为SAM是CV的“GPT-3时刻”之一。• 我们认为SAM的提出对于CV领域具有重要意义,会成为和CLIP一样同等重要的基础模型:图像分割是计算机视觉一个非常重要领域,是当前该领域的前沿,甚至可以说是该领域的核心研究问题,SAM的提出,使得图像分割领域有了基础模型(foundation model),预计未来基于SAM模型,CV领域尤其图像分割领域许多问题将迎刃而解;此外,SAM整理了SA-1B数据集,是图像分割领域数据集的一个重要补充。核心观点 oPuNtRnNsMpPtPrNmPsNqQ9PdNaQoMrRpNoNiNqQsOlOmNpP9PoPrNMYsOmQvPqMnO核心推荐领域及标的• SAM及其改良版本预计将被广泛应用于工业、自动驾驶、VR/AR、安防、卫星遥感等众多领域,将催生巨大应用蓝海,建议持续跟踪。• 工业领域:1)机器视觉:国内工业视觉检测多数是面对长尾的缺陷检测场景做定制化开发,因此相比于海外的标准品公司,国内机器视觉公司毛利率普遍较低,未来大模型可以大幅降低定制化开发的产品,只需要少量的样本(比如苹果的几个缺陷产品)就可以部署产线了,建议关注【凌云光】、【奥普特】(机械组覆盖);2)流程工业:生产流程及工艺、生产线配置、原材料及产品类型均具有较大差异性,此前,由于样本少难以应用深度学习等AI算法,而SAM在零样本或者少量样本上表现优秀,意味着AI可以在更多的石油化工装置的自适应控制、诊断与预测预警、智能决策领域有新的应用,重点推荐【中控技术】; 3)机器人领域:切割机器人可以从过去的代码驱动变为视觉驱动,处理更多样的应用场景,重点推荐【柏楚电子】。• 自动驾驶:自动驾驶长尾场景较多,导致很多物体识别不出来、识别不准确或者识别成本高(需要大量标签进行数据训练),在SAM的大模型基础上,能零样本或者少量样本将物体分割出来。通过进一步改进,SAM可用于三维重建领域,SAM良好的性能表现预计可以很好弥补原先图像分割在自动驾驶领域中的缺陷,对于当前使用占用网络进行三维重建的自动驾驶来说,是另外一个技术催化,重点推荐【中科创达】、【德赛西威】、【经纬恒润】。 • 安防领域:过去一些长尾场景难以覆盖或者训练成本高,对于安防领域的龙头公司,实际上就能覆盖更多的场景,结合制造业和渠道的优势,客户覆盖范围进一步增加,建议关注【海康威视】、【大华股份】以及【千方科技】。• AR/VR眼镜:通过将AR眼镜集成SAM模型,可以从视野图像中切割出物体,从而为用户选择视线关注的对象,在分割并锁定相关对象后,AR眼镜就可以根据该对象进行后续交互操作,让人机交互过程更加智能。• 卫星遥感:随着卫星数的增加、遥感图像的时间和空间分辨率的提高,遥感数据呈现爆发式增长,如何利用海量遥感数据服务人类生产生活越发重要。SAM等CV领域大模型可以更好地检测、分割、追踪目标物,有利于更精准的分析图像信息,建议关注【中科星图】。核心推荐领域及标的 目录一、计算机视觉二、SAM模型介绍三、SAM模型应用四、风险提示 1.1 计算机视觉基本任务(1/2)• 计算机视觉领域中的基本任务包括:分类(Classification)、检测(Detection)、分割(Segmentation)。• 分类(Classificaiton):对于输入的图像,判断出图像中包含的物体的类别。如下左图所示,识别出图像中包括人(person)、羊(sheep)、狗(dog)三种对象。分类任务数据集:ImageNet、CIFAR-10、CIFAR-100、MNIST等分类任务网络结构:LeNet-5、AlexNet、VGG-16/VGG-19、GoogLeNet、ResNet等• 检测(Detection):对于输入的图像,以包围框的方式确定图像中物体的几何位置,并识别出被框定物体的类别。如下右图所示,分别用三种不同颜色的框框定出了人、羊、狗三种不同实体的位置。检测任务数据集:PASCAL VOC 、MS COCO、mAP等检测任务网络结构:R-CNN、Fast R-CNN、YOLO、RetinaNet等图:分类任务示意图图:检测任务示意图资料来源:华为云,中信建投 1.2 计算机视觉基本任务(2/2)• 计算机视觉领域中的基本任务包括:分类(Classification)、检测(Detection)、分割(Segmentation)。• 分割(Segmentation):对于输入的图像,判断出图像中的每个像素属于哪个物体,相较于检测而言是更加进阶的任务。如左图所示,不同颜色的区域代表着不同的物体对应的像素点。同时根据分割粒度的不同可以进一步划分为
[中信建投]:计算机行业SAM动态跟踪:通用的图像分割方法,降本拓新,赋能工业、自动驾驶、安防等领域,点击即可下载。报告格式为PDF,大小2.88M,页数25页,欢迎下载。



