人工智能行业专题:SAM带领CV领域技术突破 赋能多场景AI应用
(资料图)
SAM 模型为CV 领域的ChatGPT,为计算机视觉带来技术突破。Meta 公司近期推出了其创新的AI 模型——Segment Anything Model (SAM),专门用于计算机视觉(CV)领域的图像分割任务。这一模型吸取了ChatGPT 基于提示(Prompt)的学习范式,实现了预训练与特定下游任务之间的紧密结合,从而显著提高了模型的泛化能力。更为出色的是,SAM 还展现出了卓越的零样本学习效果。SAM 的设计初衷和核心愿景是为了简化图像分割流程。它旨在减少对专业建模知识的依赖,同时也降低了大规模训练计算的需求。与此同时,SAM 模型还大大降低了用户手动标注掩码的需求。其最终目标是使用户在“不会/少会操作、不标注/少标注数据、不训练/少训练模型”的前提下,也能够实现高效的图像目标分割。
SAM 引起AI 届的广泛关注和讨论,并产生相关衍生模型,提升模型功能,增加应用可能性。其衍生模型在分割效率、医学影像分割、阴影缺陷检测、伪体识别和动态图像分割等领域有性能提升,如SEEM 模型结合了SAM 的零样本泛化能力和检测器,可以根据多种用户输入分割图像或视频中的内容;MedSAM 对SAM 进行微调,专门针对医学影像分割,并显示出比SAM 更优的性能;通过适配方法生成SAM-Adapter,其性能得以提升,特别是在阴影检测和伪装物体分割等任务上;SAM-Track 项目拓展了SAM 模型,增强其视频分割能力,可广泛应用于多种视频场景,提供高准确性和可靠性的视频编辑功能。SAM 衍生模型或可应用与运动场景、医学影像、遥感图像等图像分割难度较大的领域。
SAM 及其衍生模型可基于强大的性能赋能多场景应用,催生巨大应用蓝海。
如SAM 在零样本学习上表现优秀,可减少已有的CV 领域训练数据量,实现降本增效;或在在标记数据稀缺或获取成本高的领域有许多潜在的应用。可将大模型应用在CV 领域的制造业赛道,如工业机器视觉行业;可将模型应用于计算机视觉的下游应用赛道,包括自动驾驶、安防系统、AR 领域等;此外遥感图像、医学影像领域,由于图像分割难度较高,技术还需突破,可长期关注。
风险提示:1、技术发展不及预期;2、算力、数据支持不及预期;3、应用落地不及预期;4、行业竞争加剧。
投资建议:建议关注AIGC 在CV 领域应用的相关赛道,维持超配评级。AI大模型正在推动空天信息产业的发展,其中遥感大模型技术日益显现其重要性。相对于传统方法的局限性,大模型提供了统一分割、识别和生成遥感图像的能力,显著提高了效率和鲁棒性。基于此推荐相关标的1)航天宏图:推出了天权大模型,提升了各类遥感数据的处理性能;2)中科星图:推出了空天灵眸大模型,推动在线数字地球业务。