计算机视觉开启GPT时代

近日,Meta官方博客宣布,推 出 新 AI模 型 SegmentAnythingModel(SAM)分割一切模型,提出能够对任何图像或视频中的任何物体进行识别、图像分割和一键抠图。此外,华为云AI领域首席科学家田奇在中国人工智能大模型技术高峰论坛上提出,未来随着盘古系列大模型落地,AI视觉在下游应用中会加速渗透。

业内人士表示,目前SAM模型及数据集均为开源,可以灵活集成于更大的AI系统,随着SAM的演进与发展,该技术可能会成为工业质检、AR/VR、自动驾驶、卫星遥感等多领域的强大的辅助工具,看好SAM等图像分割模型在机器视觉中的应用。


(相关资料图)

事件驱动 Meta推出SAM模型

4月6日,Meta宣布推出Segmen-tAnything工具,SAM可准确识别图像中的对象,可以识别图像和视频中的单个物体,甚至是训练中没有遇到的物体。除此之外,Meta还发布了SegmentAnything1-Bilionmask数据集(SA-1B),这更是有史以来发布的最大分割数据集。开发者可以在SAM模型技术上,开发出功能更强大、影响范围更广的人工智能,应用于各种领域。

目前为特定用例创建准确的分割模型是大多数AI无法完成的任务,因为它需要技术专家进行高度专业化的工作,并需要获得极其强大的AI训练基础设施和大量有注释和特定领域的数据集,而Meta表示,上述难题都是SAM和SA-1B能够克服的问题,通过减少对特定任务的建模专业知识、训练计算和定制数据注释的需求来帮助研究人员。

英伟达人工智能科学家JimFan表示,此次SAM最大的一点突破是它已经基本能够理解“物品”的一般概念,即使对于未知对象、不熟悉的场景都能比较准确的理解,因此他表示,相信SAM的出现会是在计算机视觉领域里的GPT-3时刻。

MetaSAM模型的推出引发市场对计算机视觉的关注,而机器视觉和计算机视觉关系紧密。机器视觉技术,是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。机器视觉主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。

继Meta发布SAM后,智源研究院视觉团队推出通用分割模型SegGPT(Seg-mentEverythingInContext)。与SAM的精细标注能力相比,SegGPT模型更偏重于批量化标注分割能力,无论是在图像还是视频环境,用户在画面上标注识别一类物体,即可批量化识别分割出其他所有同类物体。从测试结果看,研究人员在广泛的任务上对SegGPT进行了评估,包括少样本语义分割、视频对象分割、语义分割和全景分割,结果显示SegGPT模型同样展现出强大的零样本场景迁移能力,并在COCO和PASCAL等经典CV数据集上取得最优性能。

行业前景 国产机器视觉成长提速

计算机视觉是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等,通过计算机实现人的视觉功能,对客观世界的三维场景的感知、识别和理解,通常有仿生学和工程两类方法。计算机视觉自20世纪40年代萌芽,历经三次浪潮,自2006年Hinton在神经网络的深度学习领域取得突破后,实现飞速发展。计算机视觉下游应用广泛,可通过人脸识别、视频监控处理、网络图像分析、测温通行、人机交互等功能垂直赋能各行各业,使用场景包括智慧城市、智慧零售、智慧医疗、智能驾驶、智能家居、工业制造等。

机器视觉可以被认为是工业化的计算机视觉,在工业领域,计算机视觉为机器视觉提供软件算法,而机器视觉提供传感器模型,系统构造等,可广泛应用于3C电子制造、锂电池、光伏、半导体等行业。

根据咨询机构弗若斯特沙利文数据,我国计算机视觉市场规模一直保持逐年增长,从2018年的79亿元增长至2020年的167亿元,年均复合增长率达45.39%,预计2022年我国机器视觉市场规模将进一步增长至351亿元。根据高工机器人产业研究所(GGII)统计数据,我国机器视觉市场国模有望从2021年的107.8亿元增长至2025年的311.57亿元,CAGR高达30.4%。

值得一提的事,政策支持叠加应用端拓展,国产机器视觉成长提速。一方面,我国《“十四五”智能制造发展规划》中提到,要大力发展智能制造装备,推动先进工艺、信息技术与制造装备深度融合,产业链自主可控需求推动本土机器视觉厂商持续自主创新、缩小与海外龙头的实力差距;另一方面,全球人工智能经济持续发酵,AI应用端市场多点开花并加速落地,在“AI+”、“工业4.0”和“中国制造2025”背景下,智能工厂、智能制造成为工业发展大趋势,在机器视觉方面率先实现自主技术创新突破的国产厂商有望充分受益。

投资机会 七大应用领域有望受益

招商证券表示,我国机器视觉研发起步较晚,早期本土厂商以代理海外龙头产品为主,后逐步开始自主研发进程。目前本土企业中,凌云光已涉足视觉器件、可配置视觉系统与智能视觉装备等领域,奥普特产品涵盖视觉控制系统、镜头等机器视觉核心部件,大恒科技子公司专注机器视觉系统与部件业务;天准科技已推出视觉测量装备、视觉检测装备等产品服务,矩子科技涉足机器视觉设备。此外,大华股份、韦尔股份、斯特威、奥比中光等也是本土机器视觉产业链重要参与者。

华西证券指出,SAM对机器视觉会产生革命性的影响,原因是从机器视觉的角度来说,感知永远是处于智能模块的流程前期,且感知在AI机器视觉领域占据绝大部分的功耗,原因是感知需要将数据转换成特征向量。就智能驾驶而言,图像分割是深度神经网络架构,在智能驾驶极为重要,SAM出世后,此神经网络有望直接被SAM大模型代替,效率大幅提升,模型预训练所需的时间、人力成本有望大幅降低,同理,其他领域机器视觉同样受益,例如智慧安防领域、家用摄像头领域等。

SAM的横空出世有望对机器视觉产生革命性的影响,华西证券认为以下应用领域有望受益。

第一,智能驾驶,受益标的为中科创达、虹软科技、光庭信息、四维图新、东软集团等;第二,安防领域,受益标的为海康威视、当虹科技、大华股份等;第三,家用摄像头与机器人领域,受益标的为科沃斯、石头科技等;第四,工业质检领域,受益标的为凌云光、用友网络、奥比中光等;第五,MR、XR领域,受益标的为歌尔股份、立讯精密、微导纳米、长盈精密等;第六,地理信息化领域,受益标的为航天宏图、中科星图、超图软件等;第七,3D建模仿真领域,受益标的为华如科技、霍莱沃等。

中邮证券则表示,目前SAM模型及数据集均为开源,可以灵活集成于更大的AI系统,随着SAM的演进与发展,该技术可能会成为工业质检、AR/VR、自动驾驶、卫星遥感等多领域的强大的辅助工具,看好SAM等图像分割模型在机器视觉中的应用,建议关注奥普特、凌云光、奥比中光、千方科技、声迅股份。

关键词: