时间:2022-11-08 10:51:06
作者:景联文科技
浏览: 次
图像标注是计算机视觉和图像识别应用发展中最重要的阶段之一,涉及识别、获取、描述和解释数字图像或视频的结果。计算机视觉广泛用于人工智能应用,如自动驾驶汽车、医学成像或安全。因此,图像标注在许多领域的AI/ML开发中起着至关重要的作用。
图像标注通常需要标注员人工进行标注,标注员确定标签或“标记”,并将特定于图像的信息传递给正在训练的计算机视觉模型。你可以把这个过程想象成一个孩子问她的父母探索她所生活的环境的问题。父母将数据分类为通用短语,例如香蕉、橙子、猫等。
1、矩形框标注
矩形框标注又叫拉框标注,是目前应用最广泛的一种图像标注方法,能够以一种相对简单、便捷的方式在图像或视频数据中,迅速框定指定目标对象。
2、关键点标注
关键点标注是指通过人工的方式,在规定位置标注上关键点,例如人脸特征点、人体骨骼连接点等,常用来训练面部识别模型以及统计模型。使用此信息ML模型学习人脸的各个部分,用特定的数字标记面部的特定位置,例如眼睛、眉毛、嘴唇、额头等。
3、多边形标注
多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,多边形标注能够更精准地框定目标,同时对于不规则物体,也更具针对性。
4、折线标注
折线标注主要功能是让计算机视觉系统感知到标注的边界、样条和线。在自动驾驶汽车的 ML 模型。中,它确保 ML 模型识别道路上的物体、方向、转弯和迎面而来的车辆,以感知安全驾驶的环境。
5、立方体标注
将2D图片中的车辆进行3D标注,主要应用于训练自动驾驶对会车或超车车辆的体积判断。