数据标注就是对文本、图像、语音、视频等待标注 数据进行归类、整理、编辑、纠错、标记和批注等操作, 为待标注数据增加标签,生产满足机器学习、神经网络 训练要求的机器可读数据编码。
计算机视觉的飞速发展离不开大量图像标注数据的 支撑,随着各类图像检测、识别算法的商业化落地,市 场对图像标注精准度愈发严格,同时针对不同的应用场 景,也衍生出了不同的图像标注方法。
(1)关键点标注 :关键点标注模板最大的应用即是 对脸部的关键点进行标注,通过不同方位的关键点标注, 可以判断图像上人物的功能。
(2)矩形框标注 :矩形框标注是一种对目标对象进 行目标检测框标注的简单处理方式,常用于标注自动驾 驶下的人、车、物等。
(3)区域标注 :区域标注指的是将图像分成各具特 性的区域并提取出感兴趣部分的过程。区域标注包括开 区间标注和闭区间标注。按照通用定义,区域标注需同 时满足均匀性和连通性的条件,其中均匀性指的是该区 域中的所有像素点都满足灰度、纹理、彩色等特征的某 种相似性准则 ;连通性是指在该区域内存在连接任意两 点的路径。与矩形框标注相比,其区域要求标注更加精 确,标注边缘可以是多边形甚至是柔性的,常用于自动 驾驶中的道路识别。
(4)属性标注 :属性标注俗称打标签,是用一个或 多个标签标注目标物的属性。一般是从既定的标签中选 择数据对应的标签,是封闭集合。可以将不同的图片根 据场景进行分类 ;也可以对目标进行性别、年龄、全身、 着装等进行标注。
数据标注是人工智能发展过程中必不可少的一个环节, 数据标注行业的需求在持续增长,选一个易用、高效的标 注工具才能在竞争中取胜。数据标注讲究高效准确,一个 好用的工具,可以帮助团队节约成本、提高标注效率。目 前业界比较著名的开源或商业的数据标注工具如下:
Labelme 能够对图像进行多边形、矩形、圆、折线, 点形式的标注。
LabelImg 是一款标框标注工具。
VGG 是一款开源软件,支持在线或离线使用,能标 注矩形、圆、椭圆、多边形、点和折线标注。
OpenCV/CVAT网页版视频图像标注 工具,通过 Docker 进行部署,安装特定的环境及依赖 库,打开谷歌 Chrome 浏览器去访问。
Labelbox 是国外的一款在线标注工具,界面简洁。
VOTT,微软发布的基于 Web 方式本地部署的视觉数据标 注工具,支持图像与视频数据标注。