介绍
事实证明,在现代世界中,分割的任务要解决一两次,尽管我认为这是一件复杂而令人惊讶的事情。所需要做的只是阅读几篇文章,安装某些库并标记数据,除了创建测试样本外,所有内容都需要花费几个小时的时间。
数据标记
就人类工作而言,实现视频流帧分割的这一步骤是最费力的工作之一。
为此,您需要使用特殊程序来标记视频流的帧。我们只是使用此程序打开所需的视频文件,并标记了帧,并在之前创建了将图像分段的类。在我的介绍性示例中,镜头分为以下几类(汽车,道路,人行横道,草坪,建筑物,人,人行道,道路标记)。
实际上,诸如道路,建筑物,草坪,人行道等位置。由于在这种情况下相机是固定的,因此这些区域将始终位于同一位置,因此可能无法识别它。
训练神经网络进行图像分割
( , ).
.
, . 4 (, , ... , , , ) 60 DeepLab v3+ ( ResNet-18). . 2.
, , , . .
, (. 3 4), .
, (. 5 6).
, , (. 7 9). (. 8).
3%, 54%. , . , , , . .
, . ( ), , .
- , . ( , ), . ., . , . , , . , , , , , , .
PS如果有人知道可以使用什么软件来尽可能简单地记录来自YouTube流的视频流?