上一节我们讲了环境的安装,这节我们开始讲一下数据集的组成和查看以及怎么创建新的数据集。
我们以测试的数据集coco128为例:
coco128文件夹里主要看imageslables文件夹,以及coco128.yaml

coco128数据集说明

images:图片文件夹,存储的是我们的图片文件
图片alt
lables:标签文件夹,存储的是我们标注的信息,关于标注信息里面的内容,我们后面详细说明
图片alt
coco128.yaml:训练用的配置文件

coco128.yaml说明

path: ../datasets/coco128 # 也就是需要训练的图片的根目录
train: images/train2017 # 训练的图片的路径
val: images/train2017 # 验证图片的路径,训练的时候,yolo会在这里面抽取一些图片作为验证
test: # 测试图片的路径

# 所有标注的类型,他们总是必须是 序号:名称 的方式记录的
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# 下载文件的地址,当你的程序里面没有这个coco128文件的时候,他会自动在这里面下载,这里不需要理会
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zip

lables里面的内容说明

注意:lable里面的txt文件文件名称和图片名称是一一对应的。你可以在images里面找到一张叫000000000009.xxx的图片我们打开000000000009.txt这个文件看一下,以这个文件为例。注意:lable里面的txt文件文件名称和图片名称是一一对应的。你可以在images里面找到一张叫000000000009.xxx的图片,内容如下:

45 0.479492 0.688771 0.955609 0.5955
45 0.736516 0.247188 0.498875 0.476417
50 0.637063 0.732938 0.494125 0.510583
45 0.339438 0.418896 0.678875 0.7815
49 0.646836 0.132552 0.118047 0.096937
49 0.773148 0.129802 0.090734 0.097229
49 0.668297 0.226906 0.131281 0.146896
49 0.642859 0.079219 0.148063 0.148062

我们拿这一段来说明45 0.479492 0.688771 0.955609 0.5955
45:对应着coco128.yaml里面的标注的类型里的45: bowl,也就是碗。
0.479492 0.688771 0.955609 0.5955:是标注的位置信息,我们这样看不清楚。接下来我们就可以打开大漠Yolo综合工具.exe查看。

在大漠Yolo综合工具查看标注的信息

1、打开工具的页面是这样的:
图片alt
选择Yolo根目录这里,应该选择整个项目的目录,不是yolo的项目路径:比如我的yolo是这样存的:E:\yolo\yolov5-7.0,那么你应该选择的目录是E:\yolo

2、进入软件的时候,打开数据集
图片alt
这个时候它会自动读取coco128.yaml里面的标注的名称,显示在右边。
图片alt

3、接下来选择我们的图片目录
图片alt
这个时候我们就可以看到里面已经标注好的信息了。
图片alt

新建数据集

1、打开大漠Yolo综合工具.exe,点击新增,输入数据集的名称,注意:不要使用中文的名称
图片alt

2、我建了一个以游戏名称对应的名字wu_xia_li_xian_ji,武侠历险记。新建完成之后,我们到我们的datasets文件夹下去看看。工具已经自动帮我们建立了一个文件夹模板

E:.
│  wu_xia_li_xian_ji.yaml
│
├─images
└─labels
└─wu_xia_li_xian_ji.yaml

这个文件夹模板跟前面的测试用的文件夹是一样的。这样,我们就完成了新的数据集的创建。下一节我将介绍怎么采集和标注数据。