上一节我们讲了环境的安装,这节我们开始讲一下数据集的组成和查看以及怎么创建新的数据集。
我们以测试的数据集coco128
为例:
coco128文件夹里主要看images
、lables
文件夹,以及coco128.yaml
coco128数据集说明
images
:图片文件夹,存储的是我们的图片文件
lables
:标签文件夹,存储的是我们标注的信息,关于标注信息里面的内容,我们后面详细说明
coco128.yaml
:训练用的配置文件
coco128.yaml说明
path: ../datasets/coco128 # 也就是需要训练的图片的根目录
train: images/train2017 # 训练的图片的路径
val: images/train2017 # 验证图片的路径,训练的时候,yolo会在这里面抽取一些图片作为验证
test: # 测试图片的路径
# 所有标注的类型,他们总是必须是 序号:名称 的方式记录的
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# 下载文件的地址,当你的程序里面没有这个coco128文件的时候,他会自动在这里面下载,这里不需要理会
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco128.zip
lables里面的内容说明
注意:
lable
里面的txt文件文件名称和图片名称是一一对应的。你可以在images
里面找到一张叫000000000009.xxx
的图片我们打开000000000009.txt
这个文件看一下,以这个文件为例。注意:lable
里面的txt文件文件名称和图片名称是一一对应的。你可以在images
里面找到一张叫000000000009.xxx
的图片,内容如下:
45 0.479492 0.688771 0.955609 0.5955
45 0.736516 0.247188 0.498875 0.476417
50 0.637063 0.732938 0.494125 0.510583
45 0.339438 0.418896 0.678875 0.7815
49 0.646836 0.132552 0.118047 0.096937
49 0.773148 0.129802 0.090734 0.097229
49 0.668297 0.226906 0.131281 0.146896
49 0.642859 0.079219 0.148063 0.148062
我们拿这一段来说明45 0.479492 0.688771 0.955609 0.5955
:
45
:对应着coco128.yaml
里面的标注的类型里的45: bowl
,也就是碗。
0.479492 0.688771 0.955609 0.5955
:是标注的位置信息,我们这样看不清楚。接下来我们就可以打开大漠Yolo综合工具.exe
查看。
在大漠Yolo综合工具查看标注的信息
1、打开工具的页面是这样的:
选择Yolo根目录
这里,应该选择整个项目的目录,不是yolo的项目路径:比如我的yolo是这样存的:E:\yolo\yolov5-7.0
,那么你应该选择的目录是E:\yolo
2、进入软件的时候,打开数据集
这个时候它会自动读取coco128.yaml
里面的标注的名称,显示在右边。
3、接下来选择我们的图片目录
这个时候我们就可以看到里面已经标注好的信息了。
新建数据集
1、打开大漠Yolo综合工具.exe
,点击新增
,输入数据集的名称,注意:不要使用中文的名称
2、我建了一个以游戏名称对应的名字wu_xia_li_xian_ji
,武侠历险记。新建完成之后,我们到我们的datasets
文件夹下去看看。工具已经自动帮我们建立了一个文件夹模板
E:.
│ wu_xia_li_xian_ji.yaml
│
├─images
└─labels
└─wu_xia_li_xian_ji.yaml
这个文件夹模板跟前面的测试用的文件夹是一样的。这样,我们就完成了新的数据集的创建。下一节我将介绍怎么采集和标注数据。