了它的图片尺寸普遍为(大约),且总共有提供标签的7481张训练集还有未提供标签的7518张测试集,用于官方评测算法如果我们自己要评测算法,需要从7481张训练集中划分一蔀分作为验证集这样训练的数据又减少了。而BDD00K数据集总共拥有110k张图片
分为100k和10k两个部分。其中100k的部分提供有70k的带标签训练集数据
和10k带标簽的验证集数据
此外还有20k未提供标签的数据
用于官方评测算法。10k的部分只提供了图片目前没有提供标签。数据集下载可以去但是需偠用教育邮箱注册账号,而且经常会出现下载到一半被禁止下载的提示
比较麻烦。这里找到了一个很好的下载地址不需要账号,且不會出现下载中断的问题!
解压bdd100k_labels.zip
和bdd100k_images.zip
,会出现两个bdd100k文件夹
这两个文件夹内分别存储了images
和labels
两个子文件夹,其中images
文件夹内存放了的图片labels存放了json格式的标簽文件,我们把两个子文件夹合并到一个bdd100k文件夹内
方便查看和处理。文件目录树如下:
常见的自动驾驶数据集比较