作者wargods8402 (维尼X维尼)
看板DataScience
标题[问题] Json转yolo格式问题
时间Wed Jul 17 13:06:51 2019
作业系统:linux ubuntu16.04
问题类别:Dataset 转换问题
使用工具:python
问题内容:目前在使用YoloV3做object detection。
在图片资料库的部分,格式要配合Yolo的格式,必须将目前拿到的非Yolo格式的图片资料
库格式做转换。
那目前的困难是,手上拿到的标注格式是.json的档案,要转换成Yolo格式,目前找不到
可以直接转换的工具。
希望有前辈能指点一下,哪边有可以参考的现成转换格式Code,或是有可以转换的工具软
体。
由於小弟入门的时间只有三个月,再麻烦前辈鞭小力一点…谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 163.21.76.158 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1563340013.A.673.html
1F:推 sxy67230: 这个东西叫pascal VOC format,因为大家都不知道你的jso07/17 13:54
2F:→ sxy67230: n格式是长怎样,要写转换器就要你自己写,有tool 叫xmlj07/17 13:54
3F:→ sxy67230: son可以转换,但是格式你要自己转07/17 13:54
先谢谢S大,我的理解是这样,pascal的data format应该是使用.xml做为标注档的格式,
Yolo则是使用.txt格式。
这样要转换的话,是否要透由json转xml再转txt呢?
不知道S大能否提供一下转换工具的相关资讯,我一直都只有看到网页版的转换工具,且
无法批次转换,我一共有4千多笔要转,可能会转到往生…
我有找到对岸写的COCO data转Yolo data format相关code,测试过後是能转换的,但是C
OCO data是把所有的标注资讯全部合在一个Json档里…
而我的资料是一笔一笔分开的,跟Pascal的放置方式是一样的,只是一个是xml,一个是j
son
现在要解析资料不知道从何下手…
因为,不确定COCO data是否与我手上现有的format是否一样…
小弟等等在补上标注档的连结,麻烦S大指点了,谢谢
※ 编辑: wargods8402 (163.21.76.158 台湾), 07/17/2019 14:46:44
连结如下:
https://reurl.cc/mmbn7
※ 编辑: wargods8402 (39.12.12.117 台湾), 07/17/2019 15:10:14
※ 编辑: wargods8402 (39.12.12.117 台湾), 07/17/2019 15:11:56
4F:推 sxy67230: 官方darknet就有voc_label的代码了,但是你要看一下你 07/17 15:32
5F:→ sxy67230: 的json的box是转换个的还是转换前的,转换後其实也不用p 07/17 15:32
6F:→ sxy67230: ascal parser了,直接喂进去对应资料,至於全部都在同一 07/17 15:32
7F:→ sxy67230: 份就要自己写来解析。07/17 15:32
8F:推 sxy67230: 我看到你的资料确实是pascal的形式,代码要自己转换成07/17 15:34
9F:→ sxy67230: 成pascal。07/17 15:34
10F:推 sxy67230: 然後cata_id是已经转换好的,所以可以mark掉class_id转 07/17 15:37
11F:→ sxy67230: 换的代码07/17 15:37
12F:推 sxy67230: 要不然也是可以直接修改Voc label改成吃json格式07/17 15:39
@@什麽…原来可以直接吃吗……不好意思,我对python还没有熟悉…
※ 编辑: wargods8402 (39.12.12.117 台湾), 07/17/2019 15:47:23
13F:推 lukelove: 你要用哪种yolo实做来train也没说清楚 要大家怎麽帮你呢 07/17 19:15
请问L大的Yolo实做是指什麽@@?
14F:推 sxy67230: Python原生就有内建json.load...,建议去k个一个礼拜的P07/17 19:28
15F:推 sxy67230: ython书,yolo的资料都是一样的,就前面的转换这种可以07/17 19:29
16F:→ sxy67230: 自己写07/17 19:29
谢谢S大…Python真的占很重的比例…感谢
目前在研究如何改voc_label.py
※ 编辑: wargods8402 (39.9.34.208 台湾), 07/18/2019 00:01:44
17F:推 remia81: id x y b w 没记错应该是这样,先去看每格的需求,再看07/18 06:58
18F:→ remia81: 资料有什麽转换过去就好了07/18 06:58
目前正在摸索中…转换公式目前确定是正确的,只是转换Code要自己写QQ
19F:推 kyushu: data analysis,data preprocessing, data augmentation07/18 08:47
20F:→ kyushu: 都是重要的一环,建议好好的理解一遍吧 07/18 08:47
是的,谢谢K大…资料分析真的很重要…我一直以为都有流通的open-source dataset...
就不用自己做资料分析了…没想到QQ
※ 编辑: wargods8402 (39.12.194.56 台湾), 07/18/2019 17:45:53