인공지능

[PBL] 데이터셋 라벨링

여니두 2019. 10. 1.

1. ffmpeg로 영상 프레임 분할

- 영상이 있는 경로에서 cmd창에 다음과 같이 적어준다.

 

데이터셋 이미지(프레임)들을 object_detection\images 밑에 train, test 디렉토리로 각각 8:2로 나누어 넣어준다.

 

2. labelImg 툴로 라벨링

 

labelImg 디렉토리에서 가상환경을 활성화한 후, 아래 명령을 실행시켜 진행한다.

> (Anaconda prompt) python labelImg.py \images\train

- 박스가 잘 형성되었는지 sizeChecker.py로 확인

> python sizeChecker.py --move

 

- 이미지의 주석들이 반드시 *.xml로 형성되어야 한다.

 

3. class

1) ready

2) low_level

3) high_level

 

4. Label Map 수정

- pbtxt 확장자 파일은 dataset에서 라벨링한 내용을 포함한다.

 

C:\Users\dadad\models-master\research\object_detection\data\label_map.pbtxt 수정

- generate_tfrecord.py 31번째 줄 또한 모델에 맞게 수정한다.

 

5. Creating TensorFlow Records

- 주석이 포함된 dataset을 TFRecord 포맷 형식으로 변환해야 한다.

 

1) Converting from *.xml to *.csv

 xml_to_csv.py 파일을 실행시켜 진행시킨다.

- 이 파일을 실행하기 위해서는 pandas가 필요하기 때문에 pip install pandas로 설치해주고 진행한다.

- 새로 생긴 파일은 object_detection\data 아래에 test_labels.csv, train_labels.csv로 위치하게 된다.

 

2) Converting from *.csv to *.record

 

- test도 똑같이 진행해준다.

 

 

'인공지능' 카테고리의 다른 글

[PBL] Train our own dataset  (0) 2019.10.01
[labeling] Yolo_mark로 라벨링  (1) 2019.09.04
Implementation of YOLO v3 object detector in TensorFlow  (0) 2019.08.22
Violence Detection 분석  (0) 2019.08.09
Violence Detection 실습  (0) 2019.08.05

댓글