작성자 | 장원준 |
일 시 | 2024. 3.21 (목) 18:00 ~ 21:00 |
장 소 | 복지관 b128-1호 |
참가자 명단 | 임혜진, 이재영, 성창민, 김명원, 장원준 |
사 진 | ![]() |
진행 중인 프로젝트를 하다 사람의 손의 위치를 어떻게 탐지해야하는지를 고민하던 중 exercise-pose-analyzer 에 대한 깃허브를 보게 되었고 그 모델에서 코코 데이터셋을 쓰는 것을 보고 알아보게 되었다.
COCO dataset은 Object detection 에서 자주 쓰이는 데이터셋인데
Object detection 이란
컴퓨터 비전의 분야에서, 이미지나 비디오에서 객체를 탐지하고, 해당 객체의 위치와 크기를 식별하는 기술로서, 이미지나 비디오에서 여러 개의 객체를 감지하고, 분류하는 작업을 수행합니다. 객체 검출, 감지로 하나의 이미지 안에서 찾는 물체의 개수에 따라 Single-Object Detection과 Multi-Object Detection이 있습니다. Object Detection에서 이미지를 입력했을때 Classification(분류)뿐 아니라 Localization(bounding box)까지 찾아줍니다.
이와 같은 객체 감지를 하기 위해 자주 쓰이는 데이터셋이 COCO dataset인데
COCO dataset 의 특징으로는
- 객체 분할(Object segmentation)
- 사진에서 객체 인식(Recognition in context)
- 슈퍼픽셀 분할(Superpixel segmentation)
- 33만장의 이미지, 라벨링된 20만장의 이미지
- 150만개 이상의 객체 표시(1.5 million object instances)
- 80개의 객체 카테고리
- 이미지 당 5개 이상의 캡션(텍스트로 된 그림에 대한 설명)
이 데이터셋을 이용하면 모델 성능 개선에 유용하게 이용 가능하고
이 데이터셋을 이용하기 위해서는
https://cocodataset.org/#home
COCO - Common Objects in Context
cocodataset.org
위 링크로 들어가서
Dataset이라 쓰여진 곳을 클릭한 후 원하는 데이터셋을 골라 다운 후 사용하면 됩니다.
COCO Explorer 을 클릭하면 이렇게 다양하게 분류가 되어있는 것을 확인 할 수 있고 위에서 필요한 카테고리를 고른 후 데이터셋을 다운 받아서 사용하면 프로젝트에도 확실히 도움이 될 것 같습니다.
확실히 이번에 데이터셋에 대해서도 공부해보고 찾아보며 여태 어떤 딥러닝 모델을 써야하는지에 대해서만 고민하고 서치 했는데 효율적으로 모델 성능을 업그레이드 하기 위해서는 어떤 데이터를 쓰는지도 중요함을 느끼게 되었습니다.