카테고리 없음

[OpenCV] 2개의 데이터셋 합치기

콜라드리블 2024. 4. 11. 21:44
작성자 김명원
일 시 2024. 4. 11  (목) 18:00 ~ 21:00
장 소 복지관 b128-1호
참가자 명단 임혜진, 이재영, 성창민, 김명원, 장원준
 사 진

 

YOLOv8 모델을 학습시키고 사용하는 과정에서 조금 더 나은 가중치가 필요하다고 느꼈다. 그래서 더 많은 데이터를 활용해 학습시키로 했다. roboflow에 있는 클라이밍 홀드 데이터를 색도 구별 돼있는 데이터와 구별이 되어있지 않은 데이터로  나눌 수 있다. 색이 구별되어 있지 않은 데이터셋으로 모델을 학습 시켰을 경우에는 꽤 정확한 가중치를 얻을 수 있었는데 색이 구별되어 있지 않은 데이터셋은 데이터가 많지 않아서 좋은 가중치를 얻어내지 못했다.그래서 생각해낸 방법이 색이 구별되어 있는 여러 데이터셋들을 합쳐서 학습을 시키기로 했다. 

 

roboflow에서 있는 여러 데이터셋들을 합치기 위해 roboflow의 새로운 프로젝트를 만들어 해줬다.

https://app.roboflow.com 

 

Sign in to Roboflow

Even if you're not a machine learning expert, you can use Roboflow train a custom, state-of-the-art computer vision model on your own data.

app.roboflow.com

 

이곳에 들어가 Create New Project를 들어가 Project Name을 Cliving으로 정하고 Annotation Group을 hold로 정했다.

 

그 뒤, 내가 고른 데이터셋들을 모두 업로드한다. 만약 라벨링이 되어 있지 않은 다른 데이터셋을 가져왔다면 Not Annotated로 분류되지만 roboflow에 있는 데이터들은 이미 라벨링이 되어있기 때문에 Annotated로 분류된다.

 

그리고 이 이미지를 저장하면 

 

이런식으로 train, valid, test데이터의 비율을 정할 수 있다.

 

그럼 Class를 자동으로 정해주고 내가 나눈 비율로 traning, validatoin, testing set으로 저장된다. 

그리고 데이터셋을 추출하면 원래 우리가 사용했던 데이터셋처럼 사용할 수 있게 된다.

 

2개의 데이터를 합쳐서 학습을 해보았는데
예상했던 것보다 좋은 결과를 얻지 못했다.
데이터를 합치는 과정에서 매끄럽지 않았던
부분들이 있었던 거 같아 아쉬움이 남는다