Information
# Ku-YOLO Waste Classification Dataset
쓰레기 분류를 위한 YOLO 형식 데이터셋입니다. TACO 데이터셋을 기반으로 재활용품 객체 탐지를 위해 재구성되었습니다.
## 데이터셋 개요
- **총 이미지 수**: 1,500개
- **총 어노테이션 수**: 4,784개
- **이미지 형식**: JPG
- **어노테이션 형식**: YOLO TXT
## 클래스 정보
### 5개 대분류 (labels_5classes)
| ID | 클래스 | 영문 | 어노테이션 수 | 비율 |
|----|--------|------|--------------|------|
| 0 | 플라스틱 | Plastic | 1,443 | 30.16% |
| 1 | 비닐 | Vinyl | 845 | 17.66% |
| 2 | 캔 | Can | 552 | 11.54% |
| 3 | 유리 | Glass | 254 | 5.31% |
| 4 | 종이 | Paper | 1,690 | 35.33% |
### 60개 세부 분류 (labels)
플라스틱 병, 유리병, 음료수 캔, 종이컵, 비닐봉투 등 60개의 세부 카테고리로 구성되어 있습니다.
자세한 클래스 목록은 \`labels/classes.txt\`를 참고하세요.
## 디렉토리 구조
\`\`\`
.
├── data/ # 이미지 데이터
│ ├── batch_1/
│ ├── batch_2/
│ └── ... (batch_15까지)
│ └── annotations.json # COCO 형식 원본 어노테이션
├── labels/ # YOLO 레이블 (60개 클래스)
│ ├── batch_1/
│ ├── batch_2/
│ └── ...
│ ├── classes.txt
│ └── data.yaml
├── labels_5classes/ # YOLO 레이블 (5개 대분류)
│ ├── batch_1/
│ ├── batch_2/
│ └── ...
│ ├── classes.txt
│ ├── classes_kr.txt
│ └── data.yaml
├── coco_to_yolo.py # COCO → YOLO 변환 스크립트
├── remap_to_5_classes.py # 60개 → 5개 재분류 스크립트
└── README.md
\`\`\`
## 사용 방법
### YOLOv8 학습 예시 (5개 클래스)
\`\`\`python
from ultralytics import YOLO
# 모델 로드
model = YOLO('yolov8n.pt')
# 학습
results = model.train(
data='labels_5classes/data.yaml',
epochs=100,
imgsz=640,
batch=16,
name='waste_classification_5class'
)
# 추론
results = model.predict('path/to/image.jpg')
\`\`\`
### YOLOv8 학습 예시 (60개 클래스)
\`\`\`python
from ultralytics import YOLO
model = YOLO('yolov8n.pt')
results = model.train(
data='labels/data.yaml',
epochs=100,
imgsz=640,
batch=16,
name='waste_classification_60class'
)
\`\`\`
### 데이터셋 로드
\`\`\`python
from datasets import load_dataset
dataset = load_dataset("hyeon2525/Ku-Yolo-DataSet")
\`\`\`
## 데이터 형식
### YOLO 어노테이션 형식
각 이미지에 대응하는 \`.txt\` 레이블 파일:
\`\`\`
\`\`\`
- \`class_id\`: 클래스 ID (0부터 시작)
- \`x_center, y_center\`: 바운딩 박스 중심 좌표 (0~1로 정규화)
- \`width, height\`: 바운딩 박스 크기 (0~1로 정규화)
예시:
\`\`\`
3 0.481783 0.384578 0.290826 0.645193
0 0.325678 0.562341 0.145823 0.234567
\`\`\`
## 원본 데이터
- **출처**: TACO (Trash Annotations in Context)
- **라이선스**: MIT
- **원본 형식**: COCO
- **변환 일자**: 2020-08-13
## 활용 사례
- 쓰레기 자동 분류 시스템
- 재활용품 인식 애플리케이션
- 환경 모니터링 시스템
- 컴퓨터 비전 교육용 데이터셋
## Citation
이 데이터셋을 사용하는 경우, 원본 TACO 데이터셋을 인용해주세요:
\`\`\`bibtex
@dataset\{taco_dataset,
title=\{TACO: Trash Annotations in Context\},
author=\{Pedro F Proença and Pedro Simões\},
year=\{2019\}
\}
\`\`\`
## 라이선스
MIT License
## 문의
데이터셋 관련 문의사항은 이슈를 남겨주세요.