Home [AI]Object Detection 기초
Post
Cancel

[AI]Object Detection 기초

Object Detection Basic

이미지 내에서 객체를 식별하는 Task

Segmentation

  • Semantic Segmentation
    • 서로 다른 영역을 구분
    • 같은 class에 대해서 구분하지 않는 작업
  • Instance Segmentation
    • 객체의 영역을 구분
    • 같은 class를 분리하여 식별하는 작업

Real world

  • 자율주행
  • OCR
  • 스마트 팜
  • 흉부 X-ray 이상 탐지

Evaluation Metric

성능

  • Confusion matrix
    • True / False: 정답 Label의 여부
    • Positive / Negative: 예측 Label의 여부
    • True Positive(TP): 검출 되어야할 것이 검출
    • True Negative(TN): 검출되지 말아야할 것이 검출되지 않음
    • False Positive(FP): 검출되지 말아야할 것이 검출됨
    • False Negative(FN): 검출되어야 할 것이 검출되지 않음

  • Precision
    • $Precision = \frac{TP}{TP + FP} = \frac{TP}{All-Detections}$
    • 모든 예측에 대한 Positive의 비율
  • Recall
    • $Recall = \frac{TP}{TP + FN} = \frac{TP}{All\ Ground\ Truths}$
    • 모든 정답 Label들에 대한 예측 비율

  • PR Curve
    • Ground Truth가 10개라고 가정
    • 예측한 n(=10)개의 레이블을 Confidence 기준 내림차순으로 정렬
    • 아래 표의 Precision과 Recall에 대한 그래프를 의미
    • $AP =$ 그래프 아랫 면적

예제

CategoryConfidenceTP/FP누적 TP누적 FPPrecisionRecall
1Plastic95%TP1-1/1 = 11/10 = 0.1
2Plastic90%TP2-2/2 = 12/10 = 0.2
3Plastic82%FP2-2/3 = 0.672/10 = 0.2
4Plastic80%TP3-3/4 = 0.753/10 = 0.3
5Plastic72%TP4-4/5 = 0.84/10 = 0.4
6Plastic70%FP4-4/6 = 0.674/10 = 0.4
7Plastic60%TP5-5/7 = 0.715/10 = 0.5
8Plastic41%FP5-5/8 = 0.635/10 = 0.5
9Plastic32%FP5-5/9 = 0.565/10 = 0.5
10Plastic10%TP6-6/10 = 0.66/10 = 0.6

  • IoU(Intersection over Union)
    • Ground truth 영역과 predict 영역이 겹친 정도 혹은 비율
    • $IoU = \frac{overlapping\ region}{combined\ region}$

속도

  • FPS(Frames per Second)
    • 초당 처리 속도
    • 성능에 비례
  • FLOPs(Floating Point Operations)
    • 연산량 횟수(곱하기, 더하기, 빼기 등)
    • $Convolution\ layer\ Flops = C_{in} * C_{out} * K * K * H_{out} * W_{out}$

Library

MM Detection

  • Pytorch 기반 Object detection 오픈소스

Detectron2

  • 페이스북 AI 리서치의 라이브러리
  • Pytorch 기반의 Object detection/segmentation 알고리즘 제공

YOLOv5

  • COCO 데이터셋으로 사전 학습된 모델
  • 수천 시간의 연구와 개발에 걸쳐 발전된 Object detction 모델
  • Colab, Kaggle, Docker, AWS, GCP 등에서 오픈소스 제공

EfficientDet

  • Google Research & Brain에서 연구한 모델
  • EfficientNet을 응용하여 만든 Object detection 모델
  • Tensorflow로 제공
  • Github에 Pytorch 기반으로 구현된 라이브러리 존재
This post is licensed under CC BY 4.0 by the author.