Lecture 1: Introduction

  • AI는 다양한 산업에 널리 적용되고 있다
  • AI가 최근들어 가능해진 이유
    • 데이터셋이 충분한 크기로 공급됨
    • 하드웨어의 발전
    • 학습 기술의 발전
  • Computer Vision이란? 시각 정보를 추출하고 해석하는 학문
  • Computer Vision의 분야
    • 공간/기하학: 모양을 복구, 깊이 측정, 3차원 현장 복구→자율주행에 중요
    • 시간/역학: 오브젝트 추적, 영상 이해, 움직임 이해
    • 의미론: 오브젝트 탐지, 포즈 추정, 의미론적 이해

이 수업에서는 3D에 주로 치중, 의미론은 거의 안다룸

주로 다룰 내용:

image.png

  • 공간/기하학: 기하학적 툴을 활용해 이미지로부터 공간특성과 장면을 이해함
    • 카메라 시스템: 3d→2d, 카메라는 어떻게 조정할지? 2d정보로 3d정보를 추출할 수 있는지? 여러 시점에서 보면 기하학적 의미를 얻을 수 있는지?
    • 움직임으로부터 구조 파악
    • 건축물을 3d 모델링: 어떻게 정확하게 3d로 복구할 수 있는지?
    • 증강현실
  • 시간/역학: 머신러닝을 통해 의미론적, 역학적 특성을 추정
    • 표현과 표현학습: 이미지 특징 추출
    • 깊이 추정과 feature tracking
    • 광학적 흐름, 장면 흐름
    • 오브젝트 추적을 위한 최적의 추정
    • 시각 합성을 위한 뉴럴 필드
    • 자동 주행과 안전
    • 개인화된 로보틱스
    • 그 외: 공장 조사, 어시스트, 감시, 원격 로봇 등