{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "(ch:computer-vision-advanced)=\n", "# 컴퓨터 비전" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**감사의 글**\n", "\n", "아래 내용은 프랑소와 숄레의 \n", "[Deep Learning with Python(2판)](https://github.com/fchollet/deep-learning-with-python-notebooks)의 \n", "소스코드 내용을 참고해서 작성되었습니다.\n", "자료를 공개한 저자에게 진심어린 감사를 전합니다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**소스코드**\n", "\n", "여기서 언급되는 코드를\n", "[(구글 코랩) 컴퓨터 비전](https://colab.research.google.com/github/codingalzi/dlp2/blob/master/notebooks/NB-computer_vision_advanced.ipynb)에서 \n", "직접 실행할 수 있다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**슬라이드**\n", "\n", "본문 내용을 요약한 [슬라이드](https://github.com/codingalzi/dlp2/raw/master/slides/slides-computer_vision_advanced.pdf)를 다운로드할 수 있다." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**주요 내용**" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- 합성곱 신경망의 주요 활용 분야(컴퓨터 비전)\n", " - 이미지 분류\n", " - 이미지 분할\n", " - 객체 탐지\n", "- 합성곱 신경망 기본 아키텍처\n", " - 잔차 연결\n", " - 배치 정규화\n", " - 채널 분리 합성곱" ] }, { "cell_type": "markdown", "metadata": { "colab_type": "text" }, "source": [ "## 컴퓨터 비전 주요 과제" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "컴퓨터 비전 분야에서 가장 주요한 연구 주제는 다음과 같다.\n", "\n", "- 이미지 분류(image classification): 이미지에 포함된 사물(들)의 클래스 분류\n", " - 단일 라벨 분류(single-label classification)\n", " - 예제: 한 장의 사진에서 고양이, 강아지, 사람, 자전거, 자동차 등 중에하 하나의 클래스 선택 \n", " - 다중 라벨 분류(multi-label classification)\n", " - 예제: 한 장의 사진에 포함된 여러 종류의 객체를 모두 분류.\n", " 예를 들어 두 사람이 자전거를 타는 사진에서 두 사람과 자전거 등 사진에 포함된 모든 객체의 클래서 확인.\n", "- 이미지 분할(image segmentation): 이미지를 특정 클래스를 포함하는 영역으로 분할\n", " - 예제: 줌(Zoom), 구글 미트(Google Meet) 등에서 사용되는 배경 블러처리 기능\n", "- 객체 탐지(object detection): 이미지에 포함된 객체 주의에 경계상자(bounding box) 그리기\n", " - 예제: 자율주행 자동차의 주변에 위치한 다른 자동차, 행인, 신호등 등 탐지 기능" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "