DEVELOPER
close
프로필 배경
프로필 로고

DEVELOPER

  • Developer (170)
    • Python (87)
      • Python입문 (21)
      • Python내장함수 (17)
      • Python모듈 (15)
      • Python 기타자료 (9)
      • Numpy (8)
      • Pandas (9)
      • Matplotlib (6)
    • Unity (1)
      • Unity입문 (13)
      • Unity 오류해결 (3)
      • Unity 이론 (5)
      • Unity 관련자료 (2)
    • Machine learning (44)
      • Deep learning Basic (2)
      • CNN Network (19)
      • RNN Network (7)
      • Yolo3 (5)
      • Pose Estimation (10)
      • 딥러닝 이론 (0)
    • Tistory (1)
      • SIMPLE LINE_SKIN_1 (1)
    • programing language (3)
      • Pytorch (3)
    • Etc (10)
      • Kinect (4)
      • OpenCV (3)
      • Visualstudio (2)
      • 컴퓨터 용어 (1)
    • 프로젝트 후기 (1)
    • Java (0)
      • Java 기초 (0)
  • 파이썬 강좌 목차
  • Numpy, Pandas, Matplotlib 강좌 목차
  • 딥러닝 강좌 목차
  • 유니티 강좌 목차

ITOP Dataset 사용법

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. ITOP Dataset(Invariant Top View)는 사람의 측면과 상단 View에서 촬영한 100,000개의 Depth image를 가지고 있는Dataset이다. 각 Depth image에 대해 15개의 Human body parts를 가지고 있으며 센서 위치를 기준으로 3차원(x , y, z)좌표로 레이블되어 있다. 뿐만 아니라 Segmentation, point Clouds 등과 같은 정보도 제공한다. ITOP Dataset 다운로드와 사용법 ITOP Dataset은 다음 링크를 통해 다운로드 받을 수 있다..

  • format_list_bulleted Machine learning/Pose Estimation
  • · 2021. 3. 10.
  • textsms
[비전공자도 이해하는 딥러닝 (1)] 인공지능과 데이터의 상관관계

[비전공자도 이해하는 딥러닝 (1)] 인공지능과 데이터의 상관관계

☞ 문서의 이미지와 내용은 가장 하단 참고문헌 및 사이트를 참고했습니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. 데이터를 활용하는 프로그래밍 책 'Dive into Deep Learning'에서는 다음과 같은 말이 나온다. "코드를 이용하는 프로그래밍과 데이터를 활용하는 프로그래밍은 차이가 있다." 우리가 실생활에 자주 사용하는 프로그램은 코드를 이용하는 프로그래밍으로 데이터를 필요로 하지 않는다. 쉽게 이해하기 위해서 아래와 같은 예를 들어보자. 첫 째 : 전자레인지를 동작하는 프로그래밍은 다양한 조건에서 동작을 정확하게 작동하게 만드는 몇 가지 논리와 규칙만 존재하면 된다. 둘째 : 주민 번호를 인식하는 프로그래밍은 6자리를 포함해야 하며 앞 2자리는..

  • format_list_bulleted Machine learning/Deep learning Basic
  • · 2021. 3. 5.
  • textsms
AlexNet

AlexNet

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. AlexNet AlexNet은 ILSVRC의 2012년 대회에서 Top 5 test error 15.4%를 기록하여 1위를 차지한 네트워크로 CNN의 우수함을 전세계에 입증한 네트워크로 AlexNet 네트워크 이후로 CNN구조의 GPU구현과 dropout 적용이 보편화 되었다. AlexNet의 논문 이름은 ImageNet Classification with Deep ConvConvolutional Neural Networks이다. AlexNet구조 AlexNet의 구조는 LeNet-5과 크게 다르지 않다. 위 아래로 f..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 3. 5.
  • textsms
V2V-PoseNet : Voxel-to-Voxel Prediction Network for Accurate 3D Hand and Human Pose Estimation from a Single Depth Map

V2V-PoseNet : Voxel-to-Voxel Prediction Network for Accurate 3D Hand and Human Pose Estimation from a Single Depth Map

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. 요약 기존 딥러닝 방법의 대부분은 2차원 Depth map에서 손 또는 인체 관절과 같은 Key point의 3차원 좌표를 2차원 컨볼루션 신경망을 통해 직접 회귀하는 프레임 워크를 기반으로 한다. 이 접근 방식은 두 가지 약점을 가지고 있다. 첫 번째는 2D Depth map에 원근 왜곡이 있다는 것이다. Depth map은 본질적으로 3차원 데이터이지만 3차원에서 2차원 공간으로의 투영된 2차원 이미지이다. 이는 Perspective Distortion문제를 일으킬 수 있다. 두 번째는 2차원 이미지에서 3차원 좌표..

  • format_list_bulleted Machine learning/Pose Estimation
  • · 2021. 2. 18.
  • textsms
데이터 스케일링(Data Scaling)

데이터 스케일링(Data Scaling)

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. 머신러닝을 위한 Data set을 정제할 때, 특성별로 데이터의 Scale이 다르면 머신러닝이 잘 작동하지 않게 될 수 있다. 예를 들어 X1 특성은 0부터 1사이의 소수값을 가진다. X2 특성은 100000부터 100000000사이의 소수값을 가진다. y 값은 1000000부터 100000000까지의 값을 가진다. 그렇다면 X1의 특성은 y를 예측하는데 큰 영향을 주지 않는 것으로 생각 할 수 있다. 이 외에도 overflow, underflow 등의 문제가 있을 수 있다. 때문에 데이터 스케일링 작업을 통해 모든 특..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 22.
  • textsms
Class Activation Map-Learning Deep Features for Discriminative Localization(CAM)

Class Activation Map-Learning Deep Features for Discriminative Localization(CAM)

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. Class Activation Map 기존의 CNN에서 사용이 되는 모델은 Convolution Layer가 여러 겹 쌓여있고 마지막에 Fully-connected layer(FCL)로 이어져 분류하여 뛰어난 성능을 보여준다. 하지만 이렇게 FCL로 Flatten할 때 Convolution이 가지고 있던 각 픽셀들의 위치 정보를 잃게 된다. 따라서 분류 정확도가 아무리 좋아도 무엇을 보고 그 class를 판별했는지 알 수 없다. 본 논문에서는 FCL을 GAP(Global Average Pooling)로 변경하여 위치 정..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 21.
  • textsms
[Deep Learning, CNN, PyTorch Code] LeNet-5

[Deep Learning, CNN, PyTorch Code] LeNet-5

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. LeNet Yann LeCun은 "Gradinet-based learning applied to document recognition" 논문에서 손글씨 숫자를 인식하는 문제를 해결하기 위해 LeNet을 고안했다. ( Image Class에서 보편적으로 사용되는 CNN(Convolution Neural Network)을 최초로 제안한 모델이다. ) 기존에 classifier로 사용되던 fully-connected layer, 즉 MLP(Multi-Layer Perceptron)는 다음과 같은 문제점이 있었다. 첫 번째로 ..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 20.
  • textsms
GoogLeNet

GoogLeNet

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. 네트워크의 성능을 향상하는 직관적인 방법은 네트워크의 크기를 늘리는 것이다. 이 크기는 보통 넓이와 깊이를 의미하며 넓이는 노드의 개수(파라미터의 개수)를 의미하며 깊이는 레이어의 계층 수를 말한다. 다시 말해 성능을 올리고 싶으면 노드 수를 늘리고 레이어를 많이 쌓으면 된다. 하지만 무작정 네트워크의 크기를 늘린다고 성능이 좋아지지 않는다. 큰 네트워크는 구조적으로 두 가지 문제점을 가지게 된다. 첫 번째로 많은 파라미터를 가지게 된다. 파라미터의 개수가 많아지면 Over fitting 일어날 가능성이 높다. 두 번째..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 18.
  • textsms
VGG - Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG - Very Deep Convolutional Networks for Large-Scale Image Recognition

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. 많은 CNN 분류 모델들 중 하나로 VGGNet은 옥스퍼드 대학에서 개발됐으며 2014년 ImageNet Challenge에서 정확도 92.7%를 달성하며 준우승 한 모델이다. VGGNet의 논문 이름은 Very Deep Convolutional Networks for Large-Scale Image Recognition 이다. VGGNet은 신경망 모델의 깊이(layer)에 따라 VGG16, VGG19로 불린다. 아래 그림을 보면 VGGNet을 시작으로 네트워크의 깊이가 확 싶어 지는 것을 확인할 수 있다. VGGNe..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 18.
  • textsms
Fully Convolutional Networks for Semantic Segmentation(FCN)

Fully Convolutional Networks for Semantic Segmentation(FCN)

☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. Fully Convolutional Networks(FCN) Fully Convolutional networks(이하 FCN)은 제목에서 나타나듯 Semantic Segmentation문제를 위해 제안된 딥러닝 모델이다. Semantic Segmentation은 단순히 BB(bounding box)을 하는 문제가 아니라 이미지를 pixel단위로 구분해 각 pixel이 어떤 물체 class인지 구분하는 문제이다. FCN은 기존에 이미지 분류에서 사용된 CNN기반 모델(AlexNet, VGG, GoogLeNet)을 Segm..

  • format_list_bulleted Machine learning/CNN Network
  • · 2021. 1. 14.
  • textsms
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • 5
  • navigate_next
전체 카테고리
  • Developer (170)
    • Python (87)
      • Python입문 (21)
      • Python내장함수 (17)
      • Python모듈 (15)
      • Python 기타자료 (9)
      • Numpy (8)
      • Pandas (9)
      • Matplotlib (6)
    • Unity (1)
      • Unity입문 (13)
      • Unity 오류해결 (3)
      • Unity 이론 (5)
      • Unity 관련자료 (2)
    • Machine learning (44)
      • Deep learning Basic (2)
      • CNN Network (19)
      • RNN Network (7)
      • Yolo3 (5)
      • Pose Estimation (10)
      • 딥러닝 이론 (0)
    • Tistory (1)
      • SIMPLE LINE_SKIN_1 (1)
    • programing language (3)
      • Pytorch (3)
    • Etc (10)
      • Kinect (4)
      • OpenCV (3)
      • Visualstudio (2)
      • 컴퓨터 용어 (1)
    • 프로젝트 후기 (1)
    • Java (0)
      • Java 기초 (0)
최근 글
인기 글
태그
  • #파이썬
  • #맥북
  • #유니티 입문
  • #맥북 파이썬
  • #유니티
  • #python 기초
  • #cnn
  • #python 입문
  • #python
  • #yolo
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바