Abstract CNN을 이용하여 시공간 비디오를 학습하는 것은 어렵다. 몇몇 연구에서는 3D Convolution을 이용하여 비디오의 공간적 차원과 시간적 차원을 모두 학습할 수 있는 접근 방식이라는 것을 보여줬다. 그러나 3D CNN의 경우 네트워크가 깊으면 높은 계산 비용과 메모리가 발생한다. 이에 논문에서는 3D CNN에 기존 2D 네트워크에서 사용된 ResNet을 변형하여 사용한다. 본 논문에서는 3x3x3 Convolution을 대신하는 병렬 또는 cas-caded 방식으로 1x3x3 Convolution 층과 3x1x1 Convolution 층을 조합하여 feature map에 시간적 연결을 구축한다. 이때 저자는 한 가지의 방식을 제안하는 것이 아닌 residual learning fram..
☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. Fully Convolutional Networks(FCN) Fully Convolutional networks(이하 FCN)은 제목에서 나타나듯 Semantic Segmentation문제를 위해 제안된 딥러닝 모델이다. Semantic Segmentation은 단순히 BB(bounding box)을 하는 문제가 아니라 이미지를 pixel단위로 구분해 각 pixel이 어떤 물체 class인지 구분하는 문제이다. FCN은 기존에 이미지 분류에서 사용된 CNN기반 모델(AlexNet, VGG, GoogLeNet)을 Segm..
☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. YOLO란? YOLO는 You Only Look Once의 약자로 Object detection 분야에서 많이 알려진 모델이다. 처음으로 one-stage-detection방법을 고안해 실시간으로 Object Detection이 가능하게 만들었다. 현재 YOLO, YOLOv2, YOLOv3, YOLOv4, YOLOv5까지 나왔다.(YOLOv4, YOLOv5는 YOLO의 저자와 다른 개발자이다.) 모델마다 변화에 따른 장단점이 있다. YOLO 특징 및 장단점 Yolo의 첫 번째 특징은 이미지 전체를 한번만 보는 것이다. ..
☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. YOLO Maker를 위한 환경 구성하기 ※ YOLO Maker를 이용한 custom 학습 및 검출은 Yolo 환경이 필요합니다. 환경 구축은 링크에서 확인 할 수 있습니다. YOLO Mark 설치 및 실행 이미지에서 객체를 라벨링하기 위해서 Yolo Mark를 다운로드 합니다. 다운로드는 (https://github.com/AlexeyAB/Yolo_mark)에서 할 수 있습니다. 다운로드 받은 Yolo_maker -> yolo_mark.sln을 실행합니다. 빌드 환경을 Release/ x64로 변경합니다. OpenCV..
Yolo(You only look once)란 무엇인가? Yolo는 합성곱 신경망(Convolutional Neural Network) 기반의 모델 중 하나이다. Yolo는 아래의 그림에서 보이는 것 처럼 이전에 나온 다른 CNN보다 최적화가 잘되어 있다. 2020.07.13을 기준으로 Yolo v4가 나와있다. Yolo를 활용하면 특정 물체를 찾고자 하는 다양한 프로그램을 제작할 수 있다. Yolo의 좀 더 자세한 설명이 필요하시면 다음 링크를 참고해주세요. Yolo v3 설치하기 윈도우 버전 Yolo를 설치하기 전 미리 설치되어 있어야 하는 프로그램 Visual Studio (https://visualstudio.microsoft.com/ko/vs/older-downloads/) NVIDIA CUDA..
mAP 합성곱 신경망(Convolutional Neural Network CNN)의 모델 성능 평가는 아래 그림과 같이 mAP를 이용하여 평가하는 것을 볼 수 있다. mAP를 이해하기 위해서는 우선 precision, recall , AP(Average Precision)에 대해 이해해야 한다. ※ Precision-recall 곡선과 , Average precision은 컴퓨터비전(Computer Vision)에서 물체 검출(Object Detection) 알고리즘 성능 평가를 위해 사용되는 방법이다. 예를 들어 2개의 알고리즘이 있다고 하자, 첫 번째 알고리즘은 사람을 검출할 수 있는 검출율이 99%이다. 하지만 1장당 10건 정도의 오검출이 발생된다. 두 번째 알고리즘은 검출율이 50%이다. 하지만..