본문 바로가기
728x90
반응형

Deep Learning16

[YOLO] yolo모델의 구조 YOLO 구조를 깊게 이해하려면 backbone, neck, head, 그리고 classification layer의 역할을 확실히 구분하는 게 중요합니다.하나씩 직관적으로 풀어서 설명드릴게요.🧱 1. Backbone (백본)입력 이미지에서 "특징(feature)"을 추출하는 부분역할:원본 이미지(예: 640×640×3 RGB)를 입력받아서 엣지, 패턴, 질감, 형태 같은 저수준~고수준 특징을 점점 압축하며 추출합니다.비유:사람의 눈 + 시각 피질이 “사물의 윤곽”과 “패턴”을 인식하는 역할과 비슷합니다.구성 예시 (YOLOv8/YOLOv11):Conv → BatchNorm → SiLUC2f (Cross Stage Partial blocks)SPPF (Spatial Pyramid Pooling Fast.. 2025. 10. 17.
[DeepLearning] 모델 변환과 FP32-FP16-INT8 📄 TensorRT 모델 변환 및 성능 비교 과정1. ONNX → TensorRT 엔진 변환TensorRT는 ONNX 모델을 최적화하고 GPU 하드웨어에 맞게 변환하는 고성능 추론 엔진입니다. onnx2trt와 trtexec는 TensorRT 엔진으로 모델을 변환하는 도구입니다.onnx2trt용도: ONNX 모델을 TensorRT 엔진으로 변환하는 간단한 CLI 도구장점: 간단하고 빠르게 변환할 수 있음사용법:FP32로 변환: onnx2trt yolov11.onnx -o yolov11_fp32.engine FP16으로 변환:onnx2trt yolov11.onnx -o yolov11_fp16.engine --fp16INT8으로 변환 (calibration 포함):onnx2trt yolov11.onnx -.. 2025. 5. 3.
[DeepLearning] TensorRT 2025.04.13 - [기타] - [컴퓨팅] CUDA / CUDA Toolkit 과 cuDNN [컴퓨팅] CUDA / CUDA Toolkit 과 cuDNNCUDA 란? Compute Unified Device Architecture의 준말로,NVIDIA에서 개발한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델이다.쉽게 말하면, 엔비디아의 GPU 개발 툴이다. 그래픽 처리 장치(GPU)에서 수행하는 (병data-yun.tistory.com 이전 포스팅을 보면 NVIDIA toolkit을 다운받고 이안에 NVIDIA SDK가 담겨 있는 것을 이해할 수 있다. TensorRT TensorRT는 NVIDIA에서 개발한 딥러닝 추론 최적화 엔진이다.기존 딥러닝 프레임워크 (pytorch, tensorflow 등.. 2025. 5. 3.
[영상처리] Moving Average Filter & Gaussian Filter 이동 평균 필터 (Moving Average Filter) 란? 연속된 데이터에서 인접한 n개의 데이터의 평균을 구하여 순차적으로 데이터를 필터링 하는 기법> 연속된 데이터가 급격하게 변화할 때 완화시켜주는 효과 (평활화)  카메라 상 이미지에서의 HSV 값의 노이즈 값(튀는 값)을 완화시키기 위해 이동평균필터를 사용.> 필터 적용 전, 같은 이미지에서도 0.1초 단위로 인식했다가 못했다가를 반복.   인식 bounding box가 생겼다 안생겼다가 반복하여 나타남    = 카메라 노이즈의 튀는 값 있음 > 필터 적용 후, 전보다 나은 인식률(?)    특정 인식 범위를 지속적(sec)으로 인식/비인식    = 튀는 값 완화 수치로만 보면 더 완만해진 초록선을 확인할 수 있음     가우시안 필터 (Ga.. 2025. 3. 3.
728x90
반응형