728x90 반응형 Deep Learning15 [DeepLearning] 모델 변환과 FP32-FP16-INT8 📄 TensorRT 모델 변환 및 성능 비교 과정1. ONNX → TensorRT 엔진 변환TensorRT는 ONNX 모델을 최적화하고 GPU 하드웨어에 맞게 변환하는 고성능 추론 엔진입니다. onnx2trt와 trtexec는 TensorRT 엔진으로 모델을 변환하는 도구입니다.onnx2trt용도: ONNX 모델을 TensorRT 엔진으로 변환하는 간단한 CLI 도구장점: 간단하고 빠르게 변환할 수 있음사용법:FP32로 변환: onnx2trt yolov11.onnx -o yolov11_fp32.engine FP16으로 변환:onnx2trt yolov11.onnx -o yolov11_fp16.engine --fp16INT8으로 변환 (calibration 포함):onnx2trt yolov11.onnx -.. 2025. 5. 3. [DeepLearning] TensorRT 2025.04.13 - [기타] - [컴퓨팅] CUDA / CUDA Toolkit 과 cuDNN [컴퓨팅] CUDA / CUDA Toolkit 과 cuDNNCUDA 란? Compute Unified Device Architecture의 준말로,NVIDIA에서 개발한 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델이다.쉽게 말하면, 엔비디아의 GPU 개발 툴이다. 그래픽 처리 장치(GPU)에서 수행하는 (병data-yun.tistory.com 이전 포스팅을 보면 NVIDIA toolkit을 다운받고 이안에 NVIDIA SDK가 담겨 있는 것을 이해할 수 있다. TensorRT TensorRT는 NVIDIA에서 개발한 딥러닝 추론 최적화 엔진이다.기존 딥러닝 프레임워크 (pytorch, tensorflow 등.. 2025. 5. 3. [영상처리] Moving Average Filter & Gaussian Filter 이동 평균 필터 (Moving Average Filter) 란? 연속된 데이터에서 인접한 n개의 데이터의 평균을 구하여 순차적으로 데이터를 필터링 하는 기법> 연속된 데이터가 급격하게 변화할 때 완화시켜주는 효과 (평활화) 카메라 상 이미지에서의 HSV 값의 노이즈 값(튀는 값)을 완화시키기 위해 이동평균필터를 사용.> 필터 적용 전, 같은 이미지에서도 0.1초 단위로 인식했다가 못했다가를 반복. 인식 bounding box가 생겼다 안생겼다가 반복하여 나타남 = 카메라 노이즈의 튀는 값 있음 > 필터 적용 후, 전보다 나은 인식률(?) 특정 인식 범위를 지속적(sec)으로 인식/비인식 = 튀는 값 완화 수치로만 보면 더 완만해진 초록선을 확인할 수 있음 가우시안 필터 (Ga.. 2025. 3. 3. [DL] ONNX ONNX란? 딥러닝 모델을 저장하고 공유하는 파일 형식.다양한 딥러닝 프레임 워크 (Pytorch, Tensorflow, Keras 등)에서 만든 모델을 공통된 형식을 저장하고 공유할 수 있도록 설계된 파일 포맷이다. 주요 특징 모델 형식- ONNX는 딥러닝 모델의 구조, 연산과정, 학습된 파라미터를 저장하는 표준형식이다.- 데이터를 저장하거나 표현하는 데이터 타입이 아니라, 모델의 청사진을 담는다고 생각하면 된다.- JSON이 여러프로그램이 데이터를 주고 받을 때 사용하는 표준 형식인 것 처럼, ONNX는 딥러닝 모델 교환의 표준이다..!그래프 기반 표현- ONNX 모델은 계산 그래프 형태로 모델을 나타낸다. ⊙ 노드 (node): 모델의 연산 (예: 합성곱, 활성화 함수) ⊙ 엣지 (Ed.. 2024. 11. 19. 이전 1 2 3 4 다음 728x90 반응형