본문 바로가기

전체 글

공장과 같은 시끄럽고 노이즈가 많은 환경에 적합한 오디오 처리 모델과 적용 방안 공장과 같은 시끄럽고 노이즈가 많은 환경에 적합한 오디오 처리 모델과 적용 방안  유사 성능의 음성 인식 모델 비교다양한 음성 인식 모델이 소음이 많은 환경에서 사용될 수 있지만, 성능은 모델의 설계, 훈련 데이터, 적용 환경에 따라 달라집니다. 아래는 공장과 같은 환경에서 적합할 수 있는 주요 음성 인식 모델의 성능 비교입니다.1. 성능 비교 테이블모델 주요 특징 노이즈 환경 성능 추론 속도 Edge 지원 커스텀 가능성NVIDIA Riva고성능, GPU 최적화, 멀티모달 지원★★★★★빠름 (실시간)GPU 기반 Edge 지원매우 높음OpenVINO + Kaldi가벼운 모델, 도메인별 Fine-tuning 가능★★★★☆보통 (~200ms)CPU 기반 Edge 지원매우 높음SpeechBrainPyTorch .. 더보기
rag llm 적용 방안 적용된 시스템의 예상 성능 수준1. 예상 성능 수준입력 데이터 처리실시간 데이터 처리 속도:비디오(근거리/원거리 카메라): 평균 30~50fps(프레임/초).오디오(Whisper): 텍스트 변환 속도는 1초 이하로 실시간 응답 가능.레이더/공기질 센서: 데이터 업데이트 주기 50~100ms.전처리 및 벡터 변환:입력 데이터가 벡터로 변환되는 데 평균 100~200ms 소요.벡터 검색 및 응답벡터 검색 속도:FAISS나 Milvus를 사용하면 수십만 개의 벡터 중 유사 항목 검색에 평균 10~50ms.전체 시스템 응답 시간:입력 데이터 → 벡터 변환 → 검색 → 응답 생성: 약 300~500ms.정확도 및 신뢰성위험 탐지 정확도:비디오 기반 위험 탐지: 90~95% (YOLOv8 등 최신 모델 사용 시)... 더보기
근거리 카메라, 원거리 카메라, 레이더 센서, 공기질 센서를 활용한 데이터 처리 및 분석 rag, LLM cnn 근거리 카메라, 원거리 카메라, 레이더 센서, 공기질 센서를 활용한 데이터 처리 및 분석: 상세 설명1. 입력 데이터 처리목적: 다양한 센서에서 수집한 데이터를 시스템이 이해할 수 있도록 변환하고, 이를 RAG 시스템에서 활용할 수 있도록 준비합니다.입력 데이터 종류와 전처리 방법비디오 데이터 (근거리/원거리 카메라):전처리:카메라로부터 수집한 영상 데이터를 특정 크기(예: 640x480 픽셀)로 축소하거나 자름.노이즈 제거 필터(예: Gaussian Blur)를 적용하여 분석 정확도를 높임.특징 추출:객체 검출 모델(예: YOLOv8)로 작업자, 장애물, 위험 물체 등을 식별.결과를 텍스트 데이터로 변환(예: "작업자 A가 위험 구역에 있음").레이더 데이터:전처리:레이더로부터 수집된 원시 데이.. 더보기
라즈베리파이 5의 RAG 기반 sLLM 시스템 개발 단계 라즈베리파이 5는 향상된 성능과 확장성을 갖춘 최신 싱글 보드 컴퓨터로, RAG(Retrieve-Augment-Generate) 기반의 소형 대형 언어 모델(sLLM) 시스템 개발에 적합합니다. 이를 활용하여 작업자 안전을 위한 스마트 감지 시스템을 구축할 수 있습니다.라즈베리파이 5의 주요 사양- 프로세서: 2.4GHz 쿼드코어 ARM Cortex-A76 CPU메모리: 4GB 또는 8GB LPDDR4X RAM그래픽: VideoCore VII GPU저장소: microSD 슬롯, PCIe 인터페이스를 통한 M.2 SSD 지원연결성: 기가비트 이더넷, 듀얼 밴드 Wi-Fi, 블루투스 5.0포트: USB 3.0 포트 2개, USB 2.0 포트 2개, 듀얼 micro-HDMI 출력(4Kp60 지원).. 더보기
Qualcomm QCS6490 기반 RAG 기반 sLLM 개발 사례 Qualcomm QCS6490 기반 RAG 기반 sLLM 개발 사례Qualcomm QCS6490은 강력한 엣지 AI 연산 성능과 통신 기능을 제공하는 IoT 및 스마트 엣지 플랫폼입니다. RAG(Retrieve-Augment-Generate) 기반 sLLM(Small Large Language Model) 시스템을 이 플랫폼에 적용하면 고성능 데이터 처리와 저지연 추론을 효율적으로 구현할 수 있습니다.QCS6490 주요 사양프로세서: 8코어 Kryo 670 CPU (4x Cortex-A78 성능 코어, 4x Cortex-A55 효율 코어)GPU: Adreno 642L (OpenGL, Vulkan 지원)AI 엔진: Qualcomm Hexagon™ 686 프로세서 (15 TOPS의 AI 성능 제공)DSP: .. 더보기
NVIDIA Jetson Orin Nano 보드 적용: RAG 기반 sLLM 개발 사례 NVIDIA Jetson Orin Nano 보드 적용: RAG 기반 sLLM 개발 사례NVIDIA Jetson Orin Nano는 강력한 엣지 AI 컴퓨팅 성능을 제공하며, RAG(Retrieve-Augment-Generate) 기반 sLLM(Small Large Language Model) 시스템 개발에 최적화된 플랫폼입니다. 본 사례는 Jetson Orin Nano를 활용한 스마트 안전 관리 시스템 개발을 예로 설명합니다.Jetson Orin Nano 주요 사양프로세서: NVIDIA Ampere 아키텍처 기반 GPU + ARM Cortex-A78AE CPUGPU: 512 CUDA 코어 및 16 Tensor 코어메모리: 최대 8GB LPDDR5AI 성능: 최대 40 TOPS스토리지: eMMC 16GB(.. 더보기
Orange Pi 5 보드를 활용한 RAG 기반 sLLM 개발 Orange Pi 5 보드를 활용한 RAG 기반 sLLM 개발 사례Orange Pi 5는 Rockchip RK3588S SoC를 기반으로 한 고성능 저전력 SBC(Single Board Computer)로, AI 및 엣지 컴퓨팅 애플리케이션에 적합합니다. 이를 RAG(Retrieve-Augment-Generate) 기반 sLLM(Small Large Language Model) 시스템 개발에 적용할 경우, 다음과 같은 장점과 개발 방향을 설정할 수 있습니다.Orange Pi 5의 주요 사양프로세서: Rockchip RK3588S, 8코어 (4x Cortex-A76 + 4x Cortex-A55)GPU: Mali-G610 MP4 (OpenGL, Vulkan 지원)NPU: 최대 6TOPS의 AI 연산 성능메모.. 더보기
windows IoT 지원 QCM6490 나열된 프로세서는 지원되는 프로세서 세대의 최소 플로어를 충족하는 프로세서 모델을 나타내며 게시 당시 최신 프로세서까지 포함됩니다. 이러한 프로세서는 보안, 안정성 및 Windows 11에 대한 최소 시스템 요구 사항에 대한 디자인 원칙을 충족합니다. 이후에 출시되고 동일한 원칙을 충족하는 차세대 프로세서는 명시적으로 나열되지 않더라도 지원되는 것으로 간주됩니다. 이 프로세서 목록은 업데이트 간에 프로세서 제조업체의 최신 제품을 반영하지 않습니다. 프로세서 목록 업데이트는 Windows의 후속 일반 공급 시 이루어집니다.OEM은 새 Windows 11 디바이스에 다음 CPU를 사용할 수 있습니다. 새 Windows 11 디바이스는 Windows 11용 Windows 하드웨어 호환성 프로그램을 통과한 최신.. 더보기