OAK-D 소개

Computer Vision에서 가장 유명한 오픈 소스 Spatial AI 입니다. OpenCV의 20주년을 축하하기 위해 프로젝트 규모에 상관없는 모든 분야의 컴퓨터 비전 프로젝트를 위한 MIT 라이선스 오픈 소스 소프트웨어 및 Myriad X 기반 하드웨어 솔루션인 OpenCV AI Kit(OAK) 를 소개합니다.

모든 규모의 임베디드 프로젝트에 적용 가능합니다.

OAK는 OAK API 소프트웨어와 OAK-1 및 OAK-D의 두 가지 하드웨어 유형으로 구성됩니다. 두 모델이 공유하는 4K/30 12MP 카메라 외에도 스테레오 Depth 를 활용하는 Spatial AI 를 제공하는 OAK-D와 함께 작은 인공 지능(AI) 및 컴퓨터 비전(CV) 강합니다.

그리고 이 장치들은 누구에게 나 사용하기 쉽습니다. OAK-1 및 OAK-D를 사용하면 30초 이내에 실행하여 취미 생활자, 연구원, 전문가 등 누구나 이 기능에 액세스할 수 있습니다. 코드 수정 작업을 마치면 OAK의 모듈 식 FCC/CE 승인 오픈 소스 하드웨어 에코 시스템을 통해 제품에 직접 자신이 만든 코드를 업로드해 바로 동작을 확인할 수 있습니다.

무엇이든 감지하고 추적 가능

실시간 4K H.265 @ 30FPS 스트리밍

라이브 Depth와 AI 결합

자신만의 Neural Network 를 쉽고 간편하게 학습 가능

ROS, ROS2 와 호환 가능

OAK는 실제 제품을 바로 만들 수 있는 임베디드 AI입니다.

OAK는 MIT 라이선스 하드웨어, 소프트웨어 및 AI 교육으로 구성된 모듈 식 오픈 소스 에코 시스템으로, 이를 통해 Spatial AI의 초능력과 가속화된 컴퓨터 비전 기능을 제품에 포함할 수 있습니다. OAK는 서로 다른 하드웨어 및 소프트웨어 구성 요소를 함께 연동해 하나의 단일 솔루션으로 만들 수 있는 모든 콘텐츠를 제공합니다.

간단한 30초 설정으로 동작 준비 완료

OAK API 특히 데이터와 전원을 모두 제공하는 OAK-1 모듈의 단일 USB-C 커넥터를 사용하여 Spatial AI를 시작하는 가장 빠른 방법입니다. 위의 비디오에서 볼 수 있듯이 하드웨어 언박싱에서 고급 이미지 분류기를 1분 이내에 실행할 수 있습니다.

무료 Neural Network를 사용하거나 또는 직접 생성 가능

OAK는 다음의 Neural Network와 함께 제공됩니다. COVID-19 마스크/마스크 미사용 감지, 연령 인식, 감정 인식, 얼굴 감지, 얼굴 랜드마크(예: 눈꼬리, 입, 턱 등), 그리고 일반 물체 감지(20-class), 보행자 감지 및 차량 감지 등은 정기적으로 추가됩니다.

OAK-D & OAK-1 사양

OAK-D & OAK-1 기능

다단계의 학습 절차를 시각 적으로 빌드

파이프라인 Builder로 컴퓨터 비전 + AI 워크플로 정렬합니다: 노드 기반 편집기에는 미리 보기가 포함되어 있으므로 자르기 및 확대/축소로 프로세스의 다음 단계에 올바른 데이터를 전달하는지 확인할 수 있습니다. 다단계 Spacial AI는 간단해 졌습니다.

OAK vs 다른 Myriad X 솔루션

OAK 모듈은 전 세계의 다른 Myriad X 기반 솔루션과 달리 전체 OpenCV 커뮤니티의 이익을 위해 이 강력한 VPU의 잠재력을 최대한 활용합니다. 이제 특징 추적, 하드웨어 수준 H.265 지원 및 4k 출력이 잠금 해제되어 누구나 사용할 수 있습니다.

여러분이 직면한 문제 해결을 도와줄 Spatial AI 모델

OAK-D를 사용하여 Spatial AI 결과를 얻는 방법에는 스테레오 Depth와 융합된 Monocular Neural 추론 및 스테레오 Neural 추론의 두 가지 방법이 있습니다. 두 모드 모두 아래에 설명된 것과 같이 특정 사용 사례에 대한 장단점이 있습니다.

스테레오 Depth와 융합된 Monocular Neural 추론을 통해 Neural Network은 단일 카메라에서 실행되고 불일치(disparity) Depth 결과와 융합됩니다. 왼쪽, 오른쪽 또는 RGB 카메라를 사용하여 신경 추론을 실행할 수 있습니다.

Monocular AI와 스테레오 Depth

다음은 스테레오 Depth 결과와 융합된 Monocular AI의 예입니다. 이 경우 OAK-D는 Depth 데이터에 물체 감지 결과를 시각화합니다. 객체 중간에 있는 경계 상자는 객체의 Depth가 당겨지는 곳입니다 (API에서 설정 가능).

스테레오 Neural 추론

이 두 경우 모두 표준 Neural Network를 사용할 수 있습니다. Neural Network가 3D 데이터로 학습될 필요가 없습니다. OAK-D는 표준 2D 훈련 네트워크를 사용하여 두 경우 모두 3D 결과를 자동으로 제공합니다.

다음은 OAK-D에서 실행되는 이 스테레오 Neural 추론의 예입니다. 이 경우 왼쪽 및 오른쪽 카메라에서 병렬로 실행되는 얼굴 랜드마크 감지가 뒤따르는 얼굴 감지입니다.

Leave a Comment

Your email address will not be published.