- 시스템온칩과 칩렛 레벨에서 20~1200TOPS의 확장성과 메모리 대역폭 사용량 16.6%으로 절감

- 오토모티브, 산업용, 5G네트워크 및 핸드셋, 보안 감시 카메라, 엣지 컴퓨팅 분야 겨냥

 

CEVA NeuPro-M.png.jpg

 

CEVA가 인공지능 및 머신러닝 추론 워크로드용 최신 프로세서 ‘NeuPro-M’을 발표하고, 광범위한 엣지 AI와 엣지 컴퓨팅 시장을 대상으로 하는 독립적인 이종 아키텍처라고 밝혔다.

 

‘NeuPro-M’은 심층 신경망의 다양한 워크로드를 동시에 원활하게 처리하는 다중의 특화 코프로세서이자 설정 변경이 가능한 하드웨어 가속기로 이전 모델 대비 하드웨어의 성능을 5~15배 향상시킨다. 또한, 업계 최초로 시스템온칩(SoC)과 이종 시스템온칩(HSoC)의 확장성을 모두 높이고 최대 1,200TOPS(초당 10조회의 연산 속도)에 달하는 성능과 강력한 보안 부팅 및 엔드 투 엔드 데이터 개인 정보 보호 옵션을 제공한다.

 

NeuPro-M 프로세서는 사전 구성된 NPM11(1.25GHz에서 최대 20TOPS의 싱글 NeuPro-M 엔진)NPM18(1.25GHz에서 최대 160TOPS8개의 NeuPro-M 엔진) 의 코어가 우선 릴리즈된다.  최첨단 성능을 지닌 NPM11 코어는 ResNet50 신경망(CNN)을 처리할 때, 이전 모델에 비해 5배의 성능 향상과 메모리 대역폭 사용은 16.6%로 감소시켜 와트당 최대 24TOPS의 탁월한 전력 효율을 제공한다.

 

이전 모델의 뛰어난 성능을 기반으로 설계된 NeuPro-M은 기존의 모든 신경망 아키텍처를 처리한다. 더불어 변압기와 3D 콘볼루션, 셀프 어텐션 및 모든 유형의 순환 신경망(RNN)과 같은 차세대 네트워크에 대해 준비가 되어 있으며, 250개 이상의 신경망과 450개 이상의 AI 커널 및 50개 이상의 알고리즘을 처리하는데 최적화되었다.

 

특히 내장형 벡터 프로세싱 유닛(VPU)은 새로운 신경망 토폴로지와 AI 워크로드의 발전에 대해 미래에 사용 가능한 소프트웨어 기반의 지원을 보장하며, CDNN(CEVA Deep Neural Network) 오프라인 압축 툴은 정확도에 미치는 영향을 최소화하면서 일반적인 벤치마크에 대해 NeuPro-MFPS/W5~10배까지 높인다.

 

CEVA 비전 비즈니스 유닛 부문 부사장이자 제너럴 매니저인 랜 스니르(Ran Snir)점점 더 많은 데이터가 생성되고 센서 기반 소프트웨어 워크로드가 성능과 효율성을 향상시키고자 신경망으로 이동함에 따라, 엣지 AI와 엣지 컴퓨팅에 대한 AL/ML 프로세싱 수요가 빠르게 증가하고 있다. 따라서 우리는 기기에 대한 전력 소모를 증가시키지 않고 점점 더 정교해지는 시스템에서 엣지 AI를 활용할 수 있는 새로운 방법을 찾아야 한다고 설명하고,“NeuPro-M은 드론에서 보안 카메라, 스마트폰, 오토모티브 시스템에 이르는 수백만 대의 기기에 AI 프로세서와 가속기를 탑재한 자사의 경험을 바탕으로 설계되었다. 혁신적인 분산형 아키텍처와 공유 메모리 시스템 컨트롤러는 대역폭과 지연 시간을 최소화하고 전체 사용률과 전력 효율성을 극대화한다. 또한, 시스템온칩과 칩렛에서 다수의 NeuPro-M 컴플라이언트 코어를 연결해 가장 까다로운 AI 워크로드를 해결할 수 있으므로, 고객은 스마트 엣지 프로세서 설계를 한 단계 더 업그레이드할 수 있게 되었다고 밝혔다.

 

NeuPro-M 이종 아키텍처는 기능별 코프로세서와 로드 밸런싱 매커니즘으로 구성되며, 이전 아키텍처 대비 성능과 효율성을 향상시키는 데에 큰 도움을 준다. 먼저 제어 기능을 로컬 컨트롤러에 분산시키고 로컬 메모리 리소스를 계층적 방식으로 실행함으로써 데이터 흐름의 유연성을 높였다. 그 결과, 활용률은 90% 이상을 넘었으며 주어진 시간에 서로 다른 코프로세서와 가속기가 데이터 부족으로부터 안심할 수 있게 되었다. 또한, CDNN 프레임워크에 의해 특정 네트워크, 원하는 대역폭, 사용 가능한 메모리 및 목표 성능에 쓰이는 다양한 데이터 흐름 체계를 실행함으로써 최적의 부하 균형을 달성할 수 있게 되었다.

 

NeuPro-M 아키텍처 주요 기능

2~16비트의 다양한 정확성을 갖춘 4K MACs(Multiple And Accumulates)으로 구성된 메인 그리드 어레이

Weights activations를 위한 위노그라드(Winograd) 변환 엔진의 탑재로 콘볼루션 시간을 ½로 단축하고, 정밀도 저하가 0.5% 미만인 8비트 콘볼루션 프로세싱 가능

희소성(Sparsity) 엔진을 통해 제로 밸류(zero-value)를 갖는 레이어별 웨이트(weights) 혹은 엑티베이션(activations) 작업을 생략하여 최대 4배의 성능을 향상시킴과 동시에 메모리 대역폭과 전력 소비량을 감소

새로운 신경망 아키텍처는 32비트의 부동 소수점에서 2비트 이진신경망에 이르는 모든 데이터 유형을 지원. 이를 처리하는 완전하게 프로그래밍할 수 있는 벡터 프로세싱 유닛

메모리 대역폭을 절감하기 위해 메모리를 저장하는 동안 가변적 웨이트(Weight)과 데이터 압축으로 2비트까지 낮추고, 데이터를 읽는 동안 실시간 압축 해제 가능

외부 SDRAM으로 데이터를 전송하는데 소비되는 전력을 최소화하도록 동적으로 구성된 2단계 메모리 아키텍처

 

NeuPro-M 아키텍처의 이러한 혁신적인 기능을 입증하기 위해 위노그라드 변환과 희소성 엔진 및 저해상도 4x4 비트 활성화의 직교 기법을 동시에 사용하면, Resnet50Yolo V3와 같은 테스트에서 네트워크의 처리 속도를 3배 이상 증가시킬 수 있다.

 

더불어 신경망 웨이트(Weights)와 바이어스(Biases), 데이터 세트와 네트워크 토폴로지가 소유자의 핵심 지적 재산이 됨에 따라, 이를 무단 사용하는 것으로부터 보호해야 할 필요성이 대두되었다. 이에 NeuPro-M 아키텍처는 선택적 신뢰 루트, 인증 및 암호화 가속기 형태의 안전한 액세스를 지원한다.

 

또한, 오토모티브 시장의 경우에는 NeuPro-M 코어와 CDNN(CEVA Deep Neural Network) 딥러닝 컴파일러 및 소프트웨어 툴킷은 ISO26262 ASIL-B 기능 안전 표준을 준수하고 있으며 엄격한 품질 보증 표준인 IATF16949A-Spice를 충족한다.

 

NeuPro-MCEVA의 신경망 컴파일러인 CDNN과 강력한 소프트웨어 개발 환경과 함께, 고객이 AI 성능을 극대화할 수 있도록 완전하게 프로그래밍할 수 있는 하드웨어/소프트웨어 AI 개발 환경을 제공해 준다.  CDNN에는 고객의 NeuPro-M 맞춤형 하드웨어를 충분히 활용해 전력과 성능, 대역폭을 최적화할 수 있는 혁신적인 소프트웨어가 포함되어 있다. 메모리 감소와 최적의 부하 균형 기법을 위한 메모리 매니저를 포함하며, ONNX(Open Neural Network Exchange), Caffe, 텐서플로우(TensorFlow), 텐서플로우 라이트(TensorFlow Lite), 파이토치(Pytorch) 등을 포함한 다양한 네트워크 포맷을 광범위하게 지원한다.

 

이외에도 Glow, tvm, Halide, 텐서플로우 등 일반적인 오픈소스 프레임워크와 호환되며, 정밀 보존 방법을 사용하면서 레이어 퓨전(layer fusion)’후 트레이닝 양자화(post training quantization)’와 같은 모델 최적화 기능을 모두 포함한다.

 

NeuPro-M은 현재 선두업체 대상으로 라이선스 사용이 가능하며, 오는 20222분기에는 일반 기업도 라이선스 사용이 가능할 예정이다. NeuPro-M를 이용하는 고객은 CEVAHSoC 설계 서비스를 통해 시스템 설계와 칩렛 개발을 통합하고 지원하는 데에 도움을 받을 수 있다.

 

#CEVA#NeuPro-M

 
TAG •
?

  1. 어플라이드 머티어리얼즈 코리아, 대학생 서포터즈 ‘리얼즈 2기’ 온라인 발대식 성료

    - 반도체 분야 진로 꿈꾸는 청년 10명 선발 - 3개월간 어플라이드 임직원과 인터뷰, 사회공헌 참여 등 다양한 활동 전개 어플라이드 머티어리얼즈 코리아가 대학생 서포터즈 ‘리얼즈 2기’ 온라인 발대식을 13일 진행했다. 어플라이드 머티어리얼즈 코리아는 반...
    Date2022.01.14 Bynewsit Reply0 Views9 file
    Read More
  2. 삼성전자, MRAM 기반 '인메모리 컴퓨팅' 세계 최초 구현

    삼성전자 연구진이 MRAM(자기저항메모리)을 기반으로 한 인메모리 컴퓨팅을 세계 최초로 구현하고, 연구 결과를 12일(영국 현지 시간) 세계적인 학술지 네이처(Nature)에 게재했다. 이번 연구는 정승철 삼성전자 종합기술원 전문연구원이 제1저자로 함돈희 종...
    Date2022.01.13 Bynewsit Reply0 Views16 항목뉴스 file
    Read More
  3. CEVA, 3세대 고성능 머신러닝 프로세서 「NeuPro-M」 공개…“엣지 AI와 엣지 컴퓨팅 디바이스에 최적”

    - 시스템온칩과 칩렛 레벨에서 20~1200TOPS의 확장성과 메모리 대역폭 사용량 16.6%으로 절감 - 오토모티브, 산업용, 5G네트워크 및 핸드셋, 보안 감시 카메라, 엣지 컴퓨팅 분야 겨냥 CEVA가 인공지능 및 머신러닝 추론 워크로드용 최신 프로세서 ‘NeuPro-M’...
    Date2022.01.13 Bynewsit Reply0 Views29 항목뉴스 file
    Read More
  4. 실리콘랩스, Z-Wave 800 시리즈 SoC 모듈 출시..."업계 선도적 전송거리와 에너지 효율 및 보안 제공"

    - ZG23 SoC 및 ZGM230S 모듈, Z-Wave 800 지원 - 1.5마일 이상의 전송 거리, 전력 소비 50% 저감, PSA 레벨 3 보안 지원 실리콘랩스는 Z-Wave 스마트 홈 및 자동화 생태계를 위한 Z-Wave 800 SoC 및 모듈 신제품을 출시했다고 밝혔다. 실리콘랩스의 시리즈2 플...
    Date2022.01.12 Bynewsit Reply0 Views13 항목뉴스 file
    Read More
  5. 바이코, 글로벌 자동차 부문에 ‘친메이 조시’ 이사 선임

    고성능 전력 모듈러 부품을 선도하는 바이코(Vicor)는 오늘 글로벌 자동차 부문 이사로 친메이 조시(Chinmaya Joshi)를 선임한다고 발표했다. 친메이는 바이코에 합류하기 전 재규어 랜드로버 그룹에서 전력전자공학(Powertrain Power Electronics) 수석 관리...
    Date2022.01.12 Bynewsit Reply0 Views12 항목뉴스 file
    Read More
  6. 인피니언, OptiMOS 전력 MOSFET 출시..."혁신적인 소스 다운 기술 적용"

    최신 전력 시스템 설계 시 높은 전력 밀도와 최적화된 성능, 사용 편의성이 매우 중요하다. 이러한 설계 요구 사항에 부응하기 위해 인피니언 테크놀로지스는 차세대 OptiMOS 소스-다운 전력 MOSFET을 출시한다고 밝혔다. OptiMOS는 더 높은 효율과 더 높은 전...
    Date2022.01.11 Bynewsit Reply0 Views14 항목뉴스 file
    Read More
  7. 삼성전자, 2021년 4분기 잠정 실적 발표…“매출 76조원, 영업 이익 13조8000억”

    삼성전자가 연결 기준으로 매출 76조원, 영업 이익 13조8000억원의 2021년 4분기 잠정 실적을 7일 발표했다. 4분기 실적의 경우 지난 분기보다 매출은 2.73% 증가, 영업 이익은 12.77% 감소했다. 지난해 같은 기간 대비 매출은 23.48%, 영업 이익은 52.49% 증...
    Date2022.01.08 Bynewsit Reply0 Views14 항목뉴스 file
    Read More
  8. [CES2022] NXP, 플래그십 4D 이미징 레이더 칩 양산…“급성장하는 자율주행 L2 이상 시장 맞춤 신제품 추가”

    - NXP의 플래그십 신제품 S32R45와 새로운 S32R41 프로세서, 360도 서라운드 감지 가능한 4D 이미징 레이더로 자율주행 L2~L5 요건 충족 - 공통 아키텍처 기반의 S32R 레이더 프로세서로 여러 자율 주행 레벨에서 소프트웨어 재사용 및 확장 가능한 레이더 플...
    Date2022.01.06 Bynewsit Reply0 Views16 항목뉴스 file
    Read More
  9. 인피니언, 차세대 AURIX TC4x 마이크로 컨트롤러 제품군 출시

    인피니언 테크놀로지스가 미래 모빌리티의 혁신을 이어갈 AURIX 마이크로컨트롤러 제품군을 확장한다. 인피니언은 차세대 e-모빌리티와 ADAS, 자동차 E/E 아키텍처, 보급형 AI 애플리케이션을 위한 새로운 AURIX TC4x 28nm 마이크로컨트롤러의 샘플 공급을 시...
    Date2022.01.06 Bynewsit Reply0 Views10 항목뉴스 file
    Read More
  10. TI, 차량용 77GHz 고해상도 레이더 센서 출시..."ADAS의 물체 감지 성능을 향상"

    - 사각 지대를 보다 정확하게 모니터링하고 효율적인 탐색 기능으로 충돌 방지 기능 및 안전성 향상 텍사스 인스트루먼트(TI)는 자율 주행과 안전을 위한 자사의 차량용 제품군으로 ADAS(첨단 운전 보조 시스템)의 물체 감지 성능을 향상시키는 센서 제품을 추...
    Date2022.01.05 Bynewsit Reply0 Views35 항목뉴스 file
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 71 Next
/ 71
CLOSE
gtag('config', 'G-3JH3B23695');