Som industriens første skal NeuPro-M fra CEVA støtte skalerbarhet både for systembrikker (SoC) og heterogene systembrikker (HSoC) med mulighet til å oppnå hele 1.200 TOPS

Foto: CEVA

Topper kunstig intelligens i kanten

CEVA er på hugget for tiden. Nå hevder de at de har redefinerer kunstig intelligens innen kantprosessering, med sin nye heterogene og sikre NeuPro-M prosessorarkitektur, blant annet med skalerbar ytelse fra 10 til 1200 TOPS.

Bjørn Øyvind Andersen

Publisert 13.01.2022 - 09:03

Denne artikkelen er 2 år eller eldre

CEVA, Inc. lanserte i forrige uke NeuPro-M, som er deres nyeste prosessorarkitektur for inferensarbeidsoppgaver innen kunstig intelligens og maskinlæring (AI/ML).

NeuPro-M er rettet mot de store markedene innen kant-AI og kantprosessering, og er en heterogen arkitektur bygget opp av flere spesialiserte koprosessorer og konfigurerbare maskinvareakseleratorer som skal kunne prosessere ulike oppgaver innen dype nevrale nettverk, på en sømløs og parallellisert måte. Arkitekturen skal gi en ytelsesforbedring på 5 til 15 ganger bedre enn forgjengeren.

Som industriens første skal NeuPro-M støtte skalerbarhet både for systembrikker (SoC) og heterogene systembrikker (HSoC) med mulighet til å oppnå hele 1.200 TOPS (tera operasjoner per sekund) og tilbyr dessuten muligheter for robuste og sikre oppstarts funksjoner og ende-til-ende datasikkerhet.

NeuPro–M kompatible prosessorer inkluderer i utgangspunktet følgende forhåndskonfigurerte kjerner:

NPM11 – enkel NeuPro-M motor, opp til 20 TOPS ved 1,25 GHz
NPM18 – åtte NeuPro-M motorer, opp til 160 TOPS ved 1,25 GHz

For å illustrere ytelsen, opplyser CEVA at en enkelt NPM11 kjerne ved prosessering av et , ResNet50 konvolusjonelt nevralt nettverk oppnår en ytelsesforbedring som er 5 ganger bedre, samt en reduksjon i minnebåndbredde på 6 ganger, i forhold til sin forgjenger – noe som resulterer i en effektivitet på opp til 24 TOPS per watt. Kort sammendrag av NeuPro-M arkitekturen:

Hovedmatrise bestående av 4K MACs (Multiply And Accumulates), med variert presisjon på 2-16 bits
Winograd transformeringsmotor for vekter og aktiveringer, som skal halvere konvolusjonstiden og tillate 8-bit konvolusjonsprosessering med mindre enn 0,5 % presisjonsavvik
Sparsitetsmotor for å unngå operasjoner med null-verdi vekter eller aktiveringer per lag, for opp til 4 ganger ytelsesforbedring, samtidig som man reduserer minnebåndbredde og effektforbruk
Fullt programmerbar vektorprosesseringsenhet, for håndtering av nye, ustøttede nevrale nettverksarkitekturer med alle datatyper, fra 32-bit flyttall og ned til 2-bit Binary Neural Networks (BNN)
Konfigurerbar vekt- og datakomprimering ned til 2 bits under lagring til minne, og sanntids dekomprimering ved utlesning, for redusert minnebåndbredde
Dynamisk konfigurert to-nivå minnearkitektur for å minimalisere effektforbruket i forbindelse med dataoverføring til og fra ekstern SDRAM.

Topper kunstig intelligens i kanten

CEVA er på hugget for tiden. Nå hevder de at de har redefinerer kunstig intelligens innen kantprosessering, med sin nye heterogene og sikre NeuPro-M prosessorarkitektur, blant annet med skalerbar ytelse fra 10 til 1200 TOPS.

God sommer!

Varsler kaos – ledetidene kan øke raskt

Meld deg på nyhetsbrev fra Elektronikknett

Slår seg sammen om forsvarskommunikasjon

Varmevekslere senker energikostnader

SOM med KI-akseleratorbrikke

Intelligent og konfigurerbar 1,3 kW AC-DC

100 V MLCC med høy kapasitans i 1608-pakke

Kompakt og lett IMU

Gatedriver for GaN-komponenter

Kompletterer brikke-til-sky plattform

Olivia satt i arbeid

Mykt og effektivt skjermingsmateriale

Styrker design av styresystemer

Sanntidsdata for fremtidens smarte bygg

Kan ta lederrolle i kvanteteknologi

Stabilt 3-akse akselerometer

Noden: Suksess med studentlab

Økt involvering i forsvarssektoren

Alt-i-ett-Ingeniørlaboratorium for studenter

Lanserer digitalt ressurssenter for energilagring

Integrert og energigjerrig laserdriver

Første skritt for Macaos på nett

Motorveier mellom silisium

Smart ladelogikk redder dyputladete batterier

Norges infrastruktur for kvanteforskning får 35 millioner

Kosteffektive mikrokontrollere

Kompakt industriell kontroller

Funksjonell sikkerhet i FAT filsystem

12,4 milliarder kroner for full gigabit-dekning

Oppdatert fasestøyanalysator og VCO-tester støtter 56 GHz