Skriv ut

Den ena IP-kärnan levererar tre biljoner operationer per sekund per watt.* Den andra identifierar ett i princip obegränsat antal objekt i varje bildruta i 60Hz-Full HD-video. Det är den prestanda Arm utlovar på sina två första IP-kärnor för maskininlärning.

Siffrorna gäller vid tillverkning i 7 nm. Båda kärnorna ska kunna stoppas in i en mobiltelefon.

Brittisk-japanska krets­konstruktören Arm är mest känd för sin standard­sättande cpu-familj ARM, som licensieras av system­krets­tillverkare jorden runt. Men företaget säljer även andra block till systemkretsarna och nu meddelar företaget att det kommer att ha två neuronnätskärnor redo för licensiering i mitten av året.

Den ena kärnan heter ML (machine learning) och är ett generellt artificiellt neuronnät som kan skräddarsys för godtyckligt AI-tillämpning.

Den andra kärnan heter OD (object detection) och är redan skräddarsydd, för datorseende.

4,6 biljoner operationer per sekund ska det vara möjligt att komma upp till i ett realistiskt mobilt användningsfall med ML, som används för inferens, det vill säga för att låta ett färdigtränat neuronnät exempelvis tolka röstkommandon eller känna igen objekt i bild.

Standardramverk som Tensorflow, Caffe, MXNet och Android NN stöds för att specificera det neuronnät som ML ska laddas med. Dessutom har Arm adderat maskinnära instruktioner för neuronnät i sitt biblioket CMSIS, som du kan använda för att eventuellt trimma prestanda ytterligare.

Datorseende är en av de vanligaste tillämpningarna för artificiella neuronnät. Därför har Arm tagit fram kärnan OD (object detection).

OD är en maskin med en särskild fascination för människor. Den kan inte bara plocka ut oss snabbt i bild – även i 60 Hz-video – utan även berätta åt vilket håll huvudet tittar och åt vilket håll kroppen är vänd.

OD identifierar objekt som ryms inom ett område av 50 x 60 punkter i Full HD-video, i 60 bilder per sekund. Den hittar dessutom ett ”nästan obegränsat” antal objekt i varje bildruta, som Arm uttrycker det.

Okej. Elektroniktidningen tar uppgiften bokstavligen och konstruerar ett räkneexempel. Om du panorerar en Full HD-videokamera över publikhavet på en fotbollsarena, så skulle OD enligt den här specifikationen teoretiskt kunna räkna 41 472 huvuden på en sekund (60 x (1920 x 1080) /(60 x 50)).

Att den här kapaciteten skulle kunna finnas inbyggd i exempelvis en övervakningskamera, eller till och med en mobiltelefon, kan kännas lite kusligt. Men det är snäppet bättre än att rådata från kameran skickas till molnet för analys, vilket är fallet när avancerat datorseende görs idag. Inbyggd i kameran behöver personlig informationen kanske aldrig lämna kameran och risken för kompromettering blir mindre.

Arm berättar inte vilken strömförbrukning OD har, men bland de användningsområden som räknas upp finns smarttelefoner och smartkameror.

Arms tillhörande mjukvara är för heterogena arkitekturer. Den ska alltså inte bara kunna köras i OD och ML, utan också distribueras över Arms existerande cpu:er och gpu:er. Och över exempelvis DSP-kärnor eller FPGA-kärnor från tredjepart som anpassar sina gränssnitt.

ML-kärnan finns för utvärdering från april och för licensiering från mitten av året.

”Trillium” är ett generellt namn Arm använder på hela sin AI-satsning.

Det första fokuset för Trillium är mobila enheter som smarttelefoner, pekdatorer och smarta kameror.

Men arkitekturen ska vara skalbar – ner till smarta sensorer och upp till självkörande bilar och datacentraler

Arm sätter din fantasi i rörelse genom att räkna upp en rad tillämpningsområden: utökad verklighet, IoT, medicinteknik, smartkamera, logistik, robotik, hemautomation, konsumentelektronik, drönar och wearables.

Konkurrenter som hunnit före med att erbjuda neuronnätsblock är Synopsys, Imagination, Ceva, Tensilica och Verisilicon. Från Nvidia kan du till och med plocka AI-kärnor gratis i form öppen källkod.

Apple och Huawei lanserade mobiltelefoner på systemkretsar med AI-block i höstas. Många vill göra detsamma. Att Arm nu väljer att lansera egna AI-block visar att idén om ett dedikerat AI-block i systemkretsar snabbt har blivit mainstream. 


FOTNOT: (*) En biljon är tusen miljarder. Prestandan är 3 Tops/s/w, tre teraoperationer per sekund per watt.