Grenseløs frihet for kantservere
Intel Xeon D prosessorer på COM-HPC servermoduler
Denne artikkelen er 2 år eller eldre
Integreringen av Intel Xeon D-prosessorer på COM-HPC servermoduler (Server-on-Modules – SoM) fra produsenter som congatec gjør det mulig for kant-serverinstallasjoner å frigjøre seg fra de strenge termiske begrensningene som preger luftkjølte serverrom. For første gang kan de nå installeres hvor som helst der det kreves massiv datagjennomstrømning med lavest mulig ventetid – helt til deterministisk sanntid.
Kantservere behandler data i utkanten av kommunikasjonsnettverk i stedet for i sentrale skyer. Dette muliggjør interaksjon med klienter av alle slag uten forsinkelser eller i sanntid, men stiller produsenter av server-, nettverks- og lagringsteknologier overfor store utfordringer. Til nå har de utviklet standardiserte rackløsninger for systemene sine, med aktive ventilasjonskonsepter og kraftig klimaanleggteknologi for å håndtere termisk styring av rackene og klimaanlegget i serverrommene. Imidlertid passer ikke alltid en slik tilnærming lenger for dagens kantserverteknologi.
American Society of Heating, Refrigerating and Air-Conditioning Engineers, forkortet ASHRAE, har sett grundig på spørsmålet om hvordan man best kan installere kantserverytelse i tøffe miljøer. Så fra perspektivet til de tilknyttede oppvarmings-, kjøle-, ventilasjons- og luftkondisjoneringsselskapene er det allerede ganske plausible anbefalinger om hvordan man kan designe kantdatasentre med høyytelses klimaanlegg og best mulig isolasjon for å beskytte dem mot varme og kulde.
Frigjøre kantservere fra luftkjølingens lenker
ASHRAE foreslår imidlertid en maksimal tillatt temperatursvingning på 20°C innen én time og maksimalt 5°C på 15 minutter for kantdatasentre. Dette krever kompleks luftkondisjoneringsteknologi og er derfor svært vanskelig å implementere. Men ikke bare det; å følge disse retningslinjene er nesten umulig, spesielt under vedlikeholdsarbeid i kantdatasentre som gjerne er mindre enn en telefonkiosk, fordi slike løsninger må kunne åpnes for vedlikehold ved enhver omgivelsestemperatur. Det er rett og slett ikke mulig å slippe inn i slike systemer via et klimastyrt kammer og raskt lukke døren igjen før man utfører vedlikeholdsarbeid i det fullt luftkondisjonerte kantserverrommet.
Kantservere og datasentre som opererer i tøffe miljøer trenger derfor systemdesign som kan takle større temperatursvingninger og et mye bredere temperaturområde enn de 0 - 40°C som er vanlig for innendørs IT. I industrielle miljøer kan design av innebygde systemer utsettes for omgivelsestemperaturer som varierer fra arktiske -40 °C til brennhete 85 °C. Hvilket betyr at hver komponent må være herdet.
Robust design reduserer kostnadene for klimaanlegg
Det mest nevralgiske punktet i utformingen av kantserver-, nettverks- og lagringsteknologier er valget av prosessorteknologi. Avgjørelsen som står og faller med dette valget er om man skal følge ASHRAE-anbefalingene og investere massivt i klimaanleggsteknologi og isolasjon, som kommer med høye investerings- og driftskostnader for sekundærenergi. Eller om man skal utvikle systemer som ikke trenger noe av det fordi de fungerer pålitelig selv i ekstreme temperaturer og derfor kan implementeres i tøffe miljøer mye billigere – fra fabrikkinstallasjoner til utendørs kommunikasjon, videoovervåking og annet kritisk infrastrukturutstyr til servere i mobile systemer som spenner fra tog og fly til selvkjørende skyttelbusser i smarte byer.
Takket være de nye Intel Xeon D-prosessorene finnes det nå en veldig kraftig serverteknologi som er kvalifisert for bruk i ekstreme temperaturområder fra -40°C til 85°C. Selv ultra-høyytelses serverdesign er ikke lenger begrenset av de stramme termiske restriksjonene til luftkondisjonerte serverrom. Til syvende og sist kan de distribueres der det kreves latensfri massiv datagjennomstrømning i utkanten av tingenes internett og i Industry 4.0-fabrikker.
Høye krav til systemdesign
En serverprosessor alene gjør imidlertid ikke en robust kantserver. Å møte kravene til systemdesign for tøffe miljøer krever også omfattende kunnskap. Hver enkelt komponent som brukes må være kvalifisert for dette miljøet, og spesielle krav gjelder også for kretskort og kortdesign. Eksempler er spesielle belegg som beskytter mot kondensvann og andre miljøpåvirkninger, eller et høyt beskyttelsesnivå mot fremmede elektromagnetiske og høyfrekvente signaler som kan hemme enhetens ytelse.
Utviklere av innvevde datateknologier, slik som congatec, har flere tiår med erfaring i design av slike systemer. De har over lang tid integrert standard PC-teknologier som Intel Core-prosessorer i innvevde systemer på en måte som er egnet for industriell bruk. De kjenner kravene og sertifiseringsstandardene til en lang rekke bransjer ut og inn; og de er vant til å designe systemene sine for langsiktig tilgjengelighet for å møte industrikrav og for å kunne levere OEM-løsninger med identiske kortkonfigurasjoner i 7, 10 eller 15 år. De vet også at industrielle applikasjoner skiller seg betydelig fra standard systemdesign for kontormiljøet, fordi industrielle applikasjoner alltid krever en større eller mindre grad av tilpasning, noe som gjør modulære design som implementerer datamaskinmoduler (Computer-on-Modules – COM) til den ideelle måten å utvikle kort. De har også lært at standardisering er nøkkelen, og derfor har de vært med på å lage globalt anerkjente standarder for slike moduler.
Nå målet raskere med standarder
Med den nye COM-HPC Server-spesifikasjonen på plass, og lanseringen av Intel Xeon D-prosessorene, har denne medfølgende ekspertisen nå blitt overført til industrielle serverdesign. For første gang har utviklere tilgang til ekte produkter. Fordelen med disse nye standardiserte COM HPC servermodulene er at utviklere kan integrere dem i sine tilpassede bærerkort som applikasjonsklar innvevd datalogikk. Dette betyr at de ikke trenger å bekymre seg for grunnleggende prosessorteknologispørsmål, men bare forholde seg til den applikasjonsspesifikke plasseringen av kortkomponentene og plassere grensesnittene på rett sted på bærerkortet. For dette formål ga PICMG-standardiseringskomiteen nylig ut COM-HPC Carrier Design Guide. Den gir viktige retningslinjer for å bygge interoperable og skalerbare kundespesifikke innebygde dataplattformer basert på den nye standarden, og gjør det også enkelt for utviklere å forstå logikken bak standarden.
Kunnskap er makt
For å tillate utviklere å sette seg raskt, enkelt og effektivt inn i de nye designreglene, har congatec åpnet et online og on-site opplæringsakademi for COM-HPC Server- og Client-design. Her kan utviklere få en ekspertledet introduksjon til den nye verdenen av avanserte innvevde og avanserte databehandlingsdesign basert på den nye Computer-on-Module-standarden. Opplæringsprogrammet dekker alle obligatoriske og anbefalte grunnleggende design og beste praksis-metoder for COM-HPC-bærekort og tilbehør, for eksempel avanserte vifteløse kjøleløsninger for serverdesign på opptil 100 watt eller mer. De funksjonsrike evalueringsbærerkortene for COM-HPC Server-moduler fungerer som en referanseplattform for å lære hvordan du implementerer Intel Xeon D-prosessorer. De utnytter hele funksjonssettet til standarden, og utviklere kan bruke dem som plattformer for videre applikasjonsutvikling.
Congatec-akademiet har som mål å trene utviklere i alle grunnleggende COM-HPC-designområder – fra prinsipper for mønsterkortlag, strømstyringsregler og krav til signalintegritet til komponentvalg. Økter med spesielt fokus på kommunikasjonsgrensesnitt gir veiledning om hvordan du unngår fallgruver i den utfordrende utformingen av høyhastighets seriell kommunikasjon: fra PCIe Gen 4 og 5 til USB 3.2 Gen 2 og USB 4 med Thunderbolt på USB-C til 100 Gigabit Ethernet, og inkluderer også styring av sidebåndssignaler for 10G / 25G / 40G / 100G Ethernet KR-grensesnitt, som i COM-HPC må deserialiseres på bærerkortet. Under disse øktene blir det også forklart hvordan design for beste praksis bruker grensesnittstandarder som eSPI, I²C og GPIOer.
En introduksjon til x86-fastvareimplementering – alt fra innebygd BIOS til funksjoner for kortstyring og modulstyring – kompletterer opplæringen i design-in. Og sist, men ikke minst, er det økter om verifisering og teststrategier som tar for seg alle utfordringer fra innledende verifisering av bærerkortdesign til masseproduksjonstesting. Med et så omfattende opplæringsprogram har congatec-akademiet som mål å gjøre utformingen av robust serverteknologi så enkel som mulig. Unødvendig å si kan selskapet også gi interesserte OEM-kunder komplette systemdesign som drar nytte av deres nye COM-HPC Server-moduler og store partnernettverk.
Sett fart på kantserverens arbeidsoppgaver
Imidlertid imponerer de nye COM-HPC servermodulene i størrelse E og størrelse D med BGA-monterte Intel Xeon D-prosessorer (kodenavn Ice Lake D) ikke bare med støtte for det utvidede temperaturområdet fra -40 °C til 85 °C. De løser også mange av de tidligere flaskehalsene forårsaket av kantserverbegrensninger og vil akselerere den kommende generasjonen av sanntids arbeidsbelastninger for mikroservere i tøffe miljøer og utvidede temperaturområder betydelig. Forbedringer inkluderer opptil 20 kjerner, opptil 1 TB minne på opptil 8 DRAM-sokler ved 2933MT/s, opptil 47 PCIe-baner per modul totalt og 32 PCIe Gen 4-baner med dobbel gjennomstrømning per bane, og opptil 100 GbE-tilkobling og TCC/TSN-støtte med optimert strømforbruk takket være 10nm produksjon. Videolagrings- og analyseservere drar også nytte av integrert Intel AVX-512, VNNI og OpenVINO-støtte for AI-basert dataanalyse.
En milepæl for design av sanntids kantservere
Faktisk setter markedsintroduksjonen av de Ice Lake D-baserte COM-HPC servermodulene en trippel milepæl: For det første fordi støtte for utvidet temperaturområde betyr at Intel Xeon D servermoduler ikke lenger er begrenset til standard industrielle applikasjoner, men også rettet mot utendørs- og bilmiljøer. For det andre øker verdens første COM-HPC servermoduler antallet tilgjengelige kjerner til 20 for første gang; med opptil 8 DRAM-sokler gir dette massivt mer minnebåndbredde enn servermoduler basert på andre PICMG-spesifikasjoner. For det tredje er disse nye servermodulene sanntidskompatible, både når det gjelder prosessorkjerner og TCC/TSN-aktivert sanntids Ethernet, som er avgjørende for digitaliserte IIoT- og Industry 4.0-prosjekter.
For å kunne implementere serverbalansering og serverkonsolideringstjenester for deterministiske sanntids kantserverinstallasjoner, der ulike sanntidsapplikasjoner opererer uavhengig av hverandre på en enkelt kantserver, er det nyttig hvis plattformene støtter sanntidskompatible virtuelle maskiner, som for eksempel RTS Hypervisor fra Real-Time Systems gjør. Dette gjør det mulig for Industry 4.0-fabrikker å være vert for heterogene sanntidsapplikasjoner på en enkelt serverplattform i utkanten av deres private 5G-nettverk, og å allokere eksklusive systemressurser til de individuelle prosessene. Servermoduler fra congatec er prekvalifisert for slike tjenester. Tilpassede installasjoner med alle nødvendige parameteriseringer kan inkluderes i standardtjenestene som congatec tilbyr for de nye COM-HPC-modulene.
Modulene imponerer videre med et omfattende serverorientert funksjonssett: For virksomhetskritiske design tilbyr de kraftige maskinvaresikkerhetsfunksjoner som Intel Boot Guard, Intel Total Memory Encryption - Multi-Tenant (Intel TME-MT) og Intel Software Guard Extensions (Intel SGX). For best mulig RAS-funksjoner integrerer prosessormodulene Intel ME Manageability Engine og støtter eksterne maskinvareadministrasjonsfunksjoner som IPMI og redfish. Faktisk er det en annen PICMG-spesifikasjon som sikrer interoperabiliteten til slike implementeringer, og treningsprogrammet til congatec-akademiet dekker også dette aspektet.
Servermodulopsjoner for Intel Xeon D
De nye modulene vil komme som High Core Count (HCC) og Low Core Count (LCC) utgaver med ulike varianter av Intel Xeon D prosessorserien.
conga-HPC/sILH COM-HPC Server Size E moduler vil bli tilgjengelige med 5 forskjellige Intel Xeon D 27xx HCC prosessorer, med 4 til 20 kjerner, 8 DIMM sokler for opp til 1 TByte med 2933 MT/s hurtig DDR4 minne med ECC, 32x PCIe Gen 4 og 16x PCIe Gen 3, så vel som 100 GbE gjennomstrømning pluss sanntidskapabel 2,5 Gbit/s Ethernet med TSN og TCC støtte med en grunneffekt for prosessoren på 65 til 118 Watt.
Modulene COM-HPC Server Size D og COM Express Type 7 kommer med 5 forskjellige Intel Xeon D 17xx LCC-prosessorer med et utvalg av 4 til 10 kjerner. Mens conga-B7Xl COM Express Server-on-Module støtter opptil 128 GB DDR4 2666 MT/s RAM via opptil 3 SODIMM-sokler, tilbyr conga HPC/SILL COM-HPC Server Size D-modulen 4 DIMM-sokler for opptil 256 GB på 2933 MT/s rask DDR4 RAM eller 128 GB med ECC UDIMM RAM. Begge modulfamiliene tilbyr 16x PCIe Gen 4 og 16x PCIe Gen 3 baner. For rask nettverksbygging gir de opptil 50 GbE gjennomstrømning og TSN/TCC-støtte via 2,5 Gbit/s Ethernet med en prosessor grunneffekt på 40 til 67 Watt.
Modulene kan forhåndsbestilles nå, og applikasjonsklare evalueringsprøver – med robuste kjøleløsninger som matcher prosessorens TDP – er tilgjengelig umiddelbart. Kjøleløsninger spenner fra kraftig aktiv kjøling med varmelederadapter til helpassive kjøleløsninger for best mekanisk motstandskraft mot vibrasjoner og støt. Sistnevnte lindrer også termisk stress i applikasjoner som må tåle korte perioder med ekstreme temperatursvingninger. På programvaresiden kommer de nye modulene med omfattende kortstøttepakker for Windows, Linux og VxWorks, og RTS hypervisorteknologi.
Forfatter: Andreas Bergbauer, Produktsjef COM-HPC hos congatec
COM-HPC basert flermoduldesign: Referansedesign for maskinlæringsbasert AI-klynge
Design av COM-HPC kantservere er ikke begrenset til enkeltmodulkonsepter. Standarden støtter også eksplisitt multimodulbærere med heterogene COM-HPC-modulkonfigurasjoner som integrerer f.eks. FPGAer eller GPGPU-akseleratorer. En blanding av COM-HPC Server og COM-HPC Client moduler på ett kort er også mulig. For eksempel jobber congatec for tiden med Universitetet i Bielefeld og Christmann IT på et kantserverdesign som kombinerer forskjellige COM-HPC-moduler på ett bærerkort for å behandle ekstreme sanntidsarbeidsbelastninger i et multisystemdesign for maskinlæringsbaserte AI-klynger av høydimensjonale data (selvorganiserende kart).