Kunstig Intelligens og sikkerhet:

Illustrasjon: Elektronikk/Adobe Firefly

Store språkmodeller krever spesiell oppmerksomhet

Sikkerhetsspesialister ber om umiddelbar gjennomgang av KI-sikkerhetsstandarder etter forskning på store språkmodeller.

Publisert 28.02.2024 - 09:58

Nylige funn fra Anthropic, en oppstartsbedrift innen KI-sikkerhet, har fremhevet risikoene forbundet med store språkmodeller (LLM), noe som har krevd en rask gjennomgang av sikkerhetsstandarder for KI.

Valentin Rusu, maskinlæringsutvikler og Ph.D. i KI ved Heimdal Security , insisterer på at disse funnene krever umiddelbar oppmerksomhet.

– Det undergraver grunnlaget for tillit KI-industrien er bygget på og reiser spørsmål om ansvaret til KI-utviklere, sier Rusu.

Teamet fra Anthropic fant ut at LLM-er kunne bli «sovende agenter», og unndra seg sikkerhetstiltak spesielt designet for å forhindre negativ atferd. KI-systemer som fungerer som mennesker for å lure folk er et problem for gjeldende sikkerhetsopplæringsmetoder.

– Våre resultater tyder på at når en modell først viser villedende atferd, kan standardteknikker mislykkes i å fjerne slikt bedrag og skape et falskt inntrykk av sikkerhet, bemerket forfatterne, og understreket behovet for en revidert tilnærming til KI-sikkerhetstrening.

Rusu argumenterer for smartere, fremtidsrettede sikkerhetsprotokoller som forutser og nøytraliserer nye trusler innen KI-teknologier.

– KI-fellesskapet må presse på for mer sofistikerte og nyanserte sikkerhetsmekanismer som ikke bare er reaktive, men prediktive, sier han. – Nåværende metodikker, selv om de er imponerende, er ikke idiotsikre. Det er et presserende behov for å utvikle en mer dynamisk og intelligent tilnærming til sikkerhet.

Oppgaven med å sikre KIs sikkerhet er vidt utbredt, og mangler et enkelt styringsorgan.

Mens organisasjoner som National Institute of Standards and Technology i USA, Storbritannias nasjonale cybersikkerhetssenter og Cybersecurity and Infrastructure Security Agency er medvirkende til å fastsette sikkerhetsretningslinjer, faller hovedansvaret til skaperne og utviklerne av KI-systemer. Det er de som har ekspertisen og kapasiteten til å bygge inn sikkerhet fra begynnelsen.

Som svar på økende sikkerhetsbekymringer, samarbeides det over hele linjen. Fra OWASP Foundations arbeid med å identifisere KI-sårbarheter til etableringen av «AI Safety Institute Consortium» med over 200 medlemmer, inkludert teknologigiganter og forskningsorganer, er det et felles fremstøt for å skape et sikrere KI-økosystem.

Ross Lazerowitz fra Mirage Security kommenterer den prekære tilstanden til KI-sikkerhet, og sammenligner den med «det ville vesten» og understreker viktigheten av å velge pålitelige KI-modeller og datakilder.

Dette støttes av Rusu. – Vi må sørge for at KI tjener oss, i stedet for å ødelegge menneskelig fremgang. Han bemerker også de unike utfordringene KI gir til cybersikkerhetsarbeid. Å sikre at KI-systemer, spesielt nevrale nettverk, er robuste og pålitelige er fortsatt viktig.

Bekymringene som ble reist av den nylige studien om LLM-er viser det presserende behovet for en omfattende strategi for KI-sikkerhet, og ber industriledere og beslutningstakere om å øke innsatsen for å beskytte fremtiden for KI-utvikling.

Store språkmodeller krever spesiell oppmerksomhet

Sikkerhetsspesialister ber om umiddelbar gjennomgang av KI-sikkerhetsstandarder etter forskning på store språkmodeller.

KI møter logistikk

Et skritt mot kvikksølvfri desinfeksjon

Meld deg på nyhetsbrev fra Elektronikknett

Foredrag ønskes til embedded world og electronic displays 2026

Frokostmøte: Få EU-millioner

Nanopower med utviklingssett

Styrker seg innen bil og fysisk KI

Stor robotkonferanse til Odense i 2027

SMARC-moduler med Mediatek Genio

Har utdannet ingeniører i 170 år

GPV: Økende inntjening tross usikkerhet i markedet

Arrow lanserer utviklingssett med Altera Agilex 5 FPGA

Nvidia-utfordrer for KI i nettverkskanten

Bredengen satser i Sverige

Gatedriver optokoplere

Høyere effekttetthet med 1200 V SiC MOSFETs

Nytt samarbeid skal styrke norsk satsing på kvantevitenskap og -teknologi

R&S og TASA samarbeider om satellittesting

Samarbeider om testing for satellittkommunikasjon

Velger norsk smartbelysning

Muligheter innen Agritek

Hermafrodittiske kontakter

IMU for bildestabilisering

I rute til cybersikkerhetens D-dag

Er du klar med cybersikkerhet?

Første elflylader er klar på Stavanger lufthavn

Sterk vekst i lånegarantier fra Innovasjon Norge

Brenner for elektronikkindustrien

Klipsmonterte transistorer sparer plass

SEGGER integrert med CMake og VS Code

Vil bruke eksisterende fibernettverk som fotosensor