Kunstig intelligens:

Forbedrer vektorsøk i RAG-systemer

Ny programvare fra KIOXIA skal forbedre vektorsøk for RAG-systemer, og gi fleksibel ytelse for SSD-baserte KI-applikasjoner.

Publisert Sist oppdatert

KIOXIA lanserer nå en ny versjon av sitt åpne programvarebibliotek AiSAQ, utviklet for effektivt vektorsøk i Retrieval-Augmented Generation (RAG) systemer. Med fokus på SSD-baserte søk og optimal ressursbruk, tilbyr oppdateringen fleksible innstillinger som lar utviklere balansere ytelse og kapasitet etter behov.

AiSAQ benytter en SSD-optimalisert Approximate Nearest Neighbor Search (ANNS)-algoritme som fjerner behovet for å lagre indekser i DRAM. I stedet utføres søket direkte på SSD, noe som åpner for betydelig større datasett uten at systemet begrenses av minnekapasitet.

I systemer der SSD-kapasiteten er fast, krever høyere søkeytelse mer lagringsplass per vektor – noe som reduserer antall mulige vektorer. Den nye versjonen av AiSAQ lar brukerne justere denne balansen for å tilpasses ulike belastninger og bruksområder, uten maskinvareendringer.

Med dette tar KIOXIA et nytt steg mot SSD-sentrerte arkitekturer for skalerbare AI-løsninger. Programvaren egner seg ikke bare for RAG, men også for semantisk søk og andre applikasjoner med store vektorbehov, får vi opplyst.

Programvaren er tilgjengelig som åpen kildekode, og understreker KIOXIAs satsing på tilgjengelig og effektiv AI-infrastruktur.

Gratis nedlasting (ekstern lenke): https://github.com/kioxia-jp/aisaq-diskann

 

Powered by Labrador CMS