Skip to main content
7 min lesingNorvalda

Bygge en RAG-kundestøtteagent: arkitektur, kostnader og fallgruver

Hvordan en RAG-støtteagent faktisk fungerer, hva den koster å drifte, og feilmodusene som stille undergraver tillit.

En RAG-chatbot er ikke en modell som “kjenner bedriften din”. Det er et gjenfinningssystem koblet til en språkmodell: når en kunde spør om noe, finner systemet først de mest relevante avsnittene fra din egen dokumentasjon, og ber så LLM-en svare kun ut fra dem. Gjør gjenfinningen riktig, og modellen holder seg til fakta. Gjør den feil, og du har en selvsikker løgner i merkevaren din.

Arkitekturen, ende til ende

  • Kunnskapskilder: hjelpesenterartikler, produktdokumentasjon, tidligere saker, retningslinjer. Rene, uten duplikater, med tydelig ansvar for oppdateringer.
  • Oppdeling og embeddings: dokumenter deles i avsnitt og gjøres om til vektorer slik at de kan søkes på mening, ikke bare nøkkelord.
  • Vektorlager: en database (pgvector, Pinecone, Qdrant) som returnerer de nærmeste avsnittene på millisekunder.
  • Gjenfinning + ledetekst: de beste avsnittene settes inn i ledeteksten med instruks om å svare kun ut fra dem og oppgi kilden.
  • Guardrails: avslagsregler, en tillitsterskel og overgang til et menneske når gjenfinningen er svak.

Hva det faktisk koster

To kostnadslinjer betyr noe. Byggekostnaden er stort sett en engangssum: rydding av kunnskapsbasen, kobling av pipelinen, skriving av guardrails og finjustering av gjenfinning. Driftskostnaden er per samtale — embeddings er billige, men hvert svar betaler for LLM-kallet pluss de hentede kontekst-tokenene. En godt avgrenset agent løser typisk et klart flertall av rutinesaker til en brøkdel av kostnaden ved et menneskelig svar, og besparelsen vokser når kunnskapsbasen blir bedre. Feilen er å behandle den som et fast aktivum; det er et system som trenger en eier og et vedlikeholdsbudsjett.

Fallgruvene som senker prosjekter

  • Hallusinasjon uten kildehenvisning: hvis modellen kan svare uten å vise en kilde, vil den til slutt finne på en. Tving fram kildeforankrede svar.
  • En utdatert kunnskapsbase: agenten siterer selvsikkert en retningslinje du endret for tre måneder siden. Oppdateringer trenger en eier, ikke gode intensjoner.
  • Ingen menneskelig fallback: når gjenfinningen er svak, slår et høflig “jeg kobler deg til en person” et feil svar hver gang.
  • Gjenfinning som returnerer feil avsnitt: vanligvis et oppdelings- eller embedding-problem, ikke et modellproblem — fiks det før du klandrer LLM-en.
  • Å sende uten evaluering: du kan ikke forbedre det du ikke måler. Spor løsningsgrad, eskaleringsgrad og svarnøyaktighet fra dag én.

En god RAG-støtteagent er stort sett lite glamorøst arbeid: rene data, ærlige guardrails og en måleløkke. Modellen er den enkle delen. Vi bygger dem på samme måte som alt annet — senior-gjennomgått, avgrenset til en tydelig jobb og sendt med en plan for dagen kunnskapsbasen endres.