Skip to main content
7 min lukuaikaNorvalda

RAG-asiakaspalveluagentin rakentaminen: arkkitehtuuri, kustannukset ja sudenkuopat

Miten RAG-tukiagentti oikeasti toimii, mitä sen ajaminen maksaa ja mitkä virhetilat nakertavat luottamusta hiljaa.

RAG-chatbot ei ole malli, joka ”tuntee yrityksesi”. Se on hakujärjestelmä, joka on kytketty kielimalliin: kun asiakas kysyy jotain, järjestelmä etsii ensin dokumentaatiostasi olennaisimmat kohdat ja pyytää sitten LLM:ää vastaamaan vain niiden perusteella. Tee haku oikein — malli pysyy faktoissa. Tee väärin — saat itsevarman valehtelijan brändisi alla.

Arkkitehtuuri alusta loppuun

  • Tietolähteet: ohjekeskuksen artikkelit, tuotedokumentaatio, vanhat tiketit, käytännöt. Puhtaat, ilman duplikaatteja, selkeä omistaja päivityksille.
  • Pilkkominen ja upotukset: dokumentit jaetaan kappaleisiin ja muunnetaan vektoreiksi, jotta haku toimii merkityksellä eikä vain avainsanoilla.
  • Vektorivarasto: tietokanta (pgvector, Pinecone, Qdrant), joka palauttaa lähimmät kappaleet mihin tahansa kysymykseen millisekunneissa.
  • Haku + kehote: parhaat kappaleet lisätään kehotteeseen ohjeella vastata vain niiden pohjalta ja viitata lähteeseen.
  • Guardrails: kieltäytymissäännöt, luottamuskynnys ja siirto ihmiselle, kun haku tuottaa heikon tuloksen.

Mitä se oikeasti maksaa

Kaksi kustannusriviä ratkaisee. Rakennuskustannus on enimmäkseen kertaluonteinen: tietopohjan siivous, putken kytkentä, guardrailsien kirjoittaminen ja haun viritys. Ajokustannus on keskustelua kohti — upotukset ovat halpoja, mutta jokainen vastaus maksaa LLM-kutsun plus haetun kontekstin tokenit. Hyvin rajattu agentti ratkaisee yleensä selvän enemmistön rutiinitiketeistä murto-osalla ihmisvastauksen hinnasta, ja säästö kasvaa tietopohjan parantuessa. Virhe on pitää sitä kiinteänä omaisuutena; se on järjestelmä, joka tarvitsee omistajan ja ylläpitobudjetin.

Sudenkuopat, jotka upottavat projektit

  • Hallusinaatio ilman lähdettä: jos malli voi vastata näyttämättä lähdettä, se keksii sen lopulta. Pakota lähdepohjaiset vastaukset.
  • Vanhentunut tietopohja: agentti siteeraa itsevarmasti käytäntöä, jonka muutit kolme kuukautta sitten. Päivitykset tarvitsevat omistajan, eivät hyviä aikomuksia.
  • Ei ihmisvarayhteyttä: kun haku on heikko, kohtelias ”yhdistän sinut ihmiseen” voittaa väärän vastauksen joka kerta.
  • Haku palauttaa väärät kappaleet: yleensä pilkkomis- tai upotusongelma, ei malliongelma — korjaa ennen kuin syytät LLM:ää.
  • Julkaisu ilman arviointia: et voi parantaa sitä, mitä et mittaa. Seuraa ratkaisuastetta, eskalaatioastetta ja vastausten tarkkuutta ensimmäisestä päivästä.

Hyvä RAG-tukiagentti on enimmäkseen vaatimatonta työtä: puhdas data, rehelliset guardrails ja mittaussilmukka. Malli on helppo osa. Rakennamme niitä samalla tavalla kuin kaiken muunkin — seniorin tarkastamana, selkeään tehtävään rajattuna ja suunnitelmalla siihen päivään, jolloin tietopohja muuttuu.