RAG-chatbot ei ole malli, joka ”tuntee yrityksesi”. Se on hakujärjestelmä, joka on kytketty kielimalliin: kun asiakas kysyy jotain, järjestelmä etsii ensin dokumentaatiostasi olennaisimmat kohdat ja pyytää sitten LLM:ää vastaamaan vain niiden perusteella. Tee haku oikein — malli pysyy faktoissa. Tee väärin — saat itsevarman valehtelijan brändisi alla.
Arkkitehtuuri alusta loppuun
- Tietolähteet: ohjekeskuksen artikkelit, tuotedokumentaatio, vanhat tiketit, käytännöt. Puhtaat, ilman duplikaatteja, selkeä omistaja päivityksille.
- Pilkkominen ja upotukset: dokumentit jaetaan kappaleisiin ja muunnetaan vektoreiksi, jotta haku toimii merkityksellä eikä vain avainsanoilla.
- Vektorivarasto: tietokanta (pgvector, Pinecone, Qdrant), joka palauttaa lähimmät kappaleet mihin tahansa kysymykseen millisekunneissa.
- Haku + kehote: parhaat kappaleet lisätään kehotteeseen ohjeella vastata vain niiden pohjalta ja viitata lähteeseen.
- Guardrails: kieltäytymissäännöt, luottamuskynnys ja siirto ihmiselle, kun haku tuottaa heikon tuloksen.
Mitä se oikeasti maksaa
Kaksi kustannusriviä ratkaisee. Rakennuskustannus on enimmäkseen kertaluonteinen: tietopohjan siivous, putken kytkentä, guardrailsien kirjoittaminen ja haun viritys. Ajokustannus on keskustelua kohti — upotukset ovat halpoja, mutta jokainen vastaus maksaa LLM-kutsun plus haetun kontekstin tokenit. Hyvin rajattu agentti ratkaisee yleensä selvän enemmistön rutiinitiketeistä murto-osalla ihmisvastauksen hinnasta, ja säästö kasvaa tietopohjan parantuessa. Virhe on pitää sitä kiinteänä omaisuutena; se on järjestelmä, joka tarvitsee omistajan ja ylläpitobudjetin.
Sudenkuopat, jotka upottavat projektit
- Hallusinaatio ilman lähdettä: jos malli voi vastata näyttämättä lähdettä, se keksii sen lopulta. Pakota lähdepohjaiset vastaukset.
- Vanhentunut tietopohja: agentti siteeraa itsevarmasti käytäntöä, jonka muutit kolme kuukautta sitten. Päivitykset tarvitsevat omistajan, eivät hyviä aikomuksia.
- Ei ihmisvarayhteyttä: kun haku on heikko, kohtelias ”yhdistän sinut ihmiseen” voittaa väärän vastauksen joka kerta.
- Haku palauttaa väärät kappaleet: yleensä pilkkomis- tai upotusongelma, ei malliongelma — korjaa ennen kuin syytät LLM:ää.
- Julkaisu ilman arviointia: et voi parantaa sitä, mitä et mittaa. Seuraa ratkaisuastetta, eskalaatioastetta ja vastausten tarkkuutta ensimmäisestä päivästä.
Hyvä RAG-tukiagentti on enimmäkseen vaatimatonta työtä: puhdas data, rehelliset guardrails ja mittaussilmukka. Malli on helppo osa. Rakennamme niitä samalla tavalla kuin kaiken muunkin — seniorin tarkastamana, selkeään tehtävään rajattuna ja suunnitelmalla siihen päivään, jolloin tietopohja muuttuu.
Liittyvät palvelut