← terug naar journaal
Gepubliceerd 15 mei 2026 · door Thomas Kolmans
De RAG-pipeline die we eigenlijk willen
De meeste RAG-stacks behandelen stille en expliciete kennis als dezelfde vorm. Dat zijn ze niet. Dit is de pipeline die we bouwen.
Stille en expliciete kennis hebben niet dezelfde vorm
Expliciete kennis is tekst. Chunk het, embed het, haal het op, re-rank, genereer. Standaard werk.
Stille kennis is anders. Het is:
- gesproken, niet geschreven
- relationeel ("we deden dit omdat Karen terugduwde")
- temporeel ("dit klopte in maart, minder in mei")
- contextueel ("dit geldt voor enterprise, niet voor self-serve")
Een RAG-pipeline die die signalen platslaat tot een 1024-dim embedding verliest precies wat de kennis ophalen-waard maakt.
Wat we bouwen
De tacitylab-pipeline draait om vier lagen:
- Vanglaag. Async gestructureerde interviews en korte videoprompts. Elke clip wordt getranscribeerd, samengevat, en uiteengelegd in getypte beweringen (besluit, principe, anekdote, anti-patroon, etc.).
- Verwerklaag. Read-only connectors trekken docs, threads, tickets en notulen erbij. We kopiëren nooit ruwe content uit je tenant.
- Retrieval-laag. Hybride retrieval (lexicaal + semantisch) plus een re-ranker getuned op opgevangen interviews. Bewering-type-bewust: een "besluit"-query loopt anders dan een "hoe-doe-ik"-query.
- Grounding-laag. Elk antwoord komt met bron, spreker, datum. Als het bewijs zwak is, weigert tacitylab. Liever "ik weet het niet" dan hallucineren.
Wat lastig is
Het lastige is niet het embedding-model. Het is het vangen: een senior engineer vijftien jaar context laten kwijtraken op een manier die over vijf jaar nog opvraagbaar is. Dat is de wedde.
Ook inEnglish