De RAG-pipeline die we eigenlijk willen

De meeste RAG-stacks behandelen stille en expliciete kennis als dezelfde vorm. Dat zijn ze niet. Dit is de pipeline die we bouwen.

Stille en expliciete kennis hebben niet dezelfde vorm

Expliciete kennis is tekst. Chunk het, embed het, haal het op, re-rank, genereer. Standaard werk.

Stille kennis is anders. Het is:

gesproken, niet geschreven
relationeel ("we deden dit omdat Karen terugduwde")
temporeel ("dit klopte in maart, minder in mei")
contextueel ("dit geldt voor enterprise, niet voor self-serve")

Een RAG-pipeline die die signalen platslaat tot een 1024-dim embedding verliest precies wat de kennis ophalen-waard maakt.

Wat we bouwen

De tacitylab-pipeline draait om vier lagen:

Vanglaag. Async gestructureerde interviews en korte videoprompts. Elke clip wordt getranscribeerd, samengevat, en uiteengelegd in getypte beweringen (besluit, principe, anekdote, anti-patroon, etc.).
Verwerklaag. Read-only connectors trekken docs, threads, tickets en notulen erbij. We kopiëren nooit ruwe content uit je tenant.
Retrieval-laag. Hybride retrieval (lexicaal + semantisch) plus een re-ranker getuned op opgevangen interviews. Bewering-type-bewust: een "besluit"-query loopt anders dan een "hoe-doe-ik"-query.
Grounding-laag. Elk antwoord komt met bron, spreker, datum. Als het bewijs zwak is, weigert tacitylab. Liever "ik weet het niet" dan hallucineren.

Wat lastig is

Het lastige is niet het embedding-model. Het is het vangen: een senior engineer vijftien jaar context laten kwijtraken op een manier die over vijf jaar nog opvraagbaar is. Dat is de wedde.

De RAG-pipeline die we eigenlijk willen

Stille en expliciete kennis hebben niet dezelfde vorm

Wat we bouwen

Wat lastig is

Maak wat je teamweet, vindbaar.

Maak wat je team
weet, vindbaar.