← terug naar journaal
Gepubliceerd 15 mei 2026 · door Thomas Kolmans

De RAG-pipeline die we eigenlijk willen

De meeste RAG-stacks behandelen stille en expliciete kennis als dezelfde vorm. Dat zijn ze niet. Dit is de pipeline die we bouwen.

Stille en expliciete kennis hebben niet dezelfde vorm

Expliciete kennis is tekst. Chunk het, embed het, haal het op, re-rank, genereer. Standaard werk.

Stille kennis is anders. Het is:

  • gesproken, niet geschreven
  • relationeel ("we deden dit omdat Karen terugduwde")
  • temporeel ("dit klopte in maart, minder in mei")
  • contextueel ("dit geldt voor enterprise, niet voor self-serve")

Een RAG-pipeline die die signalen platslaat tot een 1024-dim embedding verliest precies wat de kennis ophalen-waard maakt.

Wat we bouwen

De tacitylab-pipeline draait om vier lagen:

  1. Vanglaag. Async gestructureerde interviews en korte videoprompts. Elke clip wordt getranscribeerd, samengevat, en uiteengelegd in getypte beweringen (besluit, principe, anekdote, anti-patroon, etc.).
  2. Verwerklaag. Read-only connectors trekken docs, threads, tickets en notulen erbij. We kopiëren nooit ruwe content uit je tenant.
  3. Retrieval-laag. Hybride retrieval (lexicaal + semantisch) plus een re-ranker getuned op opgevangen interviews. Bewering-type-bewust: een "besluit"-query loopt anders dan een "hoe-doe-ik"-query.
  4. Grounding-laag. Elk antwoord komt met bron, spreker, datum. Als het bewijs zwak is, weigert tacitylab. Liever "ik weet het niet" dan hallucineren.

Wat lastig is

Het lastige is niet het embedding-model. Het is het vangen: een senior engineer vijftien jaar context laten kwijtraken op een manier die over vijf jaar nog opvraagbaar is. Dat is de wedde.

Ook inEnglish
MS-∞ · waitlist

Maak wat je team
weet, vindbaar.

Private beta opent Q3 2026. Oprichters bij elke onboarding.