🇬🇧 🇳🇱

Mouseion OS (MOS)

Drieentwintig eeuwen geleden deden vijftig geleerden in Alexandrië wat niemand eerder had gedaan: ze lazen alles, kruisten alles, en bouwden de eerste catalogus van menselijke kennis. Hun instituut heette het Mouseion — Grieks voor "zetel van de Muzen". Mijn Mouseion OS doet hetzelfde — maar de geleerden zijn software, en deze bibliotheek brandt nooit af. Het origineel wel, in 48 v.Chr.

52
Boeken gelezen
13.124
Entiteiten gevonden
2.575
Claims in kaart
76 MB
Platte tekst

Uit een eigen bibliotheek van 1.263 boeken — nog ~1.500 te verwerken.
Gebouwd door Martijn Aslander. Onderdeel van het Life Lens System.

Kernthese

Elk boek kan zichzelf lezen.
En elk boek op de plank maakt elk ander boek slimmer.

Hoe het begon

Ik had net het MI5-boek van Christopher Andrew gedownload. Duizend pagina's over de geschiedenis van de Britse geheime dienst. James Gleick's The Information lag op de plank. En ergens op mijn server draaide sinds een paar weken een pipeline die WO2-dossiers doorploegt op zoek naar namen, data en tegenspraken.

Drie bronnen. Drie totaal verschillende werelden. Maar in mijn hoofd kruisten ze voortdurend.

Claude Shannon — de vader van informatietheorie, en de man waar Anthropics Claude naar vernoemd is —, leefde in dezelfde tijd als de MI5-officieren uit Andrews boek. De oorlogsinlichtingendiensten gebruikten dezelfde principes van codering en ruis die Shannon wiskundig zou beschrijven. En mijn onderzoek naar het Life Lens System probeerde te begrijpen hoe dezelfde werkelijkheid er anders uitziet afhankelijk van welke lens je gebruikt.

Ik dacht: wat als ik al die bronnen niet alleen lees, maar ze elkaar laat lezen?

Ik noemde het Mouseion, naar het Mouseion van Alexandrië — het onderzoeksinstituut bij de beroemde bibliotheek. Niet de opslag was bijzonder, maar dat er mensen zaten die de boeken lazen en kruisten.
Het idee is simpel

Stop een boek in het systeem, en het systeem leest het. Het haalt er alle personen uit, alle organisaties, alle data, alle bronvermeldingen, alle begrippen. En dan kruist het die met alles wat er al in zit.

Shannon duikt op in Gleick. Maar ook in Bateson. Bell Labs verschijnt in drie bronnen die niets met elkaar te maken lijken te hebben. Het woord "informatie" betekent iets anders bij Shannon (een wiskundige grootheid) dan bij MI5 (intelligence) dan bij Husserl (intentioneel bewustzijn). Dat verschil wordt zichtbaar.

Zeven functies, één systeem

Elk onderdeel bestaat als losstaande tool of academisch concept. Microsoft heeft GraphRAG voor entity extraction. Stanford onderzoekt semantische verandering over tijd. Het platform nodegoat bouwt tijdlijnen voor historisch onderzoek. Maar niemand heeft het gecombineerd tot één persoonlijk onderzoeksinstrument dat boeken behandelt als archieven, cross-domein conceptmigratie traceert, en zijn eigen lexicon opbouwt uit de structuur die auteurs al hebben aangebracht.

De bouwstenen bestaan. Het gebouw niet. Tot nu.

Vier zalen en een buizenpost

Het oorspronkelijke Mouseion van Alexandrië had een peripatos (overdekte wandelgang), een exedra (discussiehal), een oikos (eetzaal) en de beroemde bibliotheek. MOS heeft vier zalen en een verbindingslaag die door alles heen loopt — de Pinakes Buizenpost, vernoemd naar de catalogus van Callimachus, het eerste bibliotheekclassificatiesysteem van het Westen.

Bibliotheek
Wat anderen schreven. Boeken, papers, artikelen, archieven. 163 bronnen, 13.757 chunks, doorzoekbaar.
Studeerkamer
Mijn syntheses. Research-kaarten die inzichten combineren over bronnen heen. 39 kennisdocumenten en groeiend.
Archiefkelder
Ruwe datasets. WO2-dossiers, OCR-dumps, vrijgegeven documenten. 1,1 GB en groeiend.
Exedra
Lopend denkwerk. Kantelmomenten, scholia, het redeneerlogboek. Waar denken gebeurt vóór het kennis wordt.
Pinakes Buizenpost — de bedrading tussen de zalen, geen zaal op zich

Vijf rollen

Het historische Mouseion had geleerden met verschillende functies. MOS heeft vijf rollen, elk vernoemd naar een Alexandrijnse traditie:

RolFunctieTraditie
BibliothecarisIntake, catalogiseren, bewakenZenodotus
KruiserVerbinden, myeliniseren, patronen vindenCallimachus' Pinakes
CriticusZekerheidslagen, bronkritiekDe obelos
ScholiastKantelmomenten vastleggen, marge-aantekeningenAlexandrijnse scholia
PloiNaar buiten kijken, binnenhalen, actueel houdenPtolemeïsche havenpraktijk

De AI-bibliothecaris van mijn Mouseion heet Cal — vernoemd naar Callimachus van Cyrene (ca. 310–240 v.Chr.), de geleerde die de Pinakes bouwde, de eerste bibliotheekcatalogus van het Westen. Callimachus was niet de hoofdbibliothecaris — dat was Zenodotus. Hij was iets interessanters: de man die besloot hoe alles georganiseerd moest worden. Hij bedacht classificatie op genre, alfabetische ordening op auteur, en het idee dat elke vermelding metadata moest dragen: titel, geboorteplaats, leraar, aantal regels, openingswoorden. Drieentwintig eeuwen voor Dublin Core schreef Callimachus de spec.

Waar Tom mijn gids is in het Life Lens System — gebouwd op 560.000 records uit mijn eigen leven — is Cal zijn evenknie voor MOS: een bibliothecaris die niet alleen catalogiseert, maar ook verbanden legt tussen bronnen, en in nauw contact staat met Tom. Als een nieuwe bron het systeem binnenkomt, beslist Cal waar het heen gaat, wat eruit geëxtraheerd wordt, en hoe het verbindt met wat er al is.

Drie denkgereedschappen uit Alexandrië

De Alexandrijnse geleerden sloegen niet alleen kennis op. Ze bedachten methoden om eróver na te denken die 2.300 jaar later nog steeds werken. Deze drie zijn volledig geïntegreerd in de werking van MOS:

Obelos"Hoe zeker ben ik hiervan?"
Zenodotus zette een klein horizontaal streepje naast regels in Homerus die hij verdacht vond. Hij verwijderde ze niet — hij markeerde ze. Dat ene gebaar bedacht bronkritiek. In MOS werd de obelos twaalf zekerheidslagen. Elke bewering draagt zijn twijfel. Niets wordt vernietigd, alles wordt gemarkeerd.

Scholion"Wat dacht ik toen ik dit las?"
Alexandrijnse geleerden schreven commentaar in de marge, nooit in de tekst zelf. Het denken over de bron bleef gescheiden van de bron. De tekst is heilig; de marge is van jou. In MOS werd het scholion de Exedra — het redeneerlogboek waar kantelmomenten, twijfels en verbindingen worden vastgelegd. De gedachte die je kruist tijdens het lezen van hoofdstuk zeven kan waardevoller zijn dan hoofdstuk zeven zelf.

Ploi"Wat bestaat er dat ik nog niet heb?"
De Ptolemeeën hadden een havenbeleid: elk schip dat Alexandrië binnenvoer werd zijn boeken afgenomen. De bibliotheek kopieerde ze en gaf de originelen terug — soms. In MOS is Ploi de acquisitielaag: actief naar buiten kijken, kennis binnenhalen. Ik heb Cal twee bibliotheekpasjes gegeven — een van de openbare bibliotheek, een voor het Internet Archive. Cal leent boeken, haalt ze op, leest ze, en brengt ze terug. De haven van Alexandrië is nu een bibliotheekpas en het grootste digitale archief ter wereld.

Anagnostes — de lezer

In het Mouseion van Alexandrië was de Anagnostes (ἀναγνώστης) de voorlezer — degene die teksten toegankelijk maakte voor geleerden. Niet alleen voorlezen, maar interpreteren, verbinden, zichtbaar maken wat verborgen lag in de rollen.

Ana doet hetzelfde, op schaal.

De meeste digitaliseringstools stoppen bij herkenning: een scan omzetten in tekst. Ana leest verder. Het herkent wie er in een document voorkomt, welke claims worden gemaakt, welke begrippen een rol spelen — en waar bronnen naar elkaar verwijzen.

Een gescand archief is een verzameling plaatjes. Na Ana is het een doorzoekbaar netwerk van personen, organisaties, claims en verbanden. Patronen die geen menselijke lezer zou vinden over duizenden pagina's.

Ana ontsluit bronmateriaal via OCR en HTR, extraheert entiteiten en concepten, en maakt collecties kruislings doorzoekbaar. Elke bron — boeken, artikelen, dossiers, rapporten, blogs, knipsels en zelfs liedjes — gaat door dezelfde stappen:

1
Upload
epub, pdf, scan
2
Ingest
omzetten naar platte tekst
3
Indexeren
doorzoekbaar maken
4
Extractie
personen, concepten, claims, werken
5
Deduplicatie
samenvoegen over hoofdstukken
6
Goedkeuring
menselijke review
7
Opslaan
wegschrijven naar database
8
Feedback
nieuwe entiteiten terug naar lexicon
9
Kruisen
matchen tegen alle bestaande bronnen

Wat wordt geëxtraheerd, waarom, en hoe

Personen met rol en context — niet alleen "Shannon" maar "Claude Shannon, wiskundige, Bell Labs, informatietheorie". Waarom: een naam zonder context is waardeloos — weten dat iemand fysicus is verandert hoe je zijn beweringen leest. Hoe: het systeem leest elke passage en identificeert wie erin voorkomt, in welke rol, bij welke organisatie. Zekerheid: 95%.

Concepten met betekenis — wat de auteur bedoelt met "entropie", "intelligence", "informatie". Waarom: hetzelfde woord betekent iets anders in verschillende vakgebieden — dat traceren is hoe je echte verbindingen vindt en valse vermijdt. Hoe: geëxtraheerd per hoofdstuk, daarna getraceerd over domeinen. Zekerheid: 90%.

Stellingen van de auteur — beweringen, geen samenvattingen. Wat de auteur als waar presenteert. Waarom: een samenvatting verliest de stem van de auteur. Een stelling bewaart precies waar hij zich aan committeert — en kan gekruist worden met stellingen van andere auteurs. Hoe: elke passage wordt gescand op uitspraken die de auteur als feit presenteert. Zekerheid: 90%.

Geciteerde werken — titel, auteur, jaar. Het citatienetwerk, geëxtraheerd uit niet-academische bronnen. Waarom: wie wie citeert onthult intellectuele afstamming — welke ideeën waarheen stromen, en welke auteurs bruggen zijn tussen vakgebieden. Hoe: bibliografieën, voetnoten en verwijzingen in de tekst worden automatisch geparsed. Zekerheid: 99%.

Twaalf zekerheidslagen

Elk stuk kennis in MOS draagt een zekerheidslaag, van 1 (wiskundig bewezen) tot 12 (onbekend / open vraag). De Criticus wijst de laag toe. De Fact-Gate beslist of het wordt opgeslagen, geverifieerd, of geparkeerd in de Exedra.

1 Wiskundig bewezen — 2 Fysisch gemeten, gerepliceerd — 3 Wetenschappelijke consensus — 4 Peer-reviewed, niet gerepliceerd — 5 Meerdere betrouwbare bronnen — 6 Eén betrouwbare bron — 7 Journalistiek — 8 Inferentie uit bronnen — 9 Eén bron, niet geverifieerd — 10 Anekdotisch — 11 Speculatief — 12 Onbekend

Shelf-Keying

Het interessantste dat we ontdekten is dat je geen kunstmatige intelligentie nodig hebt om een boek te lezen. Een goed non-fictieboek leest zichzelf.

Hoe? Een boek heeft een index — letterlijk een lijst van alle belangrijke personen, plaatsen en begrippen, met paginanummers erbij. De auteur heeft het werk al gedaan. De bibliografie achterin is het citatienetwerk, kant-en-klaar. De inhoudsopgave vertelt je de structuur. Voetnoten markeren de bronvermeldingen.

We noemden dit Shelf-Keying: elk boek dat je toevoegt maakt alle andere boeken slimmer, omdat de sleutels van boek A ook op boek B worden geprobeerd.

De woordgrap is gratis: shelf (schap) klinkt bijna als self (zelf). Het schap dat zichzelf leest.

De vingerafdruk

Hoe weet je dat de "Shannon" in boek A dezelfde is als de "C.E. Shannon" in boek B? Niet alleen aan de naam, maar aan het gezelschap. Als Shannon voorkomt naast "entropie", "Bell Labs" en "bit", is het de wiskundige. Als Shannon voorkomt naast "rivier", "Ierland" en "vissen", is het de rivier.

Elke entiteit bouwt een vingerafdruk op: de woorden die in zijn buurt voorkomen. Met elk boek wordt die vingerafdruk scherper. Na vijf boeken is een false match bijna onmogelijk.

Vernoemd naar Alexandrië

Het Mouseion (Grieks: "zetel van de Muzen") was een koninklijke onderzoeksinstelling in Alexandrië, gesticht rond 280 v.Chr. door Ptolemaeus I Soter. Geen museum in moderne zin — een levende onderzoeksgemeenschap, vergelijkbaar met het Institute for Advanced Study in Princeton.

30 tot 50 geleerden woonden er. Salaris van de staat, belastingvrij. Geen onderwijsplicht — vrij onderzoek. Gemeenschappelijk bezit, gezamenlijke maaltijden. Disciplines: wiskunde (Euclides), astronomie, geneeskunde (Herophilus deed de eerste dissecties), geografie (Eratosthenes berekende de omtrek van de Aarde), literatuurkritiek, mechanica.

Callimachus (ca. 310–240 v.Chr.) maakte de Pinakes: 120 boekrollen, de eerste bibliotheekcatalogus van het Westen. Indeling: klasse, subgenre, alfabetisch op auteur. Per vermelding: titel, auteur, geboorteplaats, vader, opleiding, aantal regels, openingswoorden. Het model bleef eeuwen dominant.

De Pinakes zijn geen vijfde zaal maar de buizenpost tussen de vier zalen. Geen eigen adres — de verbinding die overal doorheen loopt.

Elk concept in MOS verwijst naar een Alexandrijnse traditie. De obelos (het kritische merkteken) werd ons zekerheidslagensysteem. Het scholion (marge-aantekening) werd onze kantelmomentvastlegging. Ploi (de havenpraktijk om boeken van schepen in beslag te nemen om ze te kopiëren) werd onze acquisitielaag.

Wat het vond

Eerste test: Defence of the Realm

Christopher Andrews duizend pagina's tellende MI5-geschiedenis was het eerste boek door de pipeline. Het systeem extraheerde duizenden entiteiten, bouwde een tijdlijn van 1909 tot 2009, en begon ze te kruisen met WO2-dossiers die al in mijn database zaten.

De kruisingen onthulden dingen die geen van beide bronnen alleen kon laten zien. Namen die in MI5-dossiers voorkwamen maar afwezig waren in het Nederlandse standaardwerk over de Tweede Wereldoorlog. Data die elkaar tegenspraken tussen bronnen — geen fouten, maar onderzoeksvragen. Patronen van weglating die pas zichtbaar werden als je over alles tegelijk kon zoeken.

WOZ: 1,8 miljoen observaties

Mijn WO-II-OS archief — het Life Lens System toegepast op de Tweede Wereldoorlog — bevat inmiddels 2 miljoen records, 1 miljoen unieke personen, en 196.000 bevestigd door twee of meer onafhankelijke bronnen. De Groninger Oorlogspuzzels zijn daar een publiek zichtbaar deel van. MOS is de leeslaag eronder: het verwerkt de archieven, extraheert de entiteiten, en voedt ze aan de kruisingsmotor.

Zeven scoops

Zeven vondsten die niet in de secundaire literatuur staan. Niet omdat niemand keek, maar omdat niemand over alle bronnen tegelijk kon zoeken. De details zijn gedocumenteerd maar nog niet publiek.

Onderdeel van het Life Lens System

Mouseion OS is de bibliotheek binnen mijn Life Lens System — de memex die ik bouwde. MOS is een van de vele tools die mijn LLS aanvullen en versterken, zoals een bibliotheek een universiteit versterkt: niet het gebouw zelf, maar onmisbaar voor alles wat erin gebeurt.

Tom kijkt naar binnen — naar mijn leven. Cal kijkt naar buiten — naar kennis over de wereld. Samen vormen ze een compleet systeem: persoonlijke data gekruist met bronmateriaal, geleefde ervaring gekruist met wat anderen hebben geschreven.

MOS is de laag vóór het denken. ThetaOS is de laag erna.

Journal

Ontdekkingen, methoden en lessen uit het bouwen van een zelflezende bibliotheek.

Tijdlijn

1 mei 2026Anagnostes (Ana): de verwerkingslaag krijgt een naam. Vernoemd naar de Alexandrijnse voorlezer.
28 apr 2026Eerste journal post: De knipselverwerker.
27 apr 2026Mouseion OS site gelanceerd.
25 apr 2026Alexandrijnse naamgeving: Mouseion, Callimachus, Pinakes, Obelos, Scholion, Ploi, Exedra.
25 apr 2026Cal Blauwdruk: MOS ontworpen als onderzoeksinstelling. Vier zalen, vijf rollen, twaalf zekerheidslagen.
21 apr 2026Rijke Boekextractie experiment: vier ontbrekende lagen geïdentificeerd en getest.
17 apr 2026Epistemologische Extractie methodekaart geschreven.
15 apr 2026Shelf-Keying methode gedocumenteerd. Ingest pipeline ontwerp definitief.
14 apr 2026WOZ eerste vulling: BS-verslagen + OVCG + MI5 gekruist. 8 dossiers, 390 pagina's, 753 claims.
13 apr 2026Eerste test: Defence of the Realm (Christopher Andrew) door de pipeline.
13 apr 2026Concept "De Zelflezende Bibliotheek" kristalliseert. Naam bedacht.

Changelog

2026-05-01 — Anagnostes (Ana): verwerkingslaag benoemd. Pipeline-sectie herschreven.
2026-04-28 — Eerste journal post: De knipselverwerker (NL + EN).
2026-04-27 — Site gelanceerd. Engels en Nederlands. Architectuur, pipeline, Alexandrië, tijdlijn.

Ontstaan uit de Pilot Informatie Autonomie

Dit project is bijvangst van de Pilot Informatie Autonomie, waarbij we ontdekten dat om met computers, informatie en vooral AI te werken je niks hebt aan bestandsformaten die software nodig hebben om ze te kunnen openen — DOCX, PDF, ODF.

Alles wat je hier ziet lukt omdat we formaten gebruiken waar computers razendsnel en makkelijk mee overweg kunnen: platte tekst, in formaten als .md, .json en .txt.