Changelog

Elke wijziging aan dit project, openbaar gedocumenteerd.

RSS Feed

2026

BP-scores herberekend over 3.024 kaarten — naar aanleiding van een scherpe observatie van Ika van Doorn

Ika van Doorn ontdekte dat de BP-scores op meerdere kaarten niet overeenkwamen met de beschrijving ernaast. Een kaart met een citaat en een externe match had soms een lagere score dan de BP-tabel op de methodepagina voorschrijft. Dat was een fout in de pipeline die de scores genereerde — de score en de beschrijving werden los van elkaar berekend en liepen uit de pas.

We hebben vanavond een herberekeningsscript geschreven dat elke kaart langsloopt, de checker-database raadpleegt (heeft een externe bron deze persoon bevestigd?) en de BP-score opnieuw berekent volgens exact de tabel op de methodepagina. Dat leverde 204 correcties op de kruisverhalen-pagina en 2.820 correcties op de archief-pagina.

Ik heb er bewust voor gekozen om dit hele project online te zetten terwijl het nog in ontwikkeling is, en via feedback van anderen te ontdekken wat er niet goed genoeg werkt en beter kan. Ik denk dat meer mensen dit zouden moeten doen — gewoon delen waar je mee bezig bent terwijl je ermee bezig bent. Natuurlijk maak je dan fouten, en zodra je ze ontdekt fix je ze. Dat is het leuke van experimenteren.

  • 204 BP-scores gecorrigeerd op de kruisverhalen-pagina
  • 2.820 BP-scores gecorrigeerd op de archief-pagina
  • 2.923 clipboard-teksten bijgewerkt: "in samenwerking met Agentic AI" vervangen door "met behulp van AI-transcriptie en -analyse"
  • 120 multi-kaart verhalen kregen een hogere BP-score door het tellen van unieke minr-nummers per verhaal — een verhaal dat naar 5 bronkaarten verwijst scoort nu 95% in plaats van 50%
  • Status "Bronkaart bevestigd" nu consistenter met de inhoud van de kaart
  • 3.152 klikbare ⓘ info-links bij elke BP-score, linken naar uitleg op de methodepagina
  • Alle minr-nummers klikbaar: originele gescande kaart opent als overlay op de pagina. Bron: Groninger Archieven, toegang 2183. Tip van Adri Mathlener.
  • Gemmeker-citaat van oma Albertien toegevoegd met voetnoot over afwijkende tijdlijn bij Ad van Liempt — transparant over de spanning tussen twee bronnen
  • Schoemaker: "hoofd" gecorrigeerd naar "plaatsvervangend hoofd" van de GDN
  • Vrouwen-getal verduidelijkt: 9 met eigen kaart, tientallen als bijzin op kaart van man/vader/broer
  • BP-beschrijvingen consistent gemaakt met de herberekende scores
  • Alle scores nu berekend op basis van de checker-database (extern bevestigd, extern gecheckt, citaat aanwezig)
Kritiekbestendig gemaakt, nieuwe pagina's, Engelse versie — naar aanleiding van waardevolle tips van Ika van Doorn en Olivier Heimel

Grondige herziening van de hele site ter voorbereiding op de presentatie bij het VOGIN-IP congres op 9 april 2026. Dank aan Ika van Doorn (researcher De Vrouwenmars) en Olivier Heimel voor hun scherpe feedback.

  • Disclaimer herschreven: preciezer over wat dit project is en wie het heeft gemaakt
  • Overclaims verwijderd: "niet eerder gelegd" overal vervangen door "voor zover wij weten"
  • "Geschatte betrouwbaarheid 95-98%" verwijderd: vervangen door eerlijke constatering dat er geen onafhankelijke validatie is gedaan
  • BP-score als werkmodel geframed: expliciet benoemd als eigen construct, niet als gevestigde methode
  • Bronkritiek-sectie toegevoegd: wie schreef de kaarten, wanneer, met welke selectie, vanuit welk perspectief
  • Nieuwe pagina: De mogelijke implicaties voor de archiefwereld — het verschil tussen transcriberen en informatiseren, Transkribus en VeleHanden benoemd, de pipeline die zichzelf verbetert, link naar het Luhmann Zettelkasten-project
  • Mondriaanfonds-project benoemd: OVCG Zichtbaar Online (2021) als context voor het bestaande digitaliseringswerk
  • Over-pagina herschreven: track record, boeken, Memex, Pilot Informatieautonomie, VOGIN-IP congres, profielfoto, LinkedIn
  • Vrouwenmars-documentaire: filmposter, groepsfoto Grijpskerk, credits Carla Wolbers, Ted Alkemade en Ika van Doorn
  • Tante Gé uitgebreid: Celebesstraat als verzetscel, Willem Schoemaker, missie naar Berlijn, vlucht op treindak
  • Google Form vervangt mailto: bijdragen komen nu betrouwbaar binnen in een spreadsheet
  • Engelse versie: drie vertaalde pagina's (homepage, about, archives) voor internationale nabestaanden, met taalvlaggetjes
  • GEO-optimalisatie: Schema.org markup, selectieve robots.txt, Open Graph tags voor social sharing
  • GoatCounter analytics toegevoegd op alle pagina's
  • robots.txt + noindex: data-pagina's beschermd, kernpagina's open voor AI-zoekmachines

Naar aanleiding van feedback Ika van Doorn:

  • "De bijzin die alles veranderde" naar bovenaan de homepage — het emotionele hart eerst
  • Subtitle ingekort: de verwijzing naar onbetrouwbaarheid van chatbots haalde de energie eruit
  • Kleuren aangepast: hypothese-label van goud naar rustblauw, BP-score van rood naar lichtgrijs, citaatblok van goud naar ivoor — zodat signaal- en accentkleuren niet meer door elkaar lopen
  • Tegelvolgorde: archief eerst (veilig instappen), bevindingen tweede
  • Bevindingen-tekst helderder: "233 aannemelijke verhaallijnen op basis van AI-combinatie van kaartinformatie"
  • Leeswijzer compacter en wegklikbaar op alle pagina's
  • Methode-pagina: titel toegevoegd, "Weak" van geel naar rood
  • "Kruisverificatie" vervangen door "kruisvergelijking"

Naar aanleiding van feedback Olivier Heimel:

  • Zoekfunctie op archief-pagina matcht nu op hele woorden — "Heimel" vindt niet langer "heimelijk"

Naar aanleiding van feedback Adri Mathlener:

  • Klikbare links naar de originele gescande kaarten bij de Groninger Archieven — staat op de lijst van geplande verbeteringen

Aanvullende feedback Ika van Doorn:

  • "Bevindingen" hernoemd naar "Kruisverhalen" — verhalen die boven komen drijven door kaarten over elkaar heen te leggen
  • Subtitel herschreven: niet "aannemelijker dan andere verhaallijnen" maar concreet beschrijven wat het is
Website opgesplitst in 7 pagina's + tijdlijn + changelog
  • Site opgesplitst van 1 pagina (8 MB) naar 7 pagina's: home, bevindingen, archief, methode, cijfers, tijdlijn, over
  • Tijdlijn-pagina gebouwd: 889 kaarten chronologisch, visuele barchart per maand (1940-1945)
  • Zoekbalk toegevoegd op archief-pagina
  • Changelog + RSS feed toegevoegd
  • Visuele redesign: Playfair Display + Source Sans 3, warm donkerblauwgrijs, bredere layout
Kwaliteitsaudit: overclaims en AI-hallucinaties gecorrigeerd
  • Status "Bewezen" hernoemd naar "Bronkaart bevestigd" op alle 2.777 kaarten
  • Leeswijzer/disclaimer toegevoegd bovenaan de verhalen
  • 319x "cruciaal rol" gecorrigeerd (taalfout + overclaim)
  • 159x "de belangrijkste" gedempt naar "een belangrijke"
  • 166x "toont aan dat" vervangen door "suggereert dat"
  • 62x "onmisbaar" vervangen door "waardevol"
  • 407x "dit illustreert" gevarieerd
  • 73x "zijn positie als" geneutraliseerd
  • Taalfouten gefixt: "onderernourissement", "beruchi"
Van 206 naar 3.034 verhalen via automatische pipeline
  • Generator-script gebouwd: Claude Haiku schrijft per kaart titel, citaat, context, redenering en open vraag
  • Pipeline-script: ovcg_pipeline_vps.py genereert, injecteert en crosscheckt in batches van 50
  • 206 → 286 (handmatig, rondes 40-42)
  • 286 → 500 (pipeline run 1, ~20 min)
  • 500 → 1.000 (pipeline run 2, ~50 min)
  • 1.000 → 3.034 (pipeline run 3+4, ~3 uur)
Crosschecker: 3.135 kaarten gecheckt tegen 6 online bronnen
  • Autochecker v3 gepatcht: lockfile (voorkomt dubbele instanties) + retry-logica (voorkomt DB-lock crashes)
  • 6 bronnen: oorlogsbronnen.nl, erelijst.nl, 4en5mei.nl, oorlogslevens.nl, Wikipedia, DuckDuckGo
  • Resultaat: 489 strong matches, 2.074 medium, 572 weak
  • BP-scores automatisch geüpgraded op basis van extern bewijs
Cross-referentie analyse: netwerken, families, datumclusters
  • 2.040 verbanden gevonden tussen kaarthouders en contactpersonen
  • 1 groot cluster van 1.036 onderling verbonden verzetsmensen
  • 203 achternaam-clusters met 3+ kaarten (mogelijke families)
  • 139 kaarten noemen verraad bij naam
  • 13 datumclusters met 5+ gelijktijdige arrestaties (razzia's)
  • 572 kaarten zonder sterke online bevestiging (potentieel nieuwe verhalen)
Eerste versie: 162 verhalen + onderzoeksrapport
  • 3.150 kaarten getranscribeerd met Gemini 2.5 Flash Vision AI in 100 minuten
  • 162 verhaalkaarten handmatig geschreven
  • Onderzoeksrapport: vrouwenmars, Cap Arcona, twee Freerk Lodes, deportatieroutes, verraders
  • Website gebouwd: single-page, donker thema, BP-scores, clipboard-knoppen
  • Methodiek-pagina geschreven
Nacht van de transcriptie
  • 4.004 kaarten geïnventariseerd via Groninger Archieven + Wayback Machine
  • 3.755 thumbnails gedownload (254×300px)
  • 3.150 kaarten getranscribeerd naar gestructureerde JSON
  • 19 API-keys, 8 parallelle workers, 2 batches, 100 minuten

Geplande verbeteringen

Dit project is niet af en zal het waarschijnlijk nooit zijn. Hieronder staat wat we van plan zijn te verbeteren, zodat je weet waar we mee bezig zijn en wat je kunt verwachten.

Verhalen bewaren en delen

Meerdere bezoekers gaven aan dat ze bepaalde verhalen willen kunnen opslaan of doorsturen naar familieleden. We bouwen een manier om verhalen als beknopte samenvatting te exporteren via een formulier, zodat je ze kunt bewaren of kunt mailen naar iemand die er misschien iets mee kan.

De ontbrekende kaarten

Van de 4.615 kaarten in de inventaris van de Groninger Archieven zijn er 3.150 getranscribeerd. De overige kaarten zijn bewust niet verwerkt omdat ze te weinig leesbare tekst bevatten — de pipeline selecteerde op de rijkste kaarten eerst, en wat overblijft is doorgaans te dun om zinvol te transcriberen. Ruim 600 kaarten hebben bovendien geen digitale scan. Als iemand ontdekt dat er in de onverwerkte kaarten toch iets waardevols staat, doen we dat met plezier alsnog.

Steekproefsgewijze kwaliteitscontrole

De AI-transcriptie is niet onafhankelijk gevalideerd. We willen minimaal honderd kaarten laten controleren door twee onafhankelijke lezers die de originele scan vergelijken met onze transcriptie, zodat we een betrouwbaar beeld krijgen van de foutmarge en weten waar de machine het vaakst de mist in gaat.