Kennisbank

CV anonimiseren: methoden, valkuilen en tools.

Een cv anonimiseren klinkt simpel: naam eruit, klaar. In de praktijk lekt er bijna altijd iets — een e-mailadres in de metadata, een naam in de koptekst, een zwarte balk waar de tekst gewoon onder staat. Dit artikel zet de vier methoden naast elkaar en geeft de checklist van wat er écht uit moet.

Laatst bijgewerkt: · SignalMatch, product van SPAIK

Waarom anonimiseren?

Twee redenen, en ze versterken elkaar. Compliance: een cv doorsturen naar een opdrachtgever is het verstrekken van persoonsgegevens aan een derde — daarvoor heb je onder de AVG een grondslag nodig (zie Mag ik een cv doorsturen naar een klant?). Uit onderzoek aangehaald door HR Praktijk moet minimaal 40% van de werkgevers verzamelde cv’s wissen of anonimiseren om aan de AVG te voldoen. Commercieel: een geanonimiseerd profiel voorkomt dat je klant de kandidaat rechtstreeks benadert en je fee omzeilt.

Wat moet eruit? De checklist

Een volledig geanonimiseerd cv bevat geen van deze negen categorieën meer:

  • Naam — ook in koptekst, voettekst en bestandsnaam
  • E-mailadres — ook in de PDF-metadata (auteur-veld)
  • Telefoonnummer
  • Adres — straat, postcode én woonplaats
  • Geboortedatum
  • BSN — komt voor op oudere cv’s en uitzendformulieren
  • IBAN — idem
  • URL’s — LinkedIn-profiel, portfolio, persoonlijke site: één klik en de anonimisering is ongedaan
  • Foto

De vier methoden vergeleken

MethodeTijd per cvGrootste risico
Handmatig in Word10–15 minutenMenselijke fouten: kopteksten, metadata, tweede vermelding op pagina 3
Zwarte balk in PDF5–10 minutenTekstlaag blijft bestaan: selecteren + kopiëren toont de originele tekst
Regex-scriptSecondenMist alles zonder vast patroon: namen, adressen, “bereikbaar via mijn vrouw”
AI PII-detectie + manifestSeconden tot een minuutVereist controle-mechanisme: je wil zien wát er verwijderd is

Methode 1: handmatig

Werkt, maar schaalt niet en is foutgevoelig. Bij 20 cv’s per week kost het 4–5 uur, en de fouten zitten nooit in de eerste alinea — ze zitten in de koptekst die je in Word niet ziet, het auteur-veld in de PDF-eigenschappen, of de naam die op pagina 3 nog een keer voorkomt.

Methode 2: de zwarte balk

De bekendste valkuil. Een rechthoek óver tekst tekenen in een PDF-editor verbergt de tekst alleen visueel: de tekstlaag eronder blijft bestaan. Iedereen die de tekst selecteert en kopieert — of de PDF door een tekst-extractor haalt, wat elk ATS doet — leest gewoon de originele gegevens. Dit patroon duikt al jaren op in datalek-meldingen.

Methode 3: zoek-en-vervang of regex

Een script dat e-mailadressen en telefoonnummers herkent, vangt de gestructureerde gegevens. Maar namen, adressen en vrije-tekstverwijzingen hebben geen vast patroon. Een regex-pas is een goede minimale basis (zo gebruikt SignalMatch hem als lichtgewicht modus wanneer je anonimiseren bewust uitzet), geen volledige oplossing.

Methode 4: AI-gebaseerde PII-detectie met manifest

Named-entity-detectie (zoals het open-source Microsoft Presidio, of gespecialiseerde EU-gehoste modellen) herkent ook ongestructureerde persoonsgegevens in context. De twee eisen die je aan zo’n tool moet stellen:

  • Een PII-manifest per cv: een lijst van wat er verwijderd is, per categorie. Zonder manifest kun je niet controleren of de anonimisering compleet was — en aantoonbaarheid is precies wat de AVG (artikel 5, verantwoordingsplicht) van je vraagt.
  • EU-verwerking zonder dataretentie: het is vreemd om een privacy-probleem op te lossen door cv’s naar een Amerikaanse AI-provider te sturen die ze bewaart. Vraag naar de regio en de retentie-afspraken van elke tool die je overweegt.

SignalMatch werkt op deze vierde manier: PII-detectie draait op eigen EU-servers, elke verwijdering staat in het manifest, en het geanonimiseerde profiel wordt direct in jouw huisstijl gerenderd. Details over de architectuur staan op de privacy-pagina.

Veelgestelde vragen

Is een zwarte balk over de naam genoeg?

Nee. In vrijwel alle PDF-editors blijft de tekstlaag onder de balk bestaan en is de naam met selecteren of kopiëren terug te halen. Echte redactie verwijdert de tekst uit het bestand zelf — inclusief metadata.

Welke gegevens moet ik minimaal verwijderen?

Alles wat de kandidaat direct identificeert of direct bereikbaar maakt: naam, contactgegevens, adres, geboortedatum, foto en URL’s naar persoonlijke profielen. BSN en IBAN horen sowieso nooit bij een opdrachtgever terecht te komen.

Hoe controleer ik of alles weg is?

Drie checks: selecteer alle tekst in de PDF en plak die in een kale editor (vind je de naam?), open de documenteigenschappen (staat het e-mailadres in het auteur-veld?), en gebruik een tool die een verwijder-manifest oplevert zodat je per cv kunt aantonen wat er is weggehaald.

Bronnen

Probeer het met een echt CV.

5 CV's gratis per maand. Geen creditcard, geen demo-call. Upload een CV en zie binnen 60 seconden een klantklaar profiel in je eigen huisstijl.

Maak gratis account