De VUB-campus in Etterbeek aan Triomf- en Pleinlaan

VUB ontwikkelt software die oude documenten scant als nieuw

© Belga
10/12/2020

Papieren documenten durven na verloop van tijd al eens scheuren of vlekken vertonen. Aan de onderzoeksgroep Digital Mathematics van de Vrije Universiteit Brussel (VUB) heeft doctoraatsstudent Tan Lu software ontwikkeld die door deze gebreken heen kijkt en zonder problemen oude, beschadigde documenten helpt digitaliseren.

Het digitaliseren van oude archieven is een erg belangrijk proces in de culturele erfgoedsector. Alleen worden kranten en manuscripten er helaas niet beter leesbaar op doorheen de vele jaren. Momenteel gebeurt die digitalisatie via Optical Character Recognition (OCR), maar die technologie is nog verre van perfect. De gebruikte algoritmes hebben moeite met schade aan pagina's en bepaalde tekstopmaak die vaak voorkomt in reclame en modetijdschriften kan de computer in de war brengen.

Lu vond hier een oplossing voor door een reeks zogeheten homogeniteitsmodellen te ontwikkelen, waarbij hij gebruik maakte van de bestaande kennis over de manier waarop de menselijke hersenen omgaan met gecompliceerde beelden. Zo leerde hij de computer bij het scannen vervormingen, beschadigingen en een moeilijke layout herkennen.

"De gestaltpsychologie leert ons bijvoorbeeld dat mensen losse objecten van een zelfde soort van nature met elkaar groeperen tot één groep. Omdat computers dit vermogen missen, struikelen ze vaker over tekstherkenning in moeilijke layouts of in beschadigde zones. Ze zijn, anders dan mensen, niet in staat de verschillende delen van een beschadigd beeld te recombineren", vertelt Lu.

De wiskundige modellen van Lu tonen zo een deel van het ware potentieel dat schuilgaat achter de digitalisering van oude en waardevolle documenten.

Fijn dat je wil reageren. Wie reageert, gaat akkoord met onze huisregels. Hoe reageren via Disqus? Een woordje uitleg.

Lees meer over: Brussel, Elsene, Etterbeek, Wetenschap, VUB, scannen, software, digital mathematics

Iets gezien in de stad? Meld het aan onze redactie

Site by wieni