Maruf Dhali en de kracht van AI
De Dode Zeerollen ontcijferd
‘Het is een van de grootste en belangrijkste vondsten van manuscripten in de afgelopen honderd jaar’, zegt Maruf Dhali over de honderden boekrollen die tussen 1947 en 1956 in elf grotten bij Jericho werden gevonden. De artefacten, voornamelijk gemaakt van perkament en beschreven met teksten uit de Hebreeuwse Bijbel, vertellen over historische gebeurtenissen, maar het is niet altijd duidelijk wie erover schreef of in welke volgorde die gebeurtenissen plaatsvonden.
In 2021, meer dan tweeduizend jaar nadat de rollen waren beschreven, wist Dhali, universitair hoofddocent kunstmatige intelligentie en machine learning, een antwoord te vinden op een lang onbeantwoorde vraag over de zogenaamde Jesaja-rol. Was deze door één persoon geschreven, of waren er mogelijk meerdere schrijvers betrokken?
Het klinkt misschien onbelangrijk, maar bewijs voor of tegen een theorie dat er meerdere schrijvers waren, kan ons meer vertellen over de samenleving van tweeduizend jaar geleden. ‘Je kunt dit koppelen aan allerlei andere gegevens en bijvoorbeeld vaststellen of mensen van de ene plaats naar de andere reisden om aan het boek bij te dragen’, aldus Dhali.
AI-model
Onderzoekers konden nooit bewijs vinden. ‘Omdat het handschrift door het hele boek heen zo uniform is, kun je met het menselijk oog geen verschillen zien’, legt Dhali uit. ‘De verschillen in schrijven zijn zo klein dat je heel veel data moet vergelijken.’
Je kunt met het menselijk oog geen verschil zien in handschrift
Een speciaal getraind AI-model – dat Dhali in twee jaar ontwikkelde – kan dit wel, hoewel er nog steeds menselijke input nodig is. ‘Experts trainen het model door aan te geven welk deel van de rol inkt van de tekst bevat en welk deel bestaat uit de blanco pagina.’ Vervolgens kan het model elk afzonderlijk Hebreeuws letterteken in de 54 kolommen van de rol vergelijken.
Dhali en zijn team ontdekten dat de Jesaja-rol door twee scribenten is geschreven, met vrijwel identiek handschrift. ‘Het feit dat ze zo vergelijkbaar schreven, suggereert dat er een soort training aan te pas kwam’, zegt Dhali. ‘Het werpt een ander licht op hun cultuur.’
Radiokoolstofdatering
Nu richt Dhali zich op de andere Dode Zeerollen. Duizenden daarvan missen een datum. ‘In sommige gevallen hebben experts slechts een vaag idee van wanneer deze rollen zijn geschreven en wanneer de beschreven gebeurtenissen plaatsvonden’, zegt Dhali. ‘Het is erg subjectief. Het is net als in je jeugd, wanneer je zegt “Ik viel toen ik vijf was”, en je moeder zegt “Nee, dat was toen je zes was.”’
Het model is nauwkeuriger dan de subjectieve inschattingen van experts
Om de rollen te dateren en een einde te maken aan de onzekerheid, maakt Dhali gebruik van radiokoolstofdatering, waarbij de hoeveelheid radioactieve koolstof in een monster wordt gemeten. Dit geeft informatie over de leeftijd van het object.
Collega’s van Dhali bij de isotopenafdeling van de RUG moeten hiervoor het monster verbranden. ‘Natuurlijk willen we niet de hele rol verbranden’, zegt hij. ‘Gelukkig hebben ze maar een heel klein deel van het monster nodig, slechts een paar milligram.’
Dankzij AI hoeft hij echter niet alle rollen op die manier te dateren. ‘Als beginpunt hoeven we slechts ongeveer dertig documenten te meten.’ Met die informatie kan een AI-model – dat ze Enoch genoemd hebben – de leeftijd berekenen voor verwante documenten uit de periodes tussen die koolstofgedateerde manuscripten, bijvoorbeeld door te kijken naar het handschrift.
Vroegere datum
Het is een model waar Dhali en zijn collega’s bijna vier jaar aan hebben gewerkt. ‘We hebben in 2022 het artikel ingediend dat het model uitlegt, maar het is nog steeds in review omdat het zo groot en complex is’, zegt hij. ‘Er zijn veel vakgebieden betrokken bij het model. We deden chemische analyses voor de radiokoolstofdatering, er komen natuurkunde, archeologie, kunstmatige intelligentie, wiskunde en religie bij kijken.’
Het model geeft geen exacte datum, maar een tijdsperiode waarin de rollen gemaakt zouden kunnen zijn. ‘Maar het is beter dan de subjectieve blik van experts die proberen een rol te dateren’, aldus Dhali.
Bijna in alle gevallen bleek de radiokoolstofdatering op de rollen een eerdere datum aan te geven dan experts uit het veld hadden gedacht. ‘Experts relateren gebeurtenissen aan elkaar’, legt Dhali uit. ‘Dus als je aannam dat de ene gebeurtenis later plaatsvond, zou je alle andere gerelateerde gebeurtenissen ook later dateren.’
Het zou jaren duren als mensen al deze documenten zelf moesten lezen
Dhali kon zelfs een ander mysterie rond de Jesaja-rol oplossen met radiokoolstofdatering. ‘We hadden al aangetoond dat de rol twee verschillende handschriften had, maar sommige mensen stelden nog steeds dat het mogelijk één schrijver was die op twee verschillende momenten schreef, bijvoorbeeld met een vijftig jaar lange tussenpauze waarin hij gewond kon zijn geraakt, waardoor zijn handschrift veranderd kon zijn.’
Het klinkt misschien aannemelijk, maar Dhali’s dateringsmethode bewees het tegendeel. ‘Ons model zegt dat, hoewel de handschriften verschillend zijn, ze op hetzelfde moment geschreven zijn’, legt hij uit. ‘De stukken van de rol waren even oud.’
Doorzoekbare archieven
Voor een ander project werkt Dhali samen met de gemeente Groningen en diverse Nederlandse archieven om oude documenten doorzoekbaar te maken. ‘Ze hebben documenten uit de 18e of 19e eeuw die historisch interessant zijn, maar ze hebben geen labels die aangeven waar ze over gaan, zoals een bepaalde familie of regio. Het kunnen registers zijn, documenten van belastingautoriteiten uit die tijd of bijvoorbeeld boetes. Maar op dit moment kunnen we er niet veel mee doen’, legt Dhali uit.
Idealiter zouden deze documenten doorzoekbaar zijn met een AI-systeem. ‘Als mensen al deze documenten zouden moeten lezen, zelfs alleen al die van de gemeente, zou dat jaren duren’, zegt Dhali.
Maar het gebruik van AI hiervoor is op dit moment geen optie. Daarom hoopt Dhali er een burgerwetenschapsproject van te maken. Mensen kunnen zich volgend jaar bij het project aansluiten. ‘We zullen hen vragen om aan te geven welk deel van het document een datum bevat, welk deel de hoofdtekst en welk deel eventuele aantekeningen’, vertelt Dhali. ‘Dat zijn dingen die zelfs een kind gemakkelijk kan doen. Maar met AI wordt het een chaos.’
Dat betekent echter niet dat AI deze taken niet kan leren. ‘We zullen het systeem continu voeden met documenten die door burgers zijn gelabeld, in de hoop dat we het kunnen trainen.’
Dhali is optimistisch over de haalbaarheid hiervan. ‘Over het algemeen, als je minstens honderd documenten hebt die op deze manier zijn gelabeld, is dat een goed begin. Dan heb je al een vrij robuust systeem dat de verschillende labels kan herkennen.’ Vanaf dat punt kun je het blijven verbeteren. ‘Perfectie kent geen einde.’