dinsdag 24 juni 2014

Digital Humanities: van Bronkritiek naar Toolkritiek


De Hollandse politieke geschiedenis van de eerste helft van de zestiende eeuw is redelijk goed gedocumenteerd. Er was sprake van een drukke correspondentie tussen voornamelijk president van het Hof van Holland Gerrit van Assendelft en de landvoogdes en stadhouder in Brussel. Het is een van die toevalligheden van de geschiedenis dat juist omdat Den Haag redelijk ver verwijderd lag van Brussel en omdat stadhouder Anton van Lalaing daar ook nog eens vaak verbleef, er deze geschreven overblijfselen zijn. Deze rijke correspondentie plaatst de historicus, zoals de jongere versie van mijzelf tien jaar geleden, echter ook voor een probleem. Door alleen door de ogen van Van Assendelft naar de geschiedenis te kijken wordt het beeld ongewenst vertekend. Zijn correspondentie wordt mede bepaald door zijn visie op zijn vijanden, vrienden, verwanten en persoonlijke belangen. Verschillende meningen en visies zijn er weinig overgeleverd en wanneer die wel voorhanden zijn, bijvoorbeeld toen Van Assendelft werd beschuldigd van corruptie, ketterij en vriendjespolitiek, is het vaak moeilijk voor de historicus om af te wegen wie er nu 'gelijk' heeft. Iedere academische opleiding geschiedenis traint haar studenten dan ook, als het goed is, zo goed mogelijk in een gedegen bronkritiek. Daarnaast probeert een historicus zijn materiaal zo objectief mogelijk te lezen. Er zijn nog weinigen die durven te beweren dat ze een archiefstuk geheel onbevooroordeeld kunnen lezen. Iedereen wordt gevormd door zijn eigen tijd, plaats en omgeving of ontwikkelt sympathieën/antipathieën voor het onderzoeksobject.

Voor zover niets nieuws. Een goede historicus zal altijd zijn/haar bronnen kritisch bekijken en zich er van bewust zijn dat perspectieven, ook die van hem/haarzelf, veranderen. Wat minder voor de hand lijkt te liggen, en waar velen zich nog maar in beperkte mate van bewust zijn, is dat ook tools voor digitaal historisch onderzoek verre van objectief zijn. Net als de historicus verzamelt een tool data en komt op basis daarvan tot een synthese/antwoord/visualisatie.Tools zitten echter net als de historicus vol met 'aannames', die een belangrijke invloed kunnen hebben op de uitkomst van onderzoek.[1] Als een tool altijd kiest voor een bepaalde waarschijnlijkheid, bijvoorbeeld dat iedereen zonder een exact vermelde geboortedatum leefde voor de twintigste eeuw, dan kan dat een nuttige filter zijn voor de ene onderzoeksvraag, maar grote en ongewenste repercussies hebben voor een andere. Dit besef heeft de nodige consequenties: iedere tool die een historicus gebruikt zou moeten worden doorgelicht en bekritiseerd als een collega historicus, of zelfs als een (soms erg slordige) co-auteur of student-assistent. Het probleem daarbij is echter dat dat niet alleen betekent dat alle gemaakte keuzes bij het vervaardigen van een tool verantwoord moeten zijn, maar dat idealiter ook de complexe algoritmes die aan een tool ten grondslag liggen doorgrond moeten kunnen worden. Er zijn weinig historici die dat technische niveau, toch minstens dat van een bachelor computer science, in zijn mars heeft.

De vraag is nu wat er gedaan kan worden om dat gat tussen historicus en techniek te overbruggen. [2] Het meest simpele antwoord is natuurlijk dat de historicus ook computer scientist [3] moet worden (of andersom). Hoewel er hopelijk in de toekomst meer van dergelijke hybride figuren zullen komen dan nu, zullen er niet binnen afzienbare tijd honderden van rondlopen. Wellicht is het daarom zinvol om te denken aan de wijze woorden van een van mijn oude leermeesters: aan de VU: 'Een historicus moet een beunhaas zijn op alle gebieden.' Terwijl dat van oudsher gebieden zijn als rechten, oude talen, geografie, archiefwetenschap, kunstgeschiedenis, psychologie, codicologie en sociologie, zou daar simpelweg computer science bij moeten komen. Want om een andere oude leermeester aan te halen: 'Geschiedenis is alles.' In feite is enige kennis van computer science dan niet anders dan al die andere wetenschappen die nodig zijn om de beschikbare historische feiten (de data) te interpreteren.

De grote vraag is nu welke mate van beunhazigheid in de computer science nog acceptabel is om op verantwoorde wijze met digitale tools om te gaan. Aangezien digital humanities nog een gebied in opkomst is, is dit een vraag die nog vele antwoorden kent, zoals te merken is bij praktisch iedere discussie over digital humanities in het onderwijs. Geschiedenis als vak heeft altijd al, met het verschuiven van accenten, een opkomst en neergang gehad van kennis van (hulp)wetenschappen. De historicus van honderd jaar geleden zal immers ook niet hebben kunnen voorspellen dat statistiek nu een algemeen aanvaarde hulpwetenschap is en dat Latijn juist uit vele curricula geschrapt is. Wat in de huidige omstandigheden denk ik noodzakelijke en (voorlopig) voldoende voorwaarden zijn voor een verantwoorde omgang met digitale tools is dat de historicus 1) de beschikking heeft over een uitgebreide verantwoording van de gemaakte keuzes van de computer scientist; 2) Begrijpt hoe de computer scientist te werk gaat en waarom hij/zij bepaalde keuzes heeft moeten maken. Of met andere woorden: we moeten de taal van de computer scientist tot zekere hoogte passief beheersen. Dat is meteen ook de mate waarin veel historici andere (hulp)wetenschappen beheersen. Ik lees middelfrans, heb een basiskennis van het werk van socioloog Bourdieu en weet wat de rechtstermen betekenen in middeleeuwse vonnissen. Ik zou daarentegen nooit van mijn leven middelfrans (of zelfs maar fatsoenlijk modern Frans) kunnen spreken, heb geen enkele sociologische basis om het werk van Bourdieu te bekritiseren en heb geen flauw idee wanneer een middeleeuws vonnis niet in lijn is met de manier waarop in die tijd het canoniek Recht werd toegepast ... en ik kom er mee weg. 

Om te begrijpen hoe een tool werkt zou de historicus bijvoorbeeld niet in staat hoeven zijn om een tekst om te zetten naar linked data, maar wel moeten weten hoe dat proces ongeveer gaat en wat RDF triples zijn. Dit vergt een cultuuromslag, waarbij tools niet benaderd worden als gebruiksvoorwerpen (al zit dat in de naam), maar als de resultaten van een (hulp)wetenschap, die kritisch moeten worden benaderd voordat je ze gebruikt (op die manier zijn er ook voor- en tegenstanders van het toepassen van de ideeën van Bourdieu op historische processen). Vaak gaan historici nog enkel uit van de vraag hoe een tool hen kan helpen voor het beantwoorden van hun vragen, zoals onder meer bleek uit een workshop die ik organiseerde met mijn BiographyNet collega's. Naast veel enthousiaste reacties kregen wij, vermoedelijk terecht, te horen dat we ten onrechte de indruk hadden gewekt dat de deelnemers al resultaten zouden kunnen boeken met tools die we zouden aanreiken. Inderdaad was de workshop er vooral op gericht om de deelnemers inzicht te verschaffen in hoe computer scientists te werk gaan en vice versa. Dat op die manier een bijdrage werd geleverd aan de totstandkoming van de tool in ontwikkeling was duidelijk. Dat op die manier ook belangrijk inzicht werd verschaft in hoe zo'n tool werd gebouwd en dus ook kritisch benaderd kan worden was niet voor alle deelnemers even evident. Zonder die kennis kan er echter geen sprake zijn van een gedegen toolkritiek, die in de toekomst een steeds belangrijker rol zal gaan spelen naast de vertrouwde bronkritiek.
Er is in de nabije toekomst dus kortom nog veel bijscholing te verrichten, te beginnen met mijzelf.


[1]Het belangrijke artikel van B. Rieder, en T. Röhle gaat hier diep op in, in 'Digital methods: Five
challenges' .in: D. M. Berry ed., Understanding Digital Humanities (2012) 67–84.
[2] Zie  bijvoorbeeld ook het discussiedossier gecentreerd rond de stellingnames van UvA hoogleraar computationele en digitale geesteswetenschappen Rens Bod in BMGN 4 2014.
[3] Overal waar computer scientist staat kan ook computationeel linguïst staan