Onderzoekers die zich bezighouden met handgeschreven teksten, maken vaak transcripties van deze teksten. Het Europese READ project – programma Transkribus – is gericht op het trainen van het sneller herkennen van handschriften. In het kader van het trainen van de computers om een model te ontwikkelen om de Nederlandse taal sneller te herkennen zijn we op zoek naar foto’s van teksten (minimaal 300DPI) en de bijbehorende transcripties.
Wanneer u meer dan 500 pagina’s aan transcripties en foto’s heeft, kunnen deze direct via Transkribus gekoppeld worden (Text2Image). U kunt hier contact over opnemen met het Transkribus team in Innsbruck: email@transkribus.eu. U krijgt dan de gekoppelde bestanden (foto, met transcriptie erbij) via een account dat aan uw mailbox zit teruggestuurd. Indien u wel transcripties en foto’s heeft, maar de 500 pagina’s niet haalt – is het momenteel eveneens mogelijk om dit in te sturen naar Transkribus, maar hier is nog maar een beperkt budget voor beschikbaar (dus wees snel). Voor u is het voordeel dat u doorzoekbare PDF’s kunt downloaden vanuit het Transkribus-programma. De data staat standaard op privé, dus niemand anders kan bij uw transcripties en foto’s. Echter, wanneer u mee wilt werken aan het creëren van een Nederlands taalmodel, willen wij u vragen om contact op te nemen via TranskribusEMDutch@gmail.com en dan ontvangt u aanwijzingen hoe u uw data kunt delen. We begrijpen dat niet iedereen de mogelijkheid heeft om zijn/ haar onderzoekdata te delen vanwege privacy of copyright. Echter, op de achtergrond helpt u de computer trainen in het herkennen en we hopen dat het op korte termijn mogelijk wordt om aan te geven dat data wél gebruikt mogen worden voor het trainen van een overkoepelend model, maar niet door onderzoekers ingezien mogen worden.
Uiteraard kunt u ook transcripties in andere talen via Transkribus uploaden, vanaf 70 pagina’s is het al mogelijk om zelf een model te trainen of te delen met andere taalgroepen.
Eventuele vragen kunnen worden gesteld via TranskribusEMDutch@gmail.com
(Source: Rechtshistorische Courant)