V letošním roce více než kdy jindy se ukázalo, jak užitečná je digitalizace v paměťových institucích, a že zcela reálně může nastat situace, kdy se badatel nedostane ani ke knihovním, ani k archivním zdrojům. Za dobu své existence se Digitální studovna Ministerstva obrany ČR díky svému jedinečnému obsahu zařadila k hojně vytěžovaným portálům, což období protiepidemických opatření ještě zvýraznilo. Začínající projekt EGO-DOK, jenž bychom rádi představili, má nemalé ambice: v prostředí Digitální studovny MO soustředit pod jedním společným vyhledáváním vedle tištěných publikací co nejvíce pramenů osobní povahy – primárně těch vztahujících se k první světové válce.
Žádný jiný konflikt v našich dějinách totiž po sobě nezanechal tak hojnou a pestrou písemnou stopu jako první světová válka. Osobní svědectví jejích účastníků a pozorovatelů, zaznamenaná do soukromých deníků, na stránkách memoárů, dopisů či na lístcích polní pošty, se dostala do hledáčku paměťových institucí už v průběhu války, především však v letech po jejím skončení.
S vědomím dokumentační hodnoty těchto písemností a se záměrem jejich budoucího badatelského využití proběhla v minulosti v českých zemích řada pokusů s cílem shromáždit a uchovat toto jedinečné dědictví pro příští generace. Nikdy se však tyto iniciativy nesetkaly s adekvátní masovou odezvou, natož aby se podařilo sběr těchto pramenů a péči o ně centralizovat v některém z archivů či muzeí s celostátní působností.
Po více než sto letech tak písemné památky osobní povahy z první světové války najdeme nejen roztroušené ve fondech a sbírkách mnoha státních i nestátních institucí napříč Českou republikou, ale často také v rodinách či u soukromých sběratelů. Jak podchytit co nejvíce těchto pramenů, jak je uchovat pro budoucnost a jak je co nejefektivněji zpřístupnit a využít pro historické bádání? To jsou výzvy, jež v příštích letech hodlá (na)plnit náš projekt EGO-DOK.
Vojenský historický ústav Praha v rámci tohoto projektu nabídne institucím i soukromým osobám bezplatné zpracování písemností v kvalitě splňující mezinárodní standardy na digitalizaci kulturního dědictví. Skenování zapůjčených předloh bude probíhat převážně na digitalizačním pracovišti VHÚ, ale ve výjimečných případech lze vyslat tým, který zajistí skenování na místě s využitím mobilního digitalizačního zařízení.
Fulltextové vyhledávání v rukopisech už není sci-fi
Výjimečnost dalšího zpracování získaných obrazových dat spočívá v nasazení unikátní technologie pro čtení rukopisů využívající umělou inteligenci a strojové učení. Díky zapojení naší instituce do projektu PERO OCR, vyvíjeného týmem Fakulty informačních technologií Vysokého učení technického a Moravské zemské knihovny, můžeme u textů psaných latinkou i kurentem pořídit přesný přepis, který následně umožní fulltextové vyhledávání včetně funkce zvýraznění vyhledaného výrazu v textu. Výsledný produkt digitalizace zveřejníme online na Digitální studovně MO ve sbírce EGO-DOK. Pro začátek na ukázku uvádíme odkaz na vzorově zpracovaný deník.
Postupně plánujeme rozšířit spektrum písemností i na další historická období a v další fázi projektu, po „naplnění“ sbírky větším počtem pramenů, předpokládáme zřízení samostatného online portálu pro pokročilé zpřístupnění a dodatečné podrobné zpracování zveřejněných digitálních dat. Speciální portál EGO-DOK by registrovaným uživatelům umožnil prostřednictvím online editoru označovat na vyobrazeních jednotlivých stran úseky textu a přidělovat jim časové, místní, jmenné i tematické atributy z dynamicky vytvářených indexů. Podle přidělených atributů by bylo možné dokumenty i jejich části v rozhraní portálu podrobně filtrovat. Badatel by tím získal unikátní nástroj pro snadné vyhledávání např.: podle data či konkrétní bojové události, podle vojenských útvarů, místopisných údajů, ale i podle témat z válečné každodennosti atd.
S institucí, či soukromou osobou, která se do projektu zapojí, VHÚ Praha sepíše nevýhradní licenční smlouvu, v níž vlastník uvede svůj souhlas se zveřejněním digitalizovaného dokumentu pro studijní a badatelské účely na Digitální studovně MO a na portálu EGO-DOK. Na oplátku získá nejen veškerá digitální data (TIF/JPG/PDF) a metadata (přepis textu – TXT) pro své vlastní využití, ale též garanci dlouhodobé archivace dat na úložištích VHÚ Praha, popř. MO ČR.
Dosud se do projektu EGO-DOK zapojil Vojenský ústřední archiv – Vojenský historický archiv Praha, jenž poskytne k digitalizaci a zveřejnění rozsáhlou Sbírku historických prací a vybrané části pozůstalostních fondů, a Československá obec legionářská, která touto formou hodlá prezentovat digitalizované písemnosti získané od veřejnosti během putování Legiovlaku. V současnosti dojednáváme konkrétní podobu vzájemné spolupráce s Historickým ústavem Akademie věd ČR, kde řeší projekt Databáze dějin všedního dne, v rámci něhož se podařilo nashromáždit nezanedbatelné množství egodokumentů militární povahy.
Věříme, že tato iniciativa zaujme nejen badatelskou obec, ale také osloví potenciální spolupracovníky z řad institucí i veřejnosti. O další novinky se podělíme na tomto webu. Případné zájemce o bližší informace či o zapojení do projektu si dovolíme odkázat na email: ego-dok@vhu.cz.
Tomáš Kykal a Marek Fišer