Kartotéky Augusta Sedláčka Vývoj digitálních technologií ke zpřístupnění kartoték badatelů
Olga Čiperová AiP BEROUN s.r.o.
Projekt DF 12 P010VV019
Historický ústav Akademie věd České republiky
digitalizace prosopografických kartoték z fondu Augusta Sedláčka
analýza a vývoj metodiky pro zpracovávání podobných souborů kartotéčních záznamů
projekt součástí programu NAKI (MK ČR)
2012-2015
August Sedláček narozen 28.8.1843 v Mladé Vožici zemřel 15.1.1926 v Písku
středoškolský profesor, archivář, historik historická topografie, kastelologie
Výběr z díla
Hrady, zámky a tvrze království Českého I–XV (1882–1927)
Místopisný slovník historický království Českého (1908)
Českomoravská heraldika I–II (1902–1925)
Dějiny královského krajského města Písku nad Otavou I–III (1911– 1913)
Snůška starých jmen, jak se nazývaly v Čechách řeky, potoky, hory a lesy (1920)
O starém rozdělení Čech na kraje (1921)
Paměti a doklady o staročeských mírách a váhách (1923)
Atlasy erbů a pečetí české a moravské středověké šlechty 1–5 (2001– 2003)
Rodopisná a místopisná kartotéka
Rodopisná a místopisná kartotéka dle poslední vůle uloženy v Historickém ústavu AV ČR
6 kartotéčních skříní 308 zásuvek cca 450 000 kartotéčních lístků genealogie, česká topografie, moravská topografie
Harmonogram projektu 7 etap kompletní digitalizace kartoték převod kartotéčních záznamů do strojově čitelné podoby digitální badatelské prostředí metodika zpracovávání podobných souborů
1. etapa vytvoření digitalizačního pracoviště analýza kartoték z obsahového a formálního hlediska příprava workflow digitalizace a převodu kartotéčních záznamů do strojově čitelné podoby (strukturování)
2.- 4. etapa 2. etapa digitalizace kartoték po zásuvkách (do konce roku 2013)
3. etapa podrobný rozbor údajů z kartotéčních lístků výběr software pro komplexní zpracování záznamů
4. etapa příprava metodiky pro převod informací z obrazových souborů do strojově čitelné podoby
Metodika převodu záznamů výběr formátu pro uložení záznamů podmínkou projektu – XML záznamy MARC XML
inspirace - MARC21 pro autoritní záznamy všechny druhy entit – osobní, rodinná, rodová jména – místní názvy – události (akce) vztahy mezi entitami – role – vazby
Metodika převodu záznamů nevýhody
prvotní entitou vznikající při převodu záznamu bude právě kartotéční záznam (jméno/místní název) využita národní pole pro zápis
nutno uvádět „míru nejistoty“
často není možné jednoznačně identifikovat a případně sloučit všechny nositele stejného jména i v případě, že časové údaje u nich uvedené by tomu mohly nasvědčovat
odlišný přístup u datací
pro budoucí časovou osu v badatelském prostředí
nelze použít pravidla zápisu dle Národních autorit ČR nutno identifikovat formální informace typu způsob natočení obrazu pokračující lístek aj.
Výběr software s ohledem na zvolený formát pro převod záznamů => Invenio volně dostupný systém pro tvorbu digitálních knihoven invenio-software.org
Evropská organizace pro jaderný výzkum (CERN) v ČR – repozitář šedé literatury (NUŠL – NTK)
5. etapa = provoz tým složený z odborníků - historiků
specifika převodu standardizace záhlaví – moderní česká podoba převod chronologických údajů do číselné podoby podchycení jazykových a chronologických variant identifikace chybných zápisů, zkratek aj. doplnění údajů z odborné literatury
optimalizace uživatelského rozhraní pro převod obrazových souborů do strukturované textové podoby zahájení testovacího provozu – prosinec 2012
6. – 7. etapa 6. etapa prezentace dílčích výsledků projektu především formou odborných článků
7. etapa publikování metodiky kniha o digitalizovaném fondu A. Sedláčka předání software pro převod záznamů badatelské prostředí
Badatelské prostředí
funkce shodná s papírovými kartotékami: vyhledávání podle záhlaví osobní jména místní názvy
fulltextové vyhledávání v celém obsahu kartotéčních záznamů vyhledávání v obsahu jednotlivých položek kartotéčních záznamů
datace osobní, rodinná, rodová jména mimo záhlaví místní názvy mimo záhlaví heraldické informace typy událostí role osob příbuzenské vztahy
Badatelské prostředí ontologická databáze na základě entit identifikovaných v jednotlivých záznamech a jejich vazeb na jiné entity ukázkově zpracované záznamy rodu Rožmberků
rozšíření možností pro badatele další typy dotazů
Národní autority České republiky jmenné, korporativní/akce, věcné (geografické)
spolupráce?
Děkujeme Vám za pozornost.
Olga Čiperová AiP Beroun s.r.o.
[email protected] www.aipberoun.cz
Eva Doležalová Historický ústav AV ČR
[email protected] www.hiu.cas.cz
Robert Šimůnek Historický ústav AV ČR
[email protected] www.hiu.cas.cz