2.3. Vstupní složka

Vstupní složka je hlavním datovým vstupem transformačního agenta. Do vstupní složky jsou nahrávány soubory tvořící pro jednotlivé typy jednotek publikace. Cesta k této složce je součástí konfigurace. Transformační agent v pravidelných intervalech monitoruje vstupní složku (adresář Input). V případě zjištění nového vstupu je tento zpracován. Úspěšně zpracovaný vstup je přesunut do složky data. Vstup, který se nepodaří zpracovat z libovolného důvodu je přesunut do složky error, případně zůstane přímo ve vstupní složce.

Interval provádění kontrol je možné určit v konfiguraci.

Všechny druhy vstupů mají shodnou základní strukturu. Odlišuje se formát vstupních souborů a jejich pojmenování.

Při zpracování vstupu je vytvářen protokol o průběhu zpracování a zapisován do souboru protokol.txt. Při startu transformačního agenta dojde ke kontrole existence podřízených složek. Pokud některé neexistují, tak jsou automaticky vytvořeny.

2.3.1. Direct

Přímý datový vstup ve formátu jádra (schéma http://www.aron.cz/apux/2020). Hlavní soubor datového vstupu Direct musí být pojmenován apux-<identifikátor>.xml. Případné přílohy jsou jsou uloženy v podsložce files, kde jednotlivý soubor je identifikován svým UUID.

Komponenta soubor načte.Provede ověření prvků popisu a ty, které odkazují na přístupový bod přidá mezi dostupné přístupové body. Pokud XML obsahuje odkazy na DAO, tak přidá tyto DAO do fronty ke zpracování. Následně je XML zařazeno do fronty k odeslání.

2.3.2. Institutions

Datový vstup obsahující data o institucích. Data se nahrávají pomocí XML, které může obsahovat informace o 1..n institucích. Soubor se musí jmenovat institutions-<identifikátor>.xml. Soubor je v nativním formátu Elza.

Při zpracování souboru jsou importovány informace o instituci uvedené v identifikátoru v názvu souboru.

2.3.3. Funds

Informace o archivních souborech. V jednotlivé datové podsložce musí být soubor fund-<identifikace>.xml. Soubor je v nativním formátu Elza.

2.3.4. Archdesc

Informace o jednotkách popisu. V jednotlivé datové podsložce musí být soubor archdesc-<identifikace>.xml. Soubor je ve formátu dle schématu Elza.