PAVES-e Per un’edizione-archivio digitale dell’opera di Pavese
PAVES-e mira a creare un’edizione-archivio open-access dell’opera pavesiana, che, nel rispetto dei principi FAIR (Findable, Accessible, Interoperable, Reusable), costruisca un’interfaccia innovativa e flessibile e che integri, attraverso una solida ontologia, le dimensioni lessicografiche, filologiche, critiche e didattiche.
PAVES-e riprende e implementa il modello di Digital Semantic Edition sul piano della metodologia, dei contenuti e della tecnologia. Le nuove modalità di organizzazione della conoscenza basate su modelli formali come le ontologie computazionali incorporate nella struttura gerarchica dei testi in XML-TEI insieme ai modelli di lemmatizzazione permettono un’analisi più approfondita dei testi, un’indagine più mirata dei loro contenuti e l’estrazione di nuova conoscenza.
In accordo al paradigma dei Linked Open Data, l’ambiente sarà interoperabile (sia tecnicamente che semanticamente) con altri repertori, dataset e risorse sul web (VIAF, Geonames, Treccani) e consentirà la memorizzazione, gestione, visualizzazione e interrogazione di dati e metadati eterogenei (archivistici, bibliografici, testuali, epistolari). Verrà, infatti, realizzato secondo gli standard del W3C e si allineerà alla più moderna visione di web semantico.
L’innovazione tecnologica riguarderà inoltre la connessione tra la lemmatizzazione e un grafo semantico multilingue che si caratterizza per essere un’ontologia lessicalizzata (BabelNet o altri). Si farà ricorso a tool basati su tecniche di Machine Learning per una classificazione supervisionata delle pubblicazioni prive di parole chiave.
Le risorse e gli strumenti sviluppati dall’unità informatica del CNR durante le varie fasi del progetto, realizzati per la lingua italiana letteraria, saranno resi disponibili in modalità open source su repository internazionali come CLARIN e/o GitHub e dotati di linee guida per l’utilizzo.