7. Metodologia
Premessa
La filologia testuale è disciplina nativamente strutturata a grafo: lo stemma codicum, da Lachmann in poi, è un grafo orientato in cui i nodi sono i testimoni e gli archi rappresentano relazioni di filiazione. La modellazione qui adottata estende questo principio in tre direzioni — la tradizione (rapporti tra testimoni), l’apparato (varianti come entità prime) e la narrazione (entità ed eventi del racconto) — adottando un sistema di gestione dati multi-modello (ArangoDB) che permette di rappresentare contemporaneamente la struttura documentale di ciascuna entità e la rete di relazioni che le collega.
Tre principi orientano le scelte di modellazione che seguono.
Il primo è la separazione delle preoccupazioni: ogni tipo di entità ha la propria collezione, anche quando ciò comporta una certa frammentazione del modello. La leggibilità delle interrogazioni e la possibilità di evolvere lo schema per parti hanno priorità sulla compattezza.
Il secondo è la dichiarazione esplicita dei giudizi filologici: ogni lezione, ogni filiazione, ogni identificazione toponomastica reca un campo che ne qualifica la certezza o il tipo. Il valore della modellazione a grafo, in questo lavoro, sta proprio nel costringere a esplicitare ciò che la prosa filologica può lasciare implicito.
Il terzo è il disaccoppiamento tra laboratorio e pubblicazione: ArangoDB è ambiente di lavoro per l’analisi e la collazione; il sito digitale che presenta i risultati non interroga il database in tempo reale, ma riceve esportazioni statiche in formato JSON. Questa scelta architetturale ha conseguenze pratiche (semplicità, robustezza, indipendenza del prodotto pubblico dall’infrastruttura di ricerca) e metodologiche: la pubblicazione è un atto deliberato di chiusura, non un riflesso automatico di uno stato del database.
I tre livelli della modellazione
Livello stemmatico
Il primo livello rappresenta l’ipotesi sulla tradizione testuale. I testimoni latini, la traduzione italiana, l’archetipo perduto (Urtext) e gli antigrafi intermedi formano un grafo orientato in cui gli archi deriva_da qualificano il tipo di filiazione (copia diretta, traduzione, contaminazione, rielaborazione) e ne dichiarano il grado di confidenza. L’appartenenza alle tre famiglie individuate da Bondioni (Bondioni [Anno da verificare]) è rappresentata come arco verso un’entità famiglie_tradizione distinta.
Livello dell’apparato
Il secondo livello modella le varianti come entità prime, e non come semplici attributi dei testimoni che le attestano. La collezione lezioni raccoglie ciascuna variante significativa con la sua forma attestata, una forma normalizzata di riferimento, una tipologia e un giudizio critico. Ogni lezione è connessa al luogo testuale in cui si manifesta — un punto preciso del testo, identificato da una citazione canonica — e ai testimoni che la attestano. Le relazioni tra lezioni alternative (banalizzazione, correzione erudita, errore meccanico, innovazione) sono esplicite. Questa scelta — varianti come entità, non come campi — permette interrogazioni del tipo «quali testimoni attestano congiuntamente la lezione Urbanus e la lezione monaca (vs sacerdote)?», che sono il lavoro stemmatico vero, e che con un modello relazionale tradizionale sarebbero macchinose.
Livello narrativo
Il terzo livello modella il contenuto del racconto: i personaggi, i santi titolari, le località, le chiese, gli eventi narrativi e le relazioni tra di essi. Gli eventi sono trattati come entità prime e non come archi binari tra personaggi: scelta contro-intuitiva ma necessaria, perché un evento ha tipicamente più partecipanti con ruoli diversi (agente, paziente, testimone, committente) e ulteriori attributi (luogo, ordine narrativo, tipo) che un arco binario non saprebbe ospitare.
I tre livelli condividono la collezione testimoni come hub: ogni testimone è connesso ad altri testimoni (livello stemmatico), alle lezioni che attesta (livello apparato) e agli eventi che narra (livello narrativo). Questa intersezione abilita interrogazioni trasversali che attraversano i livelli — per esempio, correlare una variante toponomastica a un evento narrativo a una località geografica.
Decisioni di modellazione
Quattro nodi critici hanno richiesto scelte esplicite, qui motivate.
Ordine narrativo
Le tappe del racconto seguono una sequenza che può divergere tra testimoni: un testimone può collocare Cemmo prima di Berzo, un altro dopo. Si è scelto di rappresentare l’ordine come campo intero (ordine_narrativo) interno a ciascun evento, e di trattare le divergenze di sequenza come tipo di lezione (varianti di tipo ordine). La scelta evita di duplicare la logica di ordinamento per ciascun testimone e mantiene coerente il trattamento delle varianti.
Collettività dei sette vescovi
Il testo nomina i sette vescovi accompagnatori solo nella parte finale (Trepanus, Conradus cordiensis, Guilielmus portugaliensis, Antonius burdinensis, Arnoldus de Aristano, Raynerius de Pisis, e un sesto la cui sede non è leggibile), e in tutto il resto del racconto agiscono come gruppo indistinto. Si è scelto di modellarli come un’unica entità collettiva con i nomi individuali come campo interno, anziché come sette entità distinte. La scelta riflette la realtà testuale: nel racconto sono un coro liturgico, non sette personaggi. Una promozione futura a entità individuali resta possibile con migrazione minima.
Criterio di inclusione delle varianti
Si è adottato un criterio operativo che distingue le varianti significative da quelle puramente grafiche.
| Incluse | Escluse |
|---|---|
| Onomastica (es. Sandrum / Alessandro) | Varianti grafiche pure (h epentetica) |
| Toponomastica (es. Yesen / Esine) | Grafia y/i, u/v |
| Cronologia (es. 429 / 779) | Doppie e scempie |
| Lessico contenutistico (es. monacha / sacerdos) | Scioglimenti di abbreviazioni |
| Morfosintassi quando cambia il senso | Punteggiatura |
| Ordine narrativo | Maiuscole/minuscole |
| Presenza/assenza (tappe trentine) |
Il criterio è formale: se una variante può essere oggetto di un giudizio filologico (banalizzazione, lectio difficilior, errore), è inclusa; se è puro fenomeno paleografico-grafico, è esclusa.
Sistema di citazione
Per identificare i luoghi testuali in modo non ambiguo si è adottato uno schema di citazione canonica ispirato alle pratiche TEI:
{sigla_testimone}.{foglio}{r|v}.l{linea}[.t{token}]
Il riferimento può essere progressivamente raffinato dal foglio al token. Esempi sul testimone-base ASDBg 219: l’incipit del privilegio è ASDBg219.31r.l1; la tappa di Lovere ASDBg219.31r.l8; la datazione finale ASDBg219.31v.l24.
Il luogo testuale mantiene un identificatore semantico leggibile (tappa_lovere_castellano) per le interrogazioni, mentre la citazione canonica è un campo dell’entità. Citazioni parallele negli altri testimoni sono raccolte in una lista, e si aggiungono via via che la collazione procede.
Una mano locale: San Lorenzo di Berzo
Sotto il profilo strettamente testuale, la precisione con cui vengono descritti i passaggi di Carlo Magno nel cuore della Valcamonica suggerisce una conoscenza profonda del territorio, difficilmente attribuibile a un estensore esterno. L’autore dell’archetipo opera una sintesi tra la Chanson de geste e la realtà locale, piegando il mito alle esigenze di auto-legittimazione di una specifica area geografica.
Nel manoscritto ASDBg 219 la tappa di Berzo (Bercium) riceve un’attenzione sproporzionata rispetto alle altre località lombarde: Carlo Magno e il pontefice concedono alla chiesa di San Lorenzo ben 1500 anni di indulgenza più 80 anni per i peccati veniali, una delle cifre più alte dell’intero itinerario. Inoltre, mentre per altre chiese la concessione è generica, per Berzo il testo elenca minuziosamente le festività in cui godere del beneficio: le quattro feste della Vergine, San Lorenzo, la Dedicazione, Natale, Pasqua, Ascensione, Pentecoste, Ognissanti, le feste degli apostoli ed evangelisti e perfino ogni mercoledì.
Tali evidenze testuali permettono di presupporre in quest’area il vero motore della codificazione testuale: è qui che il “ciclo” sparso delle memorie caroline si trasformerebbe in “leggenda”, assumendo quella forma destinata a condizionare l’intera tradizione manoscritta e iconografica dei secoli successivi. La narrazione agisce come eziologia volta a giustificare diritti e autonomie territoriali, fornendo un’aura di sacralità imperiale a istituzioni già mature e garantendo loro un “monopolio della memoria” e delle indulgenze (Rizzi [Anno da verificare]).
Filologia come responsabilità
Come sottolinea Giunta commentando Varvaro (Giunta [Anno da verificare]), la filologia non si esaurisce nella ricostruzione materiale del testo ma si estende necessariamente alla ricostruzione del contesto umano e artistico in cui quelle opere sono state create, situandole storicamente e restituendole al loro ambiente originario. Studiare il manoscritto che tramanda la leggenda — descriverne la veste materiale, analizzarne la lingua, collocarlo nella sua tradizione — significa dunque non solo produrre conoscenza specialistica, ma anche gettare le fondamenta di una comunicazione culturale più onesta.
Le comunità alpine che custodiscono le chiese citate nella leggenda, che conservano negli archivi parrocchiali copie del testo, che ne hanno affrescato le imprese sulle pareti dei loro edifici sacri, sono al tempo stesso depositarie di una tradizione testuale e soggetti attivi della sua trasmissione. Lavorare su questi materiali non è atto neutro, ma si inserisce in una catena che ha radici nel Medioevo e ramificazioni nel presente — segnatamente nella nascita del Cammino di Carlo Magno come itinerario escursionistico, che ricalca la traiettoria narrativa della leggenda riportata in luce dalla ricerca filologica.
La filologia, intesa in questo senso più ampio, è anche uno strumento per capire come i testi costruiscono identità, come le leggende diventano patrimonio, come la cultura scritta del passato continua a parlare ai luoghi e alle persone che la abitano.
Limiti dichiarati
Il modello è dimensionato per il caso d’uso effettivo: con circa quindici-venti testimoni e qualche decina di varianti significative, il grafo risultante è di scala modesta e la scelta tecnologica (ArangoDB) è in senso stretto sovra-dimensionata. La giustificazione non sta nella scala ma nella disciplina di modellazione: dichiarare in modo esplicito ogni nodo e ogni arco costringe a esplicitare ipotesi che la prosa filologica può lasciare implicite, e produce un artefatto strutturato che alimenta direttamente la pubblicazione digitale.
Restano aperti, come prospettive di sviluppo:
- Estensione del corpus dei testimoni: la collazione sistematica dei sei testimoni minori non ancora codificati (Documento Belotti, Cala 1803, Sina, Ciccolini, Traduzione di Lovere, e i tre testimoni minori segnalati dagli studi) raffinerebbe lo stemma e il ranking di vicinanza.
- Promozione di entità collettive: il gruppo dei sette vescovi può essere promosso a entità individuali quando la storicità di ciascuno diventi oggetto di indagine.
- Raffinamento del sistema di citazione: per i testimoni diversi da ASDBg 219, le citazioni canoniche andranno aggiunte progressivamente in corrispondenza della loro collazione.
- Identificazione di toponimi residui: nel testo restano alcuni nomi di luogo non ancora identificati con sicurezza (San Pietro Zuchi, Braytinus, il porto di …Blaxie). Identificazioni future andranno integrate come aggiornamenti della collezione
localita.
Filiera tecnica
Per trasparenza, sintetizzo qui l’architettura tecnica dell’edizione digitale.
| Componente | Tecnologia |
|---|---|
| Database multi-modello | ArangoDB 3.11 (Docker) |
| Schema, popolamento, validazione | Python 3.9 + python-arango |
| Esportazione artefatti | script Python idempotente |
| Sito statico | Quarto 1.8.27 |
| Widget grafo | Cytoscape.js 3.28 |
| Widget mappa | Leaflet 1.9 |
| Bibliografia | BibTeX + CSL (Chicago author-date italiano) |
| Pubblicazione | sito statico HTML, hosting CyberPanel |
Il codice sorgente del progetto, gli script di bootstrap, popolamento, validazione ed export, lo schema concettuale e i file seed_data.json e _quarto.yml sono mantenuti nel repository dedicato. Tutti gli artefatti pubblicati (i quattro file JSON/GeoJSON che alimentano i widget) sono rigenerabili con un singolo comando a partire dallo stato corrente del database.