Per poter implementare un testo, è ovviamente necessario possederne una versione digitale. Su internet si trovano pubblicamente delle versioni html di Pioggia, ma in inglese. Sebbene potesse essere interessante lavorare sulla versione originale del testo, e personalmente non avrei avuto problemi linguistici, mi sembrava superfluo ai fini del lavoro che mi ero proposto per la tesi, ovvero mettere una accanto all’altra tre versioni della stessa storia che differiscono principalmente per il mezzo espressivo utilizzato, e riflettere sugli effetti intrinseci di questa differenza. Inoltre, trovare la versione in lingua originale della commedia sarebbe comunque stato quasi impossibile, così mi sarei trovato a mettere in parallelo un testo inglese con uno italiano: soluzione decisamente poco felice. Gli intertitoli del film mi sono stati disponibili solo in lingua inglese, ma non è stato un problema tradurli personalmente.
Così, sono partito dal libro Pioggia pubblicato dall’Adeplhi, già in mio possesso. Per poter avere una versione digitale del racconto ho dovuto scannerizzare personalmente le pagine ed elaborarle con un programma OCR, cioè un sistema per il riconoscimento ottico dei caratteri. Per questo passaggio ho usato Microsoft Office Document Scanning, presente nel pacchetto Microsoft Office.
Una volta scannerizzate le pagine è stato necessario ripulirle dagli errori di riconoscimento, piuttosto frequenti: una sorta di correzione di bozze, che si è prolungata per tutto il periodo di lavoro alla tesi. La maggior parte degli errori, infatti, non sono di immediata identificazione: ad esempio, un “1” (uno) al posto di una “l” (elle) è molto frequente, eppure l’occhio non vi fa sempre caso.
In modo analogo ho proceduto per la commedia: se possedevo già una mia copia di Pioggia di Maugham, però, recuperarne una della riduzione di Colton e Randolph si è rivelato particolarmente più impegnativo. L’unica copia trovata era presente alla Biblioteca Nazionale di Firenze, in un’edizione Garzanti del 1950. Il libro era consultabile ma non in prestito, così mi sono fatto produrre un cd con la fotocopia digitale delle pagine, in immagini formato .tif.
Sempre con Microsoft Office Document Scanning le ho quindi passate con il riconoscimento di testo, e ho effettuato la correzione di bozze.
Per il mercato dei dvd, il mondo è diviso in sei grandi zone: la 1 corrisponde all’America e al Giappone, mentre l’Europa e il Sudafrica sono nella 2. Ciascun dvd venduto in ogni zona è visualizzabile solo con i lettori corrispondenti; in questo modo, le case di distribuzione possono meglio controllare la vendita programmata prima in alcune zone del pianeta che in altre.
Spesso però alcuni dvd vengono prodotti solo per alcune zone e non per altre, dove non si prevede abbastanza mercato per giustificare una distribuzione. È il caso del film Sadie Thompson, il cui dvd è stato prodotto solo per la zona 1, e quindi a regola non visualizzabile con i lettori dvd comprati in Italia o in Europa.
Essendo però questa restrizione un semplice blocco software, è possibile con appositi programmi permettere ai propri lettori dvd di aggirarla e decodificare dvd di ciascuna regione. Così ho fatto io, in modo da poter vedere Sadie Thompson anche con un lettore dvd della zona 2.
A questo punto, con il programma di editor DVDx ho convertito il filmato del dvd in formato avi, e ho avuto una versione video editabile.
A questo punto, avevo la versione digitale e manipolabile di tutte e tre le opere.
Per la codifica è stata utilizzata la codifica TEI (Text Encoding Iniziative), uno standard internazionale nato per permettere alle biblioteche, ai musei, alle case editrici ed a tutti gli studiosi di rappresentare fedelmente qualsiasi testo in formato digitale. In questo modo qualsiasi testo, oltre a divenire portabile (una buona marcatura riesce a restituire completamente la forma del testo originale fin nei minimi dettagli), diventa facilmente archiviabile e gestibile per ricerche e interrogazioni con strumenti informatici di facile accesso.
Il Consorzio TEI è gestito da un Consorzio di Istituzioni Internazionali di ambito linguistico e letterario, ed emana delle direttive che garantiscono la validità scientifica delle codifica dei testi effettuate secondo lo standard. Come linguaggio di base si serve dell’XML
L’XML è un metalinguaggio di markup, ovvero un linguaggio marcatore che definisce un meccanismo sintattico che consente di estendere o controllare il significato di altri linguaggi marcatori. In altre parole è uno «standard di regole sintattiche per modellare la struttura di documenti e dati». Questo insieme di regole definisce le modalità secondo cui è possibile crearsi un proprio linguaggio di markup, cosa che lo rende perfettamente adatto alla codifica TEI.
Il passo successivo è stato quindi scegliere il software con il quale lavorare. Dopo varie prove, e consultazioni con chi aveva già affrontato un lavoro analogo, ho ritenuto che XML Copy Editor fosse lo strumento più adatto per la marcatura XML, per la sua completezza e versatilità.
Per evitare problemi di visualizzazione con i vari browser, per prima cosa ho sostituito ogni carattere speciale (virgolette a caporale, trattino lungo, ma anche le semplice vocali accentate o l’apostrofo) con le corrispondenti entità. Peraltro, questa è stata una delle fasi di realizzazione della tesina che ha richiesto più tempo.
Le entità sono codici numerici esadecimali che sostituiscono tali caratteri, ma che poi vengono correttamente visualizzati quando caricati da un browser.
La frase
«Cosa c’è, Alfred?», chiese Mrs Davidson.
diventa così
«Cosa c’è, Alfred?», chiese Mrs Davidson.
All’inizio non è semplice lavorare su testi similmente editati, ma con un po’ di pratica vi si acquista familiarità.
Dato che quando si marca un testo non si può mai sapere di quali tipi di ricerca sarà oggetto, la filosofia giusta da seguire è quella del “più è marcato, meglio è”.
Per prima cosa, però, ho individuato le scene da suddividere, in modo da mettere una accanto all’altra le differenti frazioni di ciascuna opera.
Con “scena” ho inteso un’unità narrativa minima omogenea. Ovviamente, la definizione è fortemente oggettiva e personalizzabile: in estremo si potrebbe anche arrivare a dire che ogni frase è un’unità narrativa minima; d’altronde, ogni frase narra qualcosa di differente da quella che la precede o la segue. Per la commedia, poi, queste unità narrative minime sono ancora più evidenti: sono le battute.
Aveva però poco senso effettuare un lavoro così dispendioso e frammentario, così ho preferito mantenere delle unità narrative più estese, e quindi più compatte. In tal modo, ho ottenuto il grande vantaggio di avere delle unità narrative comparabili e intercambiabili tra le tre versioni, per certi aspetti molto differenti tra loro.
Ad esempio, solo l’assenza nel racconto di un personaggio protagonista (O’Hara, il soldato che intreccia il la relazione amorosa con Sadie), rende automaticamente molto diverse le strutture delle tre opere.
Sono state così individuate quattro grandi macrosequenze, intitolate Sistemazione alla locanda, Gli scontri tra Sadie e Davidson, La redenzione e Epilogo. Solo restando così “distanti” dall’unità minima si poteva mantenere il parallelismo narrativo tra le tre opere: un’ulteriore suddivisione l’avrebbe automaticamente rotto.
Allo stesso tempo, però, era necessario scendere più nel dettaglio per poter mettere in evidenza i parallelismi intercorrenti tra solo due delle tre opere, molto più frequenti. In linea generale, ad esempio, la commedia e il film sono molto più simili tra loro di quanto lo siano ciascuno al racconto.
Così ho suddiviso ciascuna macrosequenza in più unità narrative. Esse, oltre ad essere ovviamente indipendenti dal punto di vista narrativo, sono indipendenti anche dalle scene presenti nelle altre due opere: mentre le macrosequenze sono quindi le stesse per tutte e tre le opere, le loro sottoposte non sono legate da questo vincolo.
La codifica TEI è molto flessibile ma al tempo stesso molto rigorosa. Come qualsiasi documento XML, anche quelli che seguono questa codifica devono attenersi ad una DTD, fornita in questo caso dal consorzio stesso.
La DTD TEI, prodotta nel 1989, è estremamente estesa e complessa, tanto che in seguito è stata rilasciata una versione semplificata e di più facile accesso, la TEI Lite, da me usata. La TEI Lite fornisce infatti gli strumenti per rappresentare le strutture editoriali più comuni (testi in prosa, in versi e drammatici) nonché una serie di fenomeni editoriali, linguistici e semantici a un modesto livello di complessità: per il lavoro da noi interessato, più che sufficiente (come vedremo, alcuni cambiamenti sono stati comunque necessari).
Tutti i testi conformi alla TEI contengono un’intestazione (codificata come elemento teiHeader) e la trascrizione del testo vero e proprio (marcata con l’elemento text ).
La teiHeader è analoga al frontespizio di un’opera tradizionale, ed è composta di quattro parti principali: fileDesc (l’unica obbligatoria), encodingDesc, profileDesc e revisionDesc.
Nella sezione di fileDesc ho così inserito il mio nome (in quanto autore della scheda), generalità dell’opera e dell’edizione a cui ho attinto, secondo quanto segue:
<fileDesc>
<titleStmt>
<title>scheda annotata del racconto "Pioggia"</title>
<author>Andrea Franchi</author>
<respStmt>
<resp>Codifica a cura di Andrea Franchi</resp>
</respStmt>
</titleStmt>
<publicationStmt>
<publisher>Andrea Franchi</publisher>
<availability>
<p>Questo testo è liberamente accessibile per motivi personali o di studio. Ogni uso commerciale è vietato.</p>
</availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title>Pioggia</title>
<author>William Somerseth Maugham</author>
<editor>Adelphi, Piccola Biblioteca</editor>
<date>Aprile 2003</date>
</bibl>
</sourceDesc>
</fileDesc>
Come si noterà, ho ritenuto necessario anche un breve disclaimer per evidenziare che, sebbene in questa tesi siano stati usati materiali protetti da copyright, è stato fatto esclusivamente a scopo di studio.
Oltre al fileDesc, ho scelto di definire nel profileDesc la lingua come riferimento alla precedente riflessione sulla traduzione:
<profileDesc>
<langUsage>
<language id="ita">Italiano</language>
</langUsage>
</profileDesc>
L’aspetto finale dell’header è dunque questo:
<teiHeader>
<fileDesc>
<titleStmt>
<title>scheda annotata del racconto "Pioggia"</title>
<author>Andrea Franchi</author>
<respStmt>
<resp>Codifica a cura di Andrea Franchi</resp>
</respStmt>
</titleStmt>
<publicationStmt>
<publisher>Andrea Franchi</publisher>
<availability>
<p>Questo testo è liberamente accessibile per motivi personali o di studio. Ogni uso commerciale è vietato.</p>
</availability>
</publicationStmt>
<sourceDesc>
<bibl>
<title>Pioggia</title>
<author>William Somerseth Maugham</author>
<editor>Adelphi, Piccola Biblioteca</editor>
<date>Aprile 2003</date>
</bibl>
</sourceDesc>
</fileDesc>
<profileDesc>
<langUsage>
<language id="ita">Italiano</language>
</langUsage>
</profileDesc>
</teiHeader>
Nel caso del racconto, il text coincide con il body, il testo vero e proprio; nella commedia invece prima dell’elemento body ho inserito l’elemento front, che ha la stessa funzione di un frontespizio in un opera tradizionale.
Nel front quindi ci sono l’elenco dei personaggi (castList) e le indicazioni su dove e quando si svolge l’opera:
<front>
<castList>
<castItem><role>Sadie Thompson</role></castItem>
<castItem><role>Reverendo Alfred Davidson</role></castItem>
<castItem><role>Signora Davidson</role><roleDesc>, sua moglie</roleDesc></castItem>
<castItem><role>Dottore Mac Phail</role></castItem>
<castItem><role>Signora Mac Phail</role><roleDesc>, sua moglie</roleDesc></castItem>
<castItem><role>Joe Horn</role><roleDesc>, mercante di Pago-Pago</roleDesc></castItem>
<castItem><role>O’Hara</role><roleDesc>, sottufficiale di Marina</roleDesc></castItem>
<castItem><role>Hogeson</role><roleDesc>, marinaio della Flotta americana</roleDesc></castItem>
<castItem><role>Griggs</role><roleDesc>, marinaio della Flotta americana</roleDesc></castItem>
<castItem><role>Bates</role><roleDesc>, quartiermastro del bastimento ’La Speranza’</roleDesc></castItem>
<roleDesc>indigeni</roleDesc>
</castList>
<set>
<p>N.B. Il terzo atto è in due quadri.</p>
<p>Epoca presente. L’azione si svolge nell’isola di Tutuila nel Sud-Pacifico, durante la stagione delle piogge.</p>
</set>
</front>
Dopodiché, ho seguito il precedente schema delle sequenze suddividendo il testo (body) in vari div annidati: le quattro macrosequenze sono così altrettanti div che contengono le unità narrative minori.
Ad ognuna, in forma di commento, ho dato un titolo. Ovviamente questa indicazione è esterna alla codifica TEI e serve solo a chi scorre il documento per avere più chiaro il contenuto di ogni div, ma sarebbe potuta anche essere stata messa all’interno dell’annotazione. Io ho preferito concentrarmi sull’assegnare ad ogni div un identificatore univoco (id) con un numero ordinale, in modo da gestire meglio la cosa al momento della pubblicazione su html.
<div id="scena1"><!--a bordo della "Speranza" e sbarco-->
Non ho potuto suddividere le sequenze in base ai p, i paragrafi, ma creare degli appositi div perché ovviamente una sequenza può contenere più paragrafi (e ridurre ogni sequenza ad un paragrafo unico avrebbe significato eliminare gli a capo, che non sono solo convenzione tipografiche, ma fanno parte degli strumenti espressivi dell’autore).
Inoltre, all’inizio del testo può presentare un head, una sorta di “front locale” che dà indicazioni su di una sezione narrativa minore (un atto, ad esempio).
<head>
<stage class="testo2">
ATTO PRIMO
</stage>
<stage class="testo2">
<p>L’abitazione di Horn, adibita ad albergo e negozio, è una costruzione di legno a due piani, con una larga veranda esterna coperta da un tetto di lamiera ondulata. È costruita sopra una collinetta, a breve distanza dalla banchina di approdo dei piroscafi.
La camera nella quale si svolge l’azione è arredata con mobili di vimini e fra essi si nota una grande poltrona sgangherata nella quale Horn abitualmente si sdraia. In fondo, accostato al muro, un divano rosso di fustagno. Vicino ad esso un tavolino con sopra un servizio da bibite. Nel centro della scena una tavola con attorno sei seggiole di ferro, verniciate in verde.
La tappezzeria delle pareti è in molti punti strappata, e in altri coperta da ampie macchie di umidità. Dal centro del soffitto scolorato scende una vecchia lanterna marinara.
In fondo, una scala barcollante conduce al secondo piano.
A sinistra, una porta coperta da una tenda logora conduce nella camera di Sadie Thompson.
La parete di destra è per intero occupata da un‘ampia veranda attraverso la quale spazia un largo panorama di cielo, mare, spiaggia e montagne lontane.
All’alzarsi del sipario la stanza è inondata di sole. Giunge da lontano il canto delle maestranze indigene che lavorano al porto.
La scena rimane vuota per qualche momento, poi dal negozio entra Amina che va a sedersi nella grande poltrona. È una donna di circa 35 anni ed ha sul volto le tracce di una bellezza ormai sfiorita. Il suo corpo pingue rivela la vita sedentaria e malsana dei paesi tropicali. Indossa una lunga vestaglia gialla cosparsa di macchie.
Subito dopo entrano dalla veranda Griggs e Hogeson. Griggs e un giovane marinaio pieno di vita di circa 20 anni; Hogeson è un po’ più anziano, lento nelle parole e nei gesti.</p>
</stage>
</head>
La suddivisione in scene, però, non era ancora necessaria per marcare il testo teatrale. Se infatti il racconto è suddiviso nei vari paragrafi (p), la commedia è una serie continua di battute, ognuna avente l’indicazione del personaggio che parla o agisce e il testo pronunciato o l’azione effettuata.
Così, ogni battuta è stata racchiusa dal tag sp, sia che contenga una battuta vera e propria (un personaggio dice qualcosa) sia un’azione o un’indicazione scenica: in questo caso, siamo all’unità narrativa minima di prima.
Ogni parlante è indicato dal tag speaker, mentre quanto detto è un semplice p. Tutto ciò che corrisponde ad un’indicazione scenica (descrizione di un oggetto, di un movimento, entrata o uscita di un personaggio) è invece racchiuso dal tag stage.
Una battuta può quindi essere
<sp>
<speaker>Amina:</speaker>
<p class="testo2">Io non avere sigarette.</p>
</sp>
oppure
<sp>
<speaker>Dottore:</speaker>
<stage>(alla signora Davidson)</stage>
<p>Come va il mal di testa? Meglio?</p>
</sp>
ma anche
<sp>
<stage>(Davidson rimane come ipnotizzato. Sembra dominarsi per un momento poi si avvia verso la porta di Sadie. Ivi giunto si ferma. Ha la testa china sul petto e le mani contratte. È palese la terribile lotta fra l’uomo di Dio e la creatura umana. Poi alza la testa, allarga le spalle e lentamente afferra la maniglia della porta. Apre, entra e chiude la porta. La pioggia, ora, è quasi una bufera. Si sente in lontananza il sinistro suono dei tamburi)</stage>
</sp>
Per prima cosa, con un programma di editing video ho dovuto suddividere l’unico lungo file avi in tante scene autonome.
Il programma usato è stato Ulead VideoStudio 9.0, un programma completo ma veloce, e quindi adatto per questo tipo di lavori. Prima avevo provato ad usare Windows Movie Maker, presente in Windows XP, ma non solo si è dimostrato particolarmente contorto, ma si bloccava in continuazione.
Innanzitutto ho eliminato l’audio: il film in questione è del 1928, quindi muto, e la banda sonora presente nel filmato è stata aggiunta dall’editore del dvd. Essendo quindi del tutto estrinseca all’opera, ho ritenuto doveroso rimuoverla, tanto più che la comprensione del film non ne risulta affatto compromessa.
Ho così suddiviso il filmato in diciannove scene distinte (titoli di testa compresi), basandomi più sull’unità narrativa che spazio-temporale o meramente tecnica. Secondo quest’ultima, infatti, avrei dovuto fare tante sequenze quante sono le inquadrature del film, cosa che si sarebbe rilevata analogamente superflua alla suddivisione del racconto in frasi.
Ho cercato comunque di appoggiarmi il più possibile ai tagli del montaggio, ma in almeno un punto è stato necessario tagliare la scena “in corso”: al termine della scena 12 c’è un espressivo piano americano di Gloria Swanson, l’attrice che interpreta Sadie, che con la sola mimica facciale e corporea (quindi senza l’ausilio di intertitoli) passa dallo sconforto al furore. Questo cambiamento sfumato chiude l’unità semantica della delusione per il fallimento del dottor Macphail e apre una delle scene madri del film, dove Sadie maledice il reverendo Davidson. Considerare le due scene facente parti di una sola unità narrativa era impensabile, anche se non c’era nessun taglio netto a dividerle, così ho operato un taglio indipendente dal montaggio.
Le scene sono state successivamente convertite in formato .flv con Total Video Converter, in vista del caricamento sulle pagine .php.
Gli unici elementi testuali di un film muto sono, ovviamente, gli intertitoli.
Di ognuno di essi ho catturato una still con CyberLink PowerDVD, creando un’immagine .bitmap. Le ho quindi ricopiate e tradotte in un file .xml strutturato in tutto e per tutto come un’opera teatrale (vedi sopra). Ogni intertitolo era una battuta, con il suo speaker (che può anche essere il narratore) e il suo testo.
Ho avuto un momento di perplessità al momento di riempire la voce author della sourceDesc: l’autore di un film è il regista, secondo la scuola francese di Truffaut? Avrei dovuto allora scrivere Raul Walsh. Nel mio caso, però, essendo la mia una scheda annotata esclusivamente degli intertitoli, ho pensato di mettere il nome del titolista, C. Gardner Sullivan.
Come già indicato, la DTD seguita è stata la TEI Lite. Esistono però delle estensioni, sempre prodotte dal Consorzio TEI, per determinati tipi di testo.
Era mia intenzione infatti adottare un’apposita DTD per la commedia, che è un testo teatrale, chiamata DTD teiDrama.
Non sono riuscito però a far concordare i due codici, sebbene abbiano la stessa origine, così ho pensato di implementare la DTD Lite seguendo i manuali ufficiali TEI.
D’altronde, l’obiettivo del mio lavoro non è certo quello di ottenere un testo forzatamente “esportabile” in un ambito accademico o scientifico, e quindi forzatamente attenuto al modello DTD ufficiale, ma avere dei testi marcati secondo un criterio utile. Non va dimenticato inoltre che le aggiunte si sono attenute rigorosamente a quanto esposto sul sito ufficiale TEI, quindi non è stato violato nessun criterio interno a questo sistema di codifica.
Le modifiche sono state (in grassetto corsivo):
· L’elemento front e relativi figli
<!ELEMENT front
(((divGen | titlePage | anchor | gap | figure | index | interp
| interpGrp | lb | milestone | pb)*, (((argument | byline
| docAuthor | docDate | docEdition | docImprint | docTitle
| epigraph | head | titlePart), (argument | byline | docAuthor
| docDate | docEdition | docImprint | docTitle | epigraph
| head | titlePart | titlePage | anchor | gap | figure |
index | interp | interpGrp | lb | milestone | pb)*) | (div,
(div | divGen | titlePage | anchor | gap | figure | index
| interp | interpGrp | lb | milestone | pb)*) | (div1, (div1
| divGen | titlePage | anchor | gap | figure | index | interp
| interpGrp | lb | milestone | pb)*))?) | (castList, set)) >
<!ATTLIST front
corresp IDREFS #IMPLIED
next IDREF #IMPLIED
prev IDREF #IMPLIED
ana IDREFS #IMPLIED
id ID #IMPLIED
n CDATA #IMPLIED
lang IDREF #IMPLIED
rend CDATA #IMPLIED
decls IDREFS #IMPLIED
TEIform CDATA "front" >
<!ELEMENT castList (castItem*, roleDesc*)>
<!ELEMENT castItem (role, roleDesc?)>
<!ELEMENT role (#PCDATA)>
<!ELEMENT roleDesc (#PCDATA)>
<!ELEMENT set (p+)>
Sebbene sul sito TEI fosse accuratamente spiegata la funzione di front per le opere teatrali, non c’era riscontro di tali elementi nella TEI Lite, né nella DTD teiDrama. Ho così aggiunto gli elementi castList e set. A sua volta, castList può essere formato da zero o più elementi castItem e zero o più elementi roleDesc.
· L’aggiunta dell’attributo class - A questo punto, “rotta l’ortodossia” di una DTD intatta, ho aggiunto l’attributo class ai seguenti tre elementi, per poter meglio gestire in seguito il .css:
stage
class CDATA #IMPLIED
speaker
class CDATA #IMPLIED
p
class CDATA #IMPLIED
D’altronde, tutti e tre già presentavano l’attributo id, ma quello da solo avrebbe reso tremendamente complicate le definizioni nel foglio di stile.
È stato subito evidente che il supporto più adatto e immediato su cui mostrare il racconto, la commedia e il film accostati è il sito html.
Cercare di trovare la struttura più funzionale per il sito non è stato semplice. All’inizio avevo pensato di accostare anche visivamente le diverse versioni, ma si è rivelato subito estremamente complicato.
Se non altro, perché le versioni sono ben tre: oltre alla difficoltà tecnica, infatti, mettere nello stesso schermo due colonne di testo ed un riquadro con del video avrebbe creato solo confusione nell’utente, che avrebbe poi dovuto avanzare indipendentemente in ognuno dei tre settori. Il risultato sarebbe stato un bombardamento di materiale all’apparenza poco strutturato: sebbene infatti la presentazione simultanea rappresenti un’interessante forma dei nuovi media, spesso la chiarezza ne sopperisce.
Così ho pensato ad una soluzione più ordinata, e che sfruttasse meglio la grande potenzialità del web: il link. Ogni sequenza ha così la sua pagina .html, e da ogni pagina si possono raggiungere le sue corrispondenti nelle altre opere o le altre sequenze nella stessa.
Per fare un esempio: mi trovo alla sequenza 10 del racconto, Sadie fa intercedere invano il Dottore. Da lì, tramite la lista delle sequenze ad inizio pagina, posso andare a ciascun capitolo del racconto. Posso anche, però, saltare direttamente alla sequenza 13 della commedia o alla sequenza 11 del film; sebbene infatti i numeri non corrispondano, tutte queste sequenze illustrano la stessa scena ed hanno quindi lo stesso titolo.
Caricare i testi sulla pagina .html non si è rivelato un passaggio facile.
Ho scartato subito l’idea di inserire il testo di ciascuna sequenza nel codice .html: sebbene infatti sarebbe stato il procedimento più semplice, e a prima vista anche di più facile gestione.
Ignorare il file .xml, però, non avrebbe avuto senso. Come vedremo più avanti, infatti, la grandezza di un file annotato in .xml è la straordinaria flessibilità e la capacità di eseguire interrogazioni. Con un testo statico, come sarebbe possibile? Inoltre, sebbene non vengano visualizzate nel browser, le annotazioni devono rimanere presenti nel codice della pagina, visualizzabile con “visualizza – sorgente pagina”. L’utente, così, può esplorare il testo e le sue annotazioni anche non possedendo direttamente il file .xml.
Per questo motivo era importante trovare un codice php che mantenesse i tag nel testo caricato.
Dopo tante ricerche, all’inizio infatti avevo pensato a
<?php
$xmlFile = file_get_contents(‘racconto.xml',1);
$xmlData = new SimpleXMLElement($xmlFile);
$risultato = $xmlData->xpath('//div[@id="scena1"]');
echo $risultato[0];
?>
ma questo codice ha una grande mancanza: accetta solo elementi p senza altri tag dentro. Vale a dire, ogni scena doveva essere un unico monolitico paragrafo dall’inizio alla fine, e questo come abbiamo visto prima non è accettabile.
Ma non solo: questo codice avrebbe ignorato il contenuto di tag figli di div, semplicemente non visualizzandoli sullo schermo. Così, essendo ciascun div composto da tanti p, lo schermo sarebbe rimasto vuoto.
Allora sono passato a quest’altro codice php, utilizzando la funzione asXML(), che restituisce un documento xml al completo:
<?php
$xmlFile = file_get_contents('racconto.xml',1);
$xmlData = new SimpleXMLElement($xmlFile);
$risultato = $xmlData->xpath('//div[@id="scena1"]');
echo $risultato[0]->asXml();
?>
In questo modo il codice viene mantenuto e i tag interni non vengono ignorati.
A questo punto, non è rimasto che sistemare i link interni al sito, creare un foglio di stile .css e, con Photoshop, realizzare gli elementi decorativi.