5

Come accennato, il corpus parallelo allineato dei romanzi di Rushdie e delle rispettive traduzioni italiane non è stato realizzato a partire dalle versioni elettroniche in formato TEI Lite. Questo perché, nonostante tale operazione possa essere desiderabile, non erano a disposizione le risorse necessarie per metterla in pratica e non è stato comunque considerato indispensabile all'economia generale del progetto. L'allineamento del corpus, cioè la creazione di un corpus bilingue contenente "unità traduttive" in cui si alternano un segmento del testo originale (generalmente identificabile con una frase) e la corrispondente traduzione è stato effettuato tramite il programma dedicato Trados WinAlign, disponibile nel normale circuito commerciale.

La scelta di utilizzare questo prodotto è conseguente a due tipi di considerazioni: in primo luogo il programma permette di creare sia una "memoria traduttiva" da utilizzarsi in seguito all'interno della "translator's workbench" commercializzata dalla stessa ditta, sia dei testi bilingui da utilizzare come corpus parallelo all'interno del programma Wordsmith Tools. In secondo luogo la scelta di Trados WinAlign è derivata da una valutazione comparativa di alcuni dei programmi reperibili allo scopo di allineare il corpus parallelo. In particolare, oltre a Trados WinAlign sono stati esaminati i sistemi di allineamento forniti con Lingua Multiconcord (Woolls 1997) e Wordsmith Tools (Scott 1996) programmi che esemplificano due diversi approcci all'analisi delle concordanze multilingui. Il primo è stato pensato primariamente come strumento per la didattica delle lingue in generale e dell'inglese in particolare piuttosto che per la ricerca o la didattica della traduzione (Johns 1996). La sua principale caratteristica, in quanto a modalità di interrogazione dei testi, è quella di operare con coppie di file monolingui, che vengono allineati "on the fly".[1] L'utente immette la parola (o le parole) da ricercare e il software ritrova le sue istanze nel testo nella lingua A e tutti i segmenti (le frasi o i paragrafi) di testo che contengono la traduzione di quella parola (di quelle parole) nel testo nella lingua B, visualizzando le coppie di segmenti fianco a fianco sullo schermo. Per ottenere questo risultato è però necessario preparare i file monolingui, inserendo codifiche di tipo SGML nel testo per distinguere paragrafi e frasi. Quest'operazione viene svolta automaticamente da un programma accessorio fornito con LINGUA Multiconcord (MinMark). Perché l'algoritmo di allineamento abbia possibilità di successo è però necessario assicurarsi che le coppie di testi da allineare nelle diverse lingue abbiano lo stesso numero di paragrafi. Quest'operazione di pre-allineamento deve essere svolta manualmente, inserendo se necessario dei codici di paragrafo e/o frasi vuote in corrispondenza di materiale testuale in una lingua che non abbia un corrispettivo nella o nelle altre. Il pre-allineamento avviene tramite un qualsiasi programma di videoscrittura, e alcune prove hanno dimostrato che richiede tempi di lavorazione superiori a quelli necessari per effettuare l'allineamento con Trados WinAlign. La visualizzazione delle concordanze è buona in LINGUA Multiconcord, presentando i segmenti nelle due lingue fianco a fianco; in questo è simile alla funzione di concordanza di una memoria traduttiva anche se con la possibilità di visualizzare al massimo due o tre frasi. La preparazione del corpus è comunque laboriosa e produttiva solo se rapportata al numero delle lingue presenti, e il programma non prevede la possibilità di elaborazioni statistiche.[2]

Diverso è l'approccio alle concordanze bilingui in Wordsmith Tools che, come si è detto, opera con testi bilingui. Allo scopo di creare tali testi bilingui, Wordsmith Tools contiene il programma accessorio Text Viewer and Aligner, che permette di unificare il contenuto di due files in uno unico: il testo nella lingua d'origine e la sua traduzione nell'altra lingua vengono "fusi" in un unico file di testo in cui frasi in una lingua si alternano alle frasi corrispondenti nell'altra. L'unità testuale presa in considerazione è la "frase" come delimitata dai segni di punteggiatura, con i conseguenti problemi tecnici e teorici accennati in precedenza. L'allineamento avviene automaticamente ma necessita di un intervento manuale estremamente consistente. Il programma si limita infatti ad alternare una frase da un file con una frase dall'altro, andando ben presto "fuori sincrono" e costringendo allo spostamento manuale dei diversi segmenti. Se è vero infatti che una traduzione è spesso più lunga (come numero di parole, frasi, ecc.) dell'originale, come è il caso delle traduzioni dei romanzi di Rushdie, questo significa che su un testo di mille frasi ce ne potranno essere mille e cento nella traduzione, il che significa spostare progressivamente e manualmente gran parte del testo da allineare. L'utilità di questo programma accessorio si potrà forse misurare meglio su testi brevi o con una forte dose di "allineabilità" iniziale (testi cioè fortemente stardardizzati nelle due lingue), ma risulta poco accettabile per testi di natura letteraria.

L'allineamento è stato portato a termine con il programma Trados WinAlign, a partire da coppie di file contenenti originali e traduzioni (le versioni elettroniche dei romanzi sono state preventivamente segmentate in file di dimensioni minori corrispondenti ai capitoli dei libri per facilitare l'allineamento) e produce un primo tentativo di allineamento basandosi su un algoritmo, simile a quello utilizzato da LINGUA Multiconcordancer in fase di visualizzazione, che in base ad un calcolo statistico cerca di determinare la corrispondenza tra quantità di segmenti (frasi) nelle due lingue. Per correggere eventuali errori di allineamento è possibile revisionare manualmente l'output, intervenendo sullo schermo che presenta i segmenti (le frasi) di originale e traduzione fianco a fianco, uniti da un tratto che evidenzia la connessione tra di esse (1: 1, 1: 2, 2: 1). Con il mouse è possibile attivare e disattivare i collegamenti. Una lettura cursorea permette di individuare progressivamente i punti di sfasamento, e di intervenire modificando i collegamenti ipotizzati dal sistema automatico. È inoltre possibile intervenire modificando il testo, per spezzare ad esempio una frase "intrappolata" in un rapporto di 2: 2 o correggere errori immessi nella fase di acquisizione del testo. Infine il processo di allineamento automatico può essere ripetuto durante la revisione. Se, ad esempio, dopo il primo tentativo di allineamento rimangono molte unità traduttive nel testo B in finale di testo senza un corrispettivo nel testo A (situazione verificatasi frequentemente durante l'allineamento dei diversi capitoli di Midnight's Children e I figli della mezzanotte), è possibile "ancorare" le ultime frasi nei due testi e ripetere l'allineamento automatico, per poi intervenire manualmente, in un processo ciclico di approssimazione. Una volta terminato il controllo dell'allineamento il risultato viene esportato come testo ASCII per essere elaborato con le applicazioni successive. È possibile scegliere tra due diversi formati di esportazione: un formato "tabella" , cioè alternando unità traduttive nelle due lingue in ordine progressivo (formato utilizzato da Worsmith Tools) o come testo contenente codici RTF, formattato secondo criteri ottimali per la creazione di una memoria traduttiva da utilizzare con Trados Translator's Workbench.

Si sono ottenuti infine due prodotti distinti: il corpus parallelo allineato, formato da sei file (cinque romanzi e un racconto) bilingui in formato solo testo con unità traduttive alternate, destinato ad essere investigato tramite il programma di concordanze di Wordsmith Tools, e la memoria traduttiva "Rushdies.twm"[3] creata importando il file di testo prodotto da Trados WinAlign all'interno di Trados Translator's Workbench. Durante l’importazione del corpus, a partire da un file in formato solo testo e con codifiche RTF prodotto dal programma WinAlign, la Workbench produce un database, costituito da un file principale contenente i dati testuali e quattro files di indice. Dato che non è possibile operare con più di una memoria traduttiva, l’intero CPR è stato trasformato in un’unica memoria. Mentre l’allineamento è avvenuto per i singoli capitoli di ciascuna coppia di romanzi, ciascuna coppia di romanzi allineata è stata inizialmente salvata come file di testo per l’importazione nella memoria. I sei file ottenuti sono stati successivamente concatenati in un solo file, utilizzato come file di testo sorgente per la creazione della memoria.[4]

La creazione della memoria traduttiva del "progetto Rushdie" ha richiesto alcune ore di elaborazione automatica da parte della stazione di lavoro, producendo infine un database indicizzato che consente un'interrogazione estremamente rapida delle concordanze bilingui.

Nel complesso il tempo impiegato per l'allineamento, compresa l'ulteriore ripulitura dei file TEI sorgente è stato di circa 70 ore. La tabella che segue riassume i tempi di lavorazione delle diverse fasi di elaborazione dei testi elettronici che compongono il CPR, allo scopo di fornire un'indicazione delle risorse da preventivare in progetti con caratteristiche simili.

Tempi complessivi di elaborazione dei testi elettronici

Acquisizione	90 ore
Ripulitura	110 ore
Codifica	30 ore
Allineamento	70 ore
Totale	300 ore

La procedura di allineamento del corpus parallelo ha consentito di mettere a fuoco aspetti legati sia all'analisi delle corrispondenze tra "matrici testuali" (ovvero delle "unità traduttive") sia alle rispettive caratteristiche stilistiche di originali e traduzione. Ad esempio, l'allineamento di Midnight's Children è stato molto più laborioso di quello di Haroun and the Sea of Stories, e ha evidenziato come la sintassi non convenzionale di Rushdie nel primo romanzo sia stata normalizzata nella traduzione di Capriolo, risultando in uno sfasamento notevole delle "frasi" riconosciute dal programma di allineamento.

Nel brano che segue, ad esempio, il programma di allineamento, ad una "frase" del testo inglese fa corrispondere due "frasi" nel testo italiano:

'Resham Bibi,'he told her approvingly, 'your brain is not yet dead.'

"Resham Bibi," le disse con approvazione. "Il tuo cervello non è ancora morto."

Se in casi come questo, tra le cause più frequenti di mancata corrispondenza 1: 1, si potrebbe imputare la differenza a diverse convenzioni stilistiche riguardanti la lingua inglese e quella italiana, altre differenze sembrano dovute a un preciso intervento del traduttore. Nel caso seguente, ad esempio, vi è una corrispondenza di 2: 1

A nameless morning. Ayooba Shaheed Farooq awaking in the boat of their absurd pursuit, moored by the bank of Padma-Ganga - to find him gone.

Un mattino senza nome, Ayooba Shaheed Farooq si svegliano nella barca del loro assurdo inseguimento, ormeggiata alla riva del Padma-Gange - e s'accorgono che lui è sparito.

In un testo come Midnight's Children che tenta di riprodurre il ritmo della narrazione orale, vengono sovvertite molte delle norme riguardo alla punteggiatura: vi sono frasi senza verbo, periodi lunghi e inframmezzati di esclamazioni, discorsi indiretti interrotti a metà, trattini e puntini di sospensione, ecc., mentre la traduzione italiana sembra introdurre un maggior grado di standardizzazione. Numerosi sono quindi i casi di corrispondenze 1: 2, 2: 1, o anche 3: 1, 4: 1 e viceversa. La punteggiatura, "the author's visual tool for manipulating the reader's response" (May 1997: 4) è sottoposta a notevoli trasformazioni nel passaggio da una lingua all'altra, e quanto osservato durante l'allineamento del corpus parallelo sembra confermare l'osservazione di May (1997: 5) secondo cui i traduttori tendono ad assumere un ruolo quasi redazionale di normalizzazione nei confronti di essa.

Una seconda osservazione riguarda i casi di mancata corrispondenza di tipo 1: 0 oppure 0: 1. In altre parole, i casi in cui a una frase nel testo originale non corrisponde nulla nella traduzione o viceversa. Esempi di corrispondenze 1: 0 sono numerosi ad esempio in The Satanic Verses / I versi satanici, ma non mancano negli altri testi paralleli. Se essi sono nella maggior parte dei casi da interpretare come "sviste" del traduttore (cfr. i traduttori italiani) le numerose "sviste" in I versi satanici parrebbero confermare l'ipotesi che la traduzione di Capriolo sia stata pubblicata in maniera affrettata.[5] Si è invece rilevato un solo esempio di corrispondenza 0: 1, dovuto alla censura operata sulle edizioni del testo inglese successive alla prima, sulla quale si è evidentemente basata la traduzione (cfr. corpus design):

He became a ferocious critic of the Nehru Government, exposing the Mundhra scandal and forcing the resignation of the then Finance Minister, T. T. Krishnamachari - 'T.T.K.' himself Mr Feroze Gandhi died of a heart seizure in 1960, aged forty-seven.Sanjay Gandhi, and his ex-model wife Menaka, were prominent during the Emergency.

Divenne così un feroce oppositore del governo Nehru, svelando lo scandalo Mundhra e costringendo alle dimissioni l'allora ministro delle finanze T.T. Krishnamachari - "T.T.K." in persona. Feroze Gandhi morì d'un colpo apoplettico nel 1960, a quarantasette anni. Si è spesso raccontato che il figlio minore della signora Gandhi, Sanjay, accusò la madre di essere responsabile, con il suo abbandono, della morte di suo padre; e che questo gli diede un potere assoluto su di lei, rendendola incapace di rifiutargli qualsiasi cosa. Sanjay Gandhi e sua moglie Menaka, un'ex indossatrice, ebbero un ruolo rilevante durante l'Emergenza.

Si può presupporre in generale una "non intenzionalità" del traduttore ad alterare a livello di "frase" la matrice testuale dell'originale, anche se fenomeni di "omissione" o di "addizione" (un solo caso rilevato) sono presenti nei testi in misura maggiore o minore. È però difficile stabilire in tutti i casi le cause la responsabilità di una determinata (mancanza di) corrispondenza matriciale in quanto diversi fattori possono intervenire tra il lavoro del traduttore e i testi pubblicati (sia originale che traduzione possono subire delle modifiche, ad opera di autore, revisori o redattori).

Riassumendo, per quanto riguarda il CPR il livello minimo di corrispondenza tra suddivisioni testuali in originali e traduzioni è il paragrafo. Ulteriori suddivisioni interne ai paragrafi determinate dalla punteggiatura non vengono rispettate nel passaggio da un testo all'altro, in quanto ad un uso idiosincratico e "creativo" della punteggiatura nei romanzi di Rushdie fa riscontro nelle traduzioni italiane un linguaggio caratterizzato da una punteggiatura spesso molto più convenzionale.

Un "appiattimento" verso un uso linguistico poco marcato si può d'altra parte osservare non solo per quanto riguarda la punteggiatura. Se si considera ad esempio la traduzione del brano riportato in linguaggio e creatività nei testi transculturali come esempio di "scrittura traduttiva", in cui la struttura sintattica dell'inglese riproduce quella della lingua urdu di cui è una traduzione, si vede come il testo italiano non presenti una costruzione sintatticamente marcata (cfr. una traduzione "normalizzante"). La traduzione italiana contiene inoltre due prestiti lessicali (baba e pice) dei quali è stata fornita precedentemente una traduzione in nota ("bambino", "1/4 di anna o 1/64 di rupia"). Questi marcatori lessicali contribuiscono a conferire al testo italiano un carattere di esotismo. Nel testo inglese Saleem viene chiamato da Padma alternativamente "baba" e "mister", di modo che questo secondo appellativo chiarisce il significato contestuale del primo ad un pubblico inglese, mentre nel testo italiano "Saleem baba" traduce anche un'occorrenza del vocativo "mister". Nel testo italiano la diversità linguistica che caratterizza i personaggi segnalandone l'appartenenza sociale a classi diverse tende cioè a essere meno accentuata, mentre la presenza di prestiti linguistici e il corredo di note esplicative del traduttore contribuisce a definire un generico e indistinto esotismo.

La procedura di allineamento di un corpus parallelo costituisce un utile strumento di studio per determinare le corrispondenze tra "matrici testuali" e allo stesso tempo per esaminare il corpus in modalità "testo a fronte". Purtroppo la possibilità di consultare contemporaneamente e in maniera lineare originali e traduzioni è ristretta alla fase di allineamento, in quanto i programmi utilizzati per la visualizzazione di concordanze parallele non permettono un ordinamento dei segmenti in base alla progressione testuale. Per questo motivo sembra auspicabile l'inclusione di questa funzionalità in future applicazioni software da utilizzare nello studio descrittivo di corpora paralleli.

[1] L'algoritmo utilizzato per realizzare l'allineamento si basa sul lavoro svolto dal gruppo di ricercatori canadesi che hanno lavorato sul corpus Hansard inglese-francese (cfr. corpus processing)

[2] Il programma, ideato a partire dalle esperienze di linguistica dei corpora applicata alla didattica delle lingue ("data driven learning", cfr. Johns e King 1991, Johns 1993) è particolarmente appropriato per un uso della traduzione come attività per l'apprendimento linguistico, in particolare in presenza di classi e apprendenti dalle diverse lingue madri in quanto prevede l'uso di corpora multilingui ed è dotato di una serie di funzionalità che possono essere usate a scopi didattici (ad esempio la possibilità di "nascondere" le parole oggetto di concordanza per farle indovinare all'apprendente).

[3] L’acronimo TWM è l’estensione del file di database principale utilizzato all’interno del programma Trados Translator’s Workbench.

[4] Inoltre, dato che la stazione di lavoro permette di creare memorie traduttive operanti in una sola direzione (originale à traduzione), si è creata anche una memoria "duplicata" in cui l'italiano è stato impostato come "originale". In questo modo è stato possibile consultare le concordanze bilingui anche a partire dai testi italiani.

[5] Quest'ipotesi trova ulteriore conferma nei numerosi errori tipografici rilevati durante la "ripulitura" del testo e codificati nella versione elettronica.