Exploration des corpus littéraires à des fins linguistiques et traductionnels

Exemple du connecteur 'mais' en français et de ses variantes traductionnelles en slovène

By Mojca Schlamberger Brezar (University of Ljubljana, Slovenia)

Abstract

English:

The paper deals with the distribution of the French connective mais and his translation equivalences in the parallel corpus FraSLoK, composed of French originals and Slovene translations of literary texts, namely novels, and newspaper articles. The connectives and their translations are analysed in order to discover if the type of texte has an impact on the translation. The number of connectives expressing opposition is almost the same as a little bit higher percentage of mais in literary texts whereas there are more variants of French connectives in the part of the corpus consisting of newspaper articles. The distribution of Slovene translation variations in literary and journalistic corpusis slightly different: the analysis reveals the authors’ and translators’ preferences for a certain Slovene connective that as a stylistic variation.

French:

L'article traite les occurences du connecteur français mais et ses variantes traductionnelles dans le corpus parallèle FraSloK, composé d'originaux et de traductions des textes littéraires, notamment des romans, et de textes journalistiques. Les connecteurs et leur traductions sont analysés avec l'intention de voir si le type de texte pourrait influencer leur traduction : en effet, le nombre des connecteurs d’opposition utilisés est à peu près le même avec un taux un peu plus fort de mais en corpus littéraire et un peu plus de variation des connecteurs français en corpus journalistique. La distribution des variantes traductionnelles est pourtant différente dans les deux corpus : l'analyse révèle les affinités de certains auteurs et traducteurs pour un certain connecteur qui est préféré à une autre variante stylistique.

Keywords: corpus littéraires, français, slovène, connecteurs argumentatifs d'opposition, valeur stylistique, literary corpora, French, slovene dialects, argumentative connectives of opposition, stylistic values

©inTRAlinea & Mojca Schlamberger Brezar (2017).
"Exploration des corpus littéraires à des fins linguistiques et traductionnels Exemple du connecteur 'mais' en français et de ses variantes traductionnelles en slovène"
inTRAlinea Special Issue: Corpora and Literary Translation
Edited by: Titika Dimitroulia and Dionysis Goutsos
This article can be freely reproduced under Creative Commons License.
Stable URL: https://www.intralinea.org/specials/article/2259

1. Introduction

Notre article propose un regard sur l'exploration de la littérature à des fins linguistiques à la base d'un corpus littéraire parallèle bilingue entre le français en tant que langue source et le slovène en tant que langue de traduction.

Depuis des années et surtout avant l'avènement de la linguistique des corpus, un grand nombre de dictionnaires (monolingues et bilingues) et de grammaires (voir par exemple la Grammaire méthodique : Riegel, Pellat, Rioul 1994) ont puiséleur matériel dans la littérature, aussi bien en slovène qu'en français. En France et dans les pays francophones, on peut constater une émergence des corpus pour le français, accessibles sur l'internet, depuis les années 1990. Avant cette décennie, la seule exploration systématique de la littérature est Frantexte,corpus littéraire français monolingue, et le grand dictionnaire Trésor de la langue française informatisé qui en résulte (TLF dans la suite, [url=http://www.atilf.fr]http://www.atilf.fr[/url]; Habert et al., 1997), qui est un des plus complexes pour la langue française.

En slovène, la tradition de puiser les données linguistiques dans les exemples littéraires pour produire des grammaires et des dictionnaires remonte au début de la tradition de description linguistique de cette langue et est encore valable au XXe siècle : toutes les grammaires sont faites de cette manière, comme le montrent par exemple Toporišič (1976, 2000) ou Vincenot (1975). Le dictionnaire classique de la langue slovène SSKJ était également basé sur des exemples littéraires (Bajec et al., 1994).Selon un de ses éditeurs, F. Jakopin (Bajec et al., 1994 : XVII), les corpus étaient écrits et triés manuellement sur cartes ou fiches – le SSKJ est basé sur 6 millions de fiches et 300 000 mots-clés issus de textes littéraires (en premier lieu !), scientifiques, techniques, journalistiques et autres. Il n’a été informatisé que vers la fin des années 1990.

Depuis toujours, la littérature a réflété la multiplicité des registres de la langue, en permettant également de rentrer ce qui n'est pas « standard » par le biais des dialogues littéraires qui miment l'oral.

Notre article se propose alors l'élaboration des points suivants : dans un premier temps, nous présenterons un regard sur les corpus monolingues et parallèles de la langue slovène, en consacrant une attention spéciale à l'inclusion de la production littéraire. Ensuite, nous donnerons un aperçu du corpus parallèle traductionnel FraSloK, compilé par Adriana Mezeg (Mezeg 2011), et nous offrirons une analyse et comparaison des connecteurs de l'opposition dans les textes littéraires et journalistiques. Les connecteurs d'oppositions se déclinent, en slovène, sur toute une gamme de valeurs stylistiques, que nous voulons exposer sur deux parties du corpus avec l'hypothèse qu'ils vont différer selon les textes explorés.

2. Corpus slovène, attitude des auteurs envers la littérature et la traduction littéraire

Les deux corpus slovènes librement accessibles appartiennent d'un côté la Famille Fida, et de l'autre à la famille Beseda. La 1e, 2e et 3e génération de la famille Fida sont appelées respectivement Fida, Fida Plus et Giga Fida. Le premier corpus Fidaa été compilé entre 1997 et 2000 comme fruit de la collaboration parmi l'Université de Ljubljana, l'Institut de la recherche technologique Jožef Stefan, la maison d'édition DZS et l'entreprise de technologies linguistiques Amebis ([url=http://www.fida.net]http://www.fida.net[/url]). A partir de 2007, il a été élargi : le mega-corpus FidaPlus ([url=http://www.fidaplus.net]http://www.fidaplus.net[/url]) contient plus de 600 millions de mots. Depuis 2010, un élargissement ultérieur a donnéGigafida ([url=http://www.gigafida.net]http://www.gigafida.net[/url]). Les trois ont été compilés à la base d'articles de journaux, discours du parlement, et surtout de littérature, aussi bien originale que traduite. Le dernier,Gigafida, contient 1,2 milliards de mots provenant de textes sous forme numérique repérés sur Internet ; les genres sont les mêmes que pour les deux autres corpus ([url=http://www.slovenscina.eu/korpusi/gigafida]http://www.slovenscina.eu/korpusi/gigafida[/url]).

Les deux corpus de la famille Beseda, Beseda et Nova Beseda, ont été élaborés dans le cadre de l'institut de la recherche linguistique de l'Académie slovène des arts et des sciences ([url=http://www.bos.zrc-sazu.si/s_beseda.html]http://www.bos.zrc-sazu.si/s_beseda.html[/url]). Ils sont composés d'œuvres littéraires et d'articles de journauxet comptent quelque 240 millions de mots (Gorjanc, Krek, 2005 : 186-187) ; des traductions, littéraires et pragmatiques, sont présentes.

Cette dernière donnée dit quelque chose sur le statut des traductions en slovène. Le fait d’avoir inclus dans les corpus les traductions va à l'encontre de l'exemple britannique du British National Corpus (BNC), qui semble exclure toute traduction. Ce corpus servait pourtant de modèle aux constructeurs slovènes avec cette reserve que pour le slovène, le statut de la traduction semble donc être comparable au statut de l'original.

Le corpus traductionnel Spook et la partie pour le français et le slovène FraSloK seront présentés dans la suite.

2.1 Le corpus traductionnel SPOOK

A part les corpus monolingues, l'intérêt pour la compilation de corpus traductionnels est apparu en vue de recherches sur les universels en traduction. Le corpus Spook (Slovenski prevodoslovni korpus – Corpus traductionnel slovène),résultat d’un projet dirigé par Špela Vintar[1] entre 2008 et 2012, a été compilé dans le cadre du Département de traduction et interprétation de l’Université de Ljubljana à partir de mai 2009 jusqu’en avril 2012. Il comprend des corpus anglais-slovène, allemand-slovène et italien-slovène, ainsi que la partie français-slovène FraSloK, élaborée par Adriana Mezeg dans le cadre de sa thèse de doctorat et dont nous reparlerons par la suite. Le corpus Spook comprend 95 œuvres littéraires, dont 23 originaux slovènes, le reste étant composé de traductions et de leurs originaux en anglais, italien, allemand et français. Dans le corpus littéraire, seulement les romans sont pris en compte. Déjà dans d’autres corpus (par exemple, Fida et Fidaplus), les auteurs ont inclus surtout de la prose ; étant donné leur taille limitée et leur forte stylisation, la poésie et l'art dramatique ne présentaient pas autant d'intérêt pour leurs compilateurs et sontpartant totalement exclus du corpus.

Le corpus Spook inclut une partie littéraire considérable : comme le note Vintar (2013: 7), l'idée de composition d'origine était beaucoup plus ambitieuse et voulait garantir la représentativité des genres tout en incluant dans la partie non-littéraire des manuels, des articles des journaux et des textes techniques. Mais dans la phase préparatoire, il a été démontré que les traductions non-littéraires actuelles vers le slovène à partir de l’allemand, de l’anglais, du français et de l’italien appartiennent à des genres très différents, qui ne pouvaient pas être comparés entre eux (voir Schlamberger Brezar 2010, Mezeg 2011). La traduction littéraire a donc été choisie comme le seul genre vraiment commun et accessible pour toutes les langues en question.

2. 2 Corpus parallèle FraSloK

La partie française du corpus Spook FraSloK a été compilée par Adriana Mezeg pour les besoins de sa thèse de doctorat intitulée L’analyse des constructions détachées en français et de leurs traductions vers le slovène basée sur les corpus (titre d’origine Korpusno podprta analiza francoskih polstavkov in njihovih prevedkov v slovenščini, Mezeg 2011). Son corpus comprend une partie littéraire composée de 12 romans français et francophones parus entre 1989 et 2007[2], et leurs traductions en slovène dans les 15 dernières années,ainsi qu’une partie journalistique. Il s'agit globalement de 2,5 millions de mots environ (2 466 985 plus exactement). La partie littéraire dépasse un peu la moitié de ces occurrences (1 302 911); quant à la partie journalistique, il s’agit de 300 articles du journal Le Monde diplomatique et de leurs traductions parues en slovène entre 2006 et 2009, avec 1 164 074 occurrences. La partie journalistique est accessible librement à la page internet [url=http://nl.ijs.si/noske]http://nl.ijs.si/noske[/url], tandis qu’on peut accéder à la partie littéraire avec un mot de passe[3].

3. Particularités du corpus littéraire

Notre analyse se déroulera sur le corpus des textes littéraires FraSloK. Le corpus est accessible sur le site de l’Institut de technologie Josef Stefan (IJS) et de son Département de technologie cognitive ; il est installé sur le serveur de langue naturelle avec un concordancier et l’outil d’analyse des corpus NoSketch Engine.

Pour cet article, nous avons choisi de faire une recherche quantitative sur l’utilisation des connecteurs de l’opposition, d’abord dans la partie française du corpus littéraire, puis dans la partie slovène qui permettait aussi la recherche parallèle : nous nous sommes concentrée sur mais et ses variantes traductionnelles en slovène. Les connecteurs d'oppositions, très fréquents en français et apparaissant sous formes multiples, sont un enjeu pour le traducteur. A la différence des langues comme l'anglais où il n'y a qu'un ou deux connecteurs d'opposition (but et whereas), le français et le slovène en présentent une variété. Ces connecteurs diffèrent selon leur valeur stylistique, le registre de langue utilisé et présentent en même temps une différence entre l'oral ou l'écrit. Parmi les connecteurs d'opposition en français, mais présente la plus grande variété de valeurs. A la base d'une analyse quantitative, nous voulons établir d'abord sa fréquence par rapport aux autres connecteurs d'opposition, et voir ensuite ses variantes traductionnelles en slovène, en tenant compte des similitudes ou différences dans les parties littéraire et journalistique du corpus FraSloK.

3.1 Les résultats de la recherche quantitative dans les deux corpus 

Dans le corpus littéraire, la totalité de mais était de 2736 occurrences, distribuées dans différents romans comme suit (tableau 1 ci-dessous) :

 

text.display

Fréquence

p | N

Plateforme (2001)

440

p | N

Le ventre de l'Atlantique (2003)

315

p | N

Je m'en vais (1999)

306

p | N

Eldorado (2006)

253

p | N

Balzac et la petite taill… (2000)

237

p | N

Truismes (1997)

229

p | N

L'Amour du prochain (2004)

224

p | N

Le testament français (1995)

222

p | N

Mammifères (2003)

199

p | N

Impératrice (2003)

192

p | N

Un secret (2004)

70

p | N

Fou de Vincent (1989)

49

Tableau 1 fréquence du connecteur mais (2736 occurrences) dans le corpus littéraire

Nous pouvons constater que l’œuvre littéraire qui utilise le plus grand nombre de mais est Plateforme de Michel Houellebecq, tandis que le plus bas nombre se trouve dans le roman Fou de Vincent d’Hervé Guibert.

Les autres connecteurs d’opposition présents dans la partie littéraire du corpus étaient pourtant, cependant, néanmoins. Leur fréquence est inférieure à mais, ils ne représentent même pas 10% des occurrences de mais - comme le montrent les tableaux 2 et 3 ci-dessous.

 

text.display

Fréquence

p | N

Plateforme (2001)

43

p | N

Truismes (1997)

26

p | N

Le ventre de l'Atlantique (2003)

25

p | N

Mammifères (2003)

24

p | N

Le testament français (1995)

22

p | N

L'Amour du prochain (2004)

19

p | N

Je m'en vais (1999)

11

p | N

Impératrice (2003)

8

p | N

Balzac et la petite taill… (2000)

8

p | N

Eldorado (2006)

7

p | N

Un secret (2004)

3

p | N

Fou de Vincent (1989)

3

Tableau 2 : fréquence du connecteur pourtant (199 occurrences dans le corpus littéraire)

Le connecteur pourtant ne comptait que 199 occurrences dans le corpus littéraire mais était utilisé dans tous les romans – de 43 occurrences dans Plateforme jusqu’à trois dans Un secret et Fou de Vincent.

text.display

Fréquence

 

p | N

Je m'en vais (1999)

23

p | N

Plateforme (2001)

16

p | N

Mammifères (2003)

10

p | N

Le testament français (1995)

7

p | N

Un secret (2004)

6

p | N

Le ventre de l'Atlantique (2003)

5

p | N

Impératrice (2003)

3

p | N

Balzac et la petite taill… (2000)

3

p | N

Truismes (1997)

1

p | N

L'Amour du prochain (2004)

1

p | N

Eldorado (2006)

1

Tableau 3 : fréquence du connecteur cependant (76 occurrences dans le corpus littéraire)

Le connecteur cependant avec ses 76 occurrences n’était pas présent dans tous les romans (absent du roman Fou de Vincent). Le plus fréquemment employé dans le roman Je m’en vais, il n’atteint qu’une occurrence dans Truismes, L’Amour du prochain et Eldorado.

Les connecteurs néanmoins, avec ses 4 occurrences, et toutefois, avec 12 occurrences, étaient les moins représentés : néanmoins apparaissant dans 3 romans et toutefois dans 5.

 

text.display

Fréquence

p | N

Impératrice (2003)

2

p | N

Le ventre de l'Atlantique (2003)

1

p | N

Balzac et la petite taill… (2000)

1

Tableau 4 : fréquence du connecteur néanmoins (4 occurrences dans le corpus littéraire)

text.display

Fréquence

 

p | N

L'Amour du prochain (2004)

6

p | N

Le ventre de l'Atlantique (2003)

3

p | N

Truismes (1997)

1

p | N

Mammifères (2003)

1

p | N

Impératrice (2003)

1

Tableau 5 : fréquence du connecteur toutefois (12 occurrences dans le corpus littéraire)

Pour récapituler, mais est le plus fréquent des connecteurs d'opposition avec ses 2736 occurrences (Tableau 1), pourtant (Tableau 2) apparaît à 199 reprises et les autres connecteurs sont beaucoup moins fréquents – 76 occurrences pour cependant, 4 pour néanmoins et 12 pour toutefois (Tableaux 3, 4 et 5 respectivement).

La recherche quantitative des connecteurs d’oppositions dans le corpus journalistique donne des resultats comparables : mais avec ses 1929 occurrences est toujours le connecteur le plus employé par les journalistes. Toutefois, les autres connecteurs d’opposition sont mieux représentés : pourtant avec 310 occurrences, cependant avec 158, toutefois avec 143 et néanmoins avec 93. A cet égard, le corpus journalistique offre donc une plus grande diversité. Pourtant, mais demeure visiblement le plus important des connecteurs d'opposition dans les deux corpus. Nous présenterons ses valeurs traductionnelles pour le slovène dans la suite de l'article.

3.2 Valeurs du connecteur mais et de ses equivalents traductionnels en slovène

La deuxième recherche portait sur les variantes traductionnelles de mais. Ici, deux points restent à souligner. Le premier est la polysémie du connecteur mais. Le deuxième, l’existence de plusieurs possibilités de traduction de mais vers le slovène, avec différentes valeurs en fonction du registre employé (écrit, oral, soutenu, littéraire, administratif) et du choix de la part du traducteur.

En effet, une multitude de connecteurs slovènes entrent en jeu comme variantes de traduction de mais. Quelles sont les sources de cette diversité ? Le choix des variantes traductionnelles est-il influencé par les dictionnaires, par le processus d’apprentissage de la langue maternelle ou étrangère, par l'acception de la norme commune ou bien est-il tout simplement subjectif? Existe-t-il des stratégies traductionnelles qui permettent de voir les influences possibles sur le choix d'un connecteur spécifique? Nous allons essayer de donner une réponse à ces questions dans la suite.

D’abord, arrêtons-nous à la polysémie du connecteur mais. En tant que connecteur, mais peut prendre plusieurs valeurs, des plus fortement argumentatives, prenant en compte tout le carré argumentatif (voir p. ex. Ducrot etal. 1980 ou Adam 1990), jusqu'aux plus orales, dépouillées de tout environnement argumentatif mais servant à l'argumentation grâce au contexte. Dans l’étude de Jean-Michel Adam (Adam 1990) est présentée la description du connecteur mais à la suite de l’article de O. Ducrot Mais occupe-toi d’Amélie (Ducrot et al. 1980) où sont exposées cinq valeurs :

Mais réfutatif (Adam 1990 : 194), construit sur une négation et combinable avec non pas, plus, point... Il peut être présenté à l’aide de l’exemple : ce n’était pas lui qui parlait mais sa luxure...

Mais concessif, qui apparaît toujours en connexion avec la négation, même si celle-ci est implicite, p. ex. Cet étudiant est intelligent, mais il échoue à tous les examens. Le mais concessif mène alors à une conclusion directe. Le mais réfutatif se construit avec la négation de la première proposition qui se combine avec non pas (plus, point), selon le schéma non pas P, mais Q (Adam 1990: 194), comme par exemple dans Il n'était pas malade, mais paresseux. Ici, l’enchaînement à l’opposition à la première partie de l’énoncé se fait directement et il n’est pas nécessaire d’y accéder à travers des conclusions explicites ou implicites.

Mais argumentatif, le plus complexe de tous. Il comprend deux arguments explicites et deux conclusions qui sont le plus souvent implicites mais toujours en opposition (Adam 1990: 206), comme dans « Cet étudiant est intelligent, mais paresseux ». Le mais argumentatif est basé sur les présuppositions des locuteurs concernant l’état des choses et leur attitude envers le contexte et les normes civilisationnelles, ce que Ducrot et Anscombre (Anscombre, Ducrot 1983) ont dénommé le topos. Dans ce cas-là, la qualité P (être intelligent) n’implique pas non-Q (ne pas être paresseux) : cette implicature n’est pas basée sur le monde extérieur mais sur les représentations et les présuppositions du locuteur à propos du monde qui l’entoure. Le mais argumentatif fait partie de l’espace discursif où P présente l’argument pour la conclusion C et Q l’argument pour la conclusion non-C, et où mais est l’indicateur que la conclusion est argumentativement orientée vers non-C.

Les différences entre ces trois mais sont minimes aussi bien dans leur contenu conceptuel que dans les variantes en traduction, qui se jouent sur les mêmes équivalents slovènes, le plus fréquent et le plus proche étant le connecteur ampak.

Nous traîterons à part le mais de renforcement-renchérissement et le mais phatique. Le mais de renforcement-rencherissement est le connecteur qui apparaît dans des exemples tels que non seulement … mais aussi (Adam 1990 : 192). Ce type de proposition est généralement construit avec non seulement dans la proposition P et combiné avec même, aussi, également, en plus, de plus dans la proposition Q. C’est à dire qu’il apporte un argument supplémentaire pour une conclusion qui peut être exprimée explicitement ou implicitement. Ce mais donne généralement en slovène « ne samo, ampak / marveč / temveč tudi ».

L’autre valeur de mais, qui peut être traîtée à part, est celle du mais phatique, qui apporte la démarcation des segments textuels (Adam 1990 : 197, Schlamberger Brezar 2009 : 205-207) et signale une sorte d’opposition dérivée d’une forme orale comme dans Mais faites donc attention! (voir aussi Schlamberger Brezar 2012). Nous pouvons expliquer son fonctionnement en le considérant comme un mais de l’oral qui garde sa valeur argumentative mais apparaît dans des propositions elliptiques, agit en fonction du contexte implicite et se combine avec les marqueurs discursifs, par exemple mais oui, mais bien sûr, mais quand même. Ses valeurs dépendent du contexte exclamatif, impératif ou interrogatif mais il peut aussi acquérir une fonction métalinguistique (Schlamberger Brezar 2009 : 206). Ce type de connecteur d’opposition apparaît le plus souvent dans les dialogues où il serait traduit vers le slovène par ampak ou pa, les deux étant les marqueurs de l’oral par excellence.

Comme nous l'avons déjà annoncé dans la partie précédente, les equivalents ou les homologues de mais en traduction vers le slovène sont nombreux, le plus proche étant ampak. C’est pourtant une question de normativité, de choix personnel et de contraintes textuelles, entre autres. Nous citons dans la suite les possibilités de choix des connecteurs données par les dictionnaires et les grammaires.

Dans le dictionnaire français-slovène Francosko-slovenski slovar (Grad 1984) les traductions slovènes suivantes sont données pour mais : conjonction toda, ampak; temveč ; non seulement mais encore : ne le, temveč tudi. Claude Vincenot dans son Essai de grammaire slovène (Vincenot 1975: 297) à l’intention des locuteurs français parle des « jonctifs adversatifs simples » où il énumère a/toda/ampak/ marveč/ temveč = mais, a/ali (littéraire) =mais, vendar = pourtant, cependant, « jonctifs adversatifs doubles qui sont concessifs » sicer, vendar – certes, pourtant ainsi que les conjonctions marquant le « renchérissement positif » : ne samo/ le … ampak, marveč, temveč tudi (non seulement, mais encore). D’après Vincenot, les équivalents de mais les plus appropriés seraient pa, toda, ampak, marveč, temveč, un peu moins vendar et samo.

Cette détermination des connecteurs dans le dictionnaire offre au traducteur des informations sur la polysémie et la nécessité de prendre en compte le contexte minimal, donnant tout de même une multitude de possibilités traductionnelles. Le dictionnaire de Grad et la grammaire de Vincenot fournissent le minimum d’indications aux traducteurs pour un choix adéquat de l’équivalent mais vont aussi vers la synonymie des connecteurs.

Selon le grand dictionnaire slovène monolingue Slovar slovenskega knjižnega jezika (dorénavant SSKJ, Bajec et al. 1994), les connecteurs d’opposition sont interchangeables, chacun possédant cependant une particularité stylistique. La conjonction a est qualifiée de plutôt littéraire, possible dans la coordination copulative. Pour ampak, les valeurs suivantes sont citées : 1) dans la coordination adversative, 2) valeur expressive ne samo…ampak tudi (non seulement... mais aussi qui correspond au mais de renchérissement), 3) expressif pour l’opposition ; 4) expressif, oral, au début de la phrase. Ici, ampak correspond au mais phatique. Les valeurs du connecteur pa – conjonction dans la coordination adversative, pour exprimer une faible opposition – sont typiques de l’oral. Les conjonctions et connecteurs toda et vendar partagent la possibilité d’être employées en coordination adversative, mais expriment aussi l’opposition. Le connecteur toda est plutôt littéraire et soutenu, vendar ajoute la valeur qu’une certaine conclusion va de soi. Les adverbes adversatifs marveč et temveč donnent plus d’impact à la force d’expression des arguments et peuvent aussi accompagner ampak en tant que traductions du mais de recherissement.

Ces désignations dans le dictionnaire pourraient montrer le fil conducteur du comportement des traducteurs. Dans le corpus littéraire, les passages diffèrent en approche narrative, descriptive ou dialogale. Les dialogues sont souvent la source de l’oralité, alors nous supposons que le traducteur proposera des traductions différentes selon le prototype de la séquence (Schlamberger Brezar, 2012). En même temps, un certain poids de la subjectivité des traducteurs dans le choix des connecteurs slovènes qui à leur tour présentent l'équivalence de mais en slovène est à prévoir.

3.3 Les variantes traductionnelles de mais et leur fréquence dans le corpus littéraire

En corpus parallèle littéraire, nous avons trouvé comme la variante traductionnelle de mais les connecteurs vendar, pa, ampak, a, toda, marveč et temveč. Nous fournirons les résultats de notre analyse en tenant compte de leur fréquence décroissante, tout en évaluant les choix des traducteurs. Nous avons évalué les choix des traducteurs pour différentes stratégies, basées sur le style de l'auteur ou sur leur propre poétique ou politique linguistique, ou parfois suggérés aussi par les relecteurs des documents.

Les résultats quantitatifs de la traduction des connecteurs vers le slovène dans les traductions des textes littéraires sont les suivants. La variante traductionnelle du connecteur mais la plus fréquemment utilisée était le connecteur vendar avec ses 766 occurrences :

 

text.display

Fréquence

p | N

Eldorado (2007)

212

p | N

Francoski testament (2005)

162

p | N

Platforma (2002)

150

p | N

Cesarica (2007)

81

p | N

Balzac in kitajska šivilj… (2002)

77

p | N

Sesalci (2007)

65

p | N

Ljubezen do bližnjega (2007)

63

p | N

Trebuh Atlantika (2007)

49

p | N

Grem (2008)

24

p | N

Skrivnost (2008)

12

p | N

Svinjarije (1997)

4

p | N

Nor na Vincenta (2007)

2

Tableau 6 : fréquence du connecteur vendar (766 occurrences dans le corpus littéraire)

Vendar est le moins fréquent dans la traduction du roman Fou de Vincent et il semble être le connecteur préféré de la traductrice du roman Eldorado. Cette traduction semble automatique : en effet, la traductrice n’utilise que très peu les autres connecteurs slovènes en combinaison avec mais, pa (18 occurrences), ampak (12 occurrences), a (9), temveč (2), marveč (3) et aucun toda. Suit le connecteur pa :

text.display

Fréquence

 

p | N

Balzac in kitajska šivilj… (2002)

94

p | N

Platforma (2002)

90

p | N

Svinjarije (1997)

75

p | N

Trebuh Atlantika (2007)

64

p | N

Grem (2008)

63

p | N

Ljubezen do bližnjega (2007)

62

p | N

Francoski testament (2005)

59

p | N

Sesalci (2007)

31

p | N

Cesarica (2007)

22

p | N

Eldorado (2007)

18

p | N

Nor na Vincenta (2007)

17

p | N

Skrivnost (2008)

7

Tableau 7 : fréquence du connecteur pa (602 occurrences dans le corpus littéraire)

Le connecteur pa oral est moins contraignant en adversativité que ampak (plus faible) mais aussi appartenant au registre oral et à la traduction dans les dialogues. Ce connecteur est le plus fréquemment utilisé dans la traduction du roman Balzac et la petite tailleuse chinoise (Balzac in mala kitajska šiviljica) avec 94 occurrences, suivi de très près de Plateforme – Platforma (90 occurrences). Il est intéressant de voir que le nombre des occurrences reste assez élevé dans les quatre romans qui suivent (de 75 à 59). Ce connecteur est le moins fréquent dans la traduction du roman Un secret. Le connecteur pa, fortement oral en slovène, entre en concurrence avec ampak, discuté dans le tableau 8. Il paraît que les deux ont une fréquence faible dans les œuvres présentant le mois de dialogues (SkrivnostLe Secret, 7 pa contre 9 ampak ; SvinjarijeLes Truismes, 75 pa contre 164 ampak etc.):

 

text.display

Fréquence

p | N

Svinjarije (1997)

164

p | N

Sesalci (2007)

114

p | N

Platforma (2002)

70

p | N

Grem (2008)

52

p | N

Balzac in kitajska šivilj… (2002)

45

p | N

Ljubezen do bližnjega (2007)

42

p | N

Trebuh Atlantika (2007)

39

p | N

Francoski testament (2005)

31

p | N

Eldorado (2007)

12

p | N

Skrivnost (2008)

9

p | N

Nor na Vincenta (2007)

4

p | N

Cesarica (2007)

1

Tableau 8 : fréquence du connecteur ampak (583 occurrences dans le corpus littéraire)

Le plus grand nombre de mais traduits par ampak apparaît dans la traduction du roman Truismes. Le nombre total des occurrences de mais dans ce roman était de 229, dont 164 sont traduites par ampak. Des autres traductions possibles de mais apparaîssent toda (8 occurrences), pa (75 – ce qui prédit l’oralité de l’oeuvre), et vendar (4), avec une absence totale de a, marveč ou temveč. Le choix du connecteur ampak dans ce roman est bien fondé, puisqu’il s’agit d’une narration un peu naïve en 1e personne. Il en va de même pour le choix des connecteurs dans la traduction des Mammifères – Sesalci de Pierre Mérot (114 occurrences de ampak) où le cadre de la narration est presque pareil à Truismes – Svinjarije, sauf qu’il se déroule avec un peu de distance, un narrateur omniprésent racontant l’histoire de l’oncle en 3e personne, mais la narration est très oralisée. Il parait que le traducteur en a tenu compte.

Le connecteur toda du Tableau 9, avec la connotation «littéraire, soutenu » est assez fréquent dans trois romans comme variante de mais : Platforme (81), Ventre de l’Atlantique (78) et L’impératrice (73). Le moins fréquent est dans le roman Je m’en vais où prédomine le connecteur a qui a la même valeur (voir le Tableau10).

p | N

Platforma (2002)

81

p | N

Trebuh Atlantika (2007)

78

p | N

Cesarica (2007)

73

p | N

Skrivnost (2008)

49

p | N

Ljubezen do bližnjega (2007)

34

p | N

Nor na Vincenta (2007)

20

p | N

Svinjarije (1997)

8

p | N

Sesalci (2007)

8

p | N

Balzac in kitajska šivilj… (2002)

5

p | N

Grem (2008)

3

p | N

Francoski testament (2005)

3

Tableau 9 : fréquence du connecteur toda (324 occurrences dans le corpus littéraire)

Le connecteur a, synonyme de toda selon la stylistique (avec sa valeur soutenue et littéraire) compte, en tant que variante traductionnelle de mais, 437 occurrences. Ce connecteur n’apparaît pas dans toutes les traductions (absent dans Truismes et Testament français). On en trouve le plus grand nombre dans la traduction du roman Je m’en vais, à savoir 191 occurrences. Les connecteurs toda et a présentent la même valeur stylistique et une fréquence comparable, avec cette reserve que le choix de toda élimine le choix de : la traduction Skrivnost – Le Secret présente 49 occurrences de toda mais une seule de a ; le connecteur a apparaît 191 fois dans Grem – Je m'en vais, où toda est complètement absent. Le connecteur a s’est alors montré être la préférence subjective de la traductrice de Grem – Je m'en vais, et la distribution de toda ou a semble être liée à un choix subjectif des traducteurs.

text.display

Frequence

 

p | N

Grem (2008)

191

p | N

Trebuh Atlantika (2007)

72

p | N

Ljubezen do bližnjega (2007)

68

p | N

Platforma (2002)

41

p | N

Cesarica (2007)

28

p | N

Nor na Vincenta (2007)

14

p | N

Balzac in kitajska šivilj… (2002)

10

p | N

Eldorado (2007)

9

p | N

Sesalci (2007)

3

p | N

Skrivnost (2008)

1

Tableau 10 : fréquence du connecteur a (437 occurrences dans le corpus littéraire)

Dans les prochains tableaux figurent les traductions du mais de renchérissement sous forme des connecteurs slovènes temveč (Tableau 11), marveč (Tableau 12) et leur variante moins soutenue ampak tudi (Tableau 13).

Le connecteur temveč est le plus fréquent dans la traduction du roman Le Ventre de l’Atlantique mais complètement absent des traductions des romans Je m’en vais, Truismes, Mammifères, Balzac et la petite tailleuse chinoise et Testament français où il semble être remplacé par la variante moins littéraire, plus moderne ampak tudi. Par contre, marveč n’obtient que 5 occurrences dans trois romans, Eldorado, Platforme et L’Amour du prochain. Dans la traduction de ce dernier, il existe une occurrence pour chaque connecteur susceptible de traduire un mais de renchérissement ; marveč, temveč et ampak tudi.

text.display

Fréquence

 

p | N

Trebuh Atlantika (2007)

17

p | N

Platforma (2002)

9

p | N

Cesarica (2007)

6

p | N

Nor na Vincenta (2007)

2

p | N

Eldorado (2007)

2

p | N

Skrivnost (2008)

1

p | N

Ljubezen do bližnjega (2007)

1

Tableau 11 : fréquence du connecteur temveč (38 occurrences dans le corpus littéraire)

text.display

Fréquence

 

p | N

Eldorado (2007)

3

p | N

Platforma (2002)

1

p | N

Ljubezen do bližnjega (2007)

1

Tableau 12 : fréquence du connecteur marveč (5 occurrences dans le corpus littéraire)

text.display

Fréquence

 

p | N

Balzac in kitajska šivilj… (2002)

3

p | N

Svinjarije (1997)

2

p | N

Sesalci (2007)

1

p | N

Platforma (2002)

1

p | N

Ljubezen do bližnjega (2007)

1

Tableau 13 : fréquence du connecteur ampak tudi (11 occurrences dans le corpus littéraire)

Avant de conclure, nous pouvons comparer les résultats obtenus de l’analyse quantitative du corpus littéraire avec ceux du corpus journalistique où les chiffres sont les suivants :[4]le connecteur le plus fréquent pour mais français dans la partie journalistique est vendar, qui compte 541 occurrences. Suit pa avec 522, toda avec 304, a avec 256, ampak avec 204 et temveč avec 82 occurrences (ce dernier en concurrence avec ampak tudi, apparaissant 28 fois). Le connecteur marveč, pourtant repérédans le corpus littéraire, n’apparaît pas dans le corpus journalistique. La plus grande différence entre les deux corpus apparaît dans le cas de la traduction de mais avec le connecteur ampak, qui compte 583 occurrences dans le corpus littéraire et seulement 204 dans la partie journalistique du FraSloK. Comme ce connecteur est censé appartenir au registre oral, on peut faire l’hypothèse d’une (auto)censure ou simplement d’une intervention des rédacteurs du texte[5]. Pour cette conclusion, nous nous basons sur le fait que ampak était le plus fréquemment employé dans les œuvres littéraires qui reproduisaient l'oral.

Il en va de même pour temveč, qui est de 50% plus fréquent en corpus journalistique (82 occurrences) qu'en corpus littéraire (38 occurrences). Mais finalement, les données de fréquence dans les deux corpus correspondent en gros aux résultats obtenus dans les corpus monolingues.[6]

4. Conclusion

La comparaison entre la partie littéraire et journalistique du corpus bilingue parallèle français-slovène offre des résultats intéressants : le nombre des connecteurs d’opposition utilisés est à peu près le même avec un taux un peu plus fort de mais en corpus littéraire et un peu plus de variation des connecteurs en corpus journalistique. A partir de ce résultat, on pourrait supposer plus d’argumentativité dans la partie journalistique et plus de mimésis d’oralité dans la partie littéraire.

Grâce à l’analyse quantitative des connecteurs, nous avons accès à une certaine poétique de l’auteur – parmi les romans inclus dans le corpus le plus grand nombre de connecteurs d’oppositions est inclus dans Plateforme de Michel Houellebecq. Le choix des équivalents de mais en slovène se fait selon le registre de la langue (soutenu, familier), le type de texte (narratif ou dialogique) et les prédilections subjectives des traducteurs ; certains préfèrent a, d’autres toda ou vendar. Ainsi, la poétique d’un traducteur particulier peut ressortir : on peut constater que certains auteurs ont leurs préférences concernant le choix de la variante traductionnelle de mais : par exemple, ampak est le connecteur préféré dans les Truismes – ce choix peut être expliqué par la nature de ce roman qui est raconté en 1e personne et alors fortement sous l’impact de l’oral. Il est suivi de très près des Mammifères reprenant la même stylistique mais à la 3e personne. Par contre, vendar apparaît presque comme la seule variante traductionnelle de mais dans l’Eldorado où le traducteur donne l’impression de choisir ce connecteur automatiquement même si ce choix n’est pas toujours le meilleur. On peut aussi constater que le connecteur a présente la prédilection de la traductrice du roman Je m’en vais. Il est intéressant que dans le corpus FraSloK, où les romans inclus datent des 30 dernières années et les traductions de 15, quelques traducteurs respectent ces tendances stylistiques de modernité en se servant des connecteurs qui, d’après le dictionnaire SSKJ sont censés être oraux (ampak, pa), tandis que d’autres cherchent à établir la littérarité avec l’emploi des connecteurs plus soutenus (toda, a).

Nous pouvons conclure que les corpus littéraires, avec leur multitude de registres linguistiques inclus dans différents procédés textuels, représentent une langue plus riche, plus variée que les corpus faits de textes spécialisés, par exemple le corpus journalistique – et que ce fait, même s’il ne présente pas la réalité linguistique, pourrait au moins représenter un idéal vers lequel devraient s'élever les locuteurs natifs et les apprenants étrangers d'une langue.

Bibliographie

Adam, Jean-Michel (1990). Eléments de linguistique textuelle. Bruxelles : Mardaga.

Adam, Jean-Michel (1994). Les textes : types et prototypes. Paris : Nathan.

Anscombre, Jean-Claude, Ducrot, Oswald (1983). Argumentation dans la langue. Bruxelles : Mardaga.

Bajec, Anton et al. : Slovar slovenskega knjižnega jezika. Ljubljana : DZS.

Baker, Mona (1995). « Corpora in translation studies. An overview and some suggestions for future research. » In Target 7 223-243.

Ducrot, Oswald et al. (1980). Les mots du discours. Paris : Minuit.

Gorjanc, Vojko (2005). Uvod v korpusno jezikoslovje. Domžale : Izolit.

Gorjanc, Vojko, Krek Simon (éd.) (2005). Študije o korpusnem jezikoslovju. Ljubljana : Krt.

Grad, Anton (1984). Francosko-slovenski slovar. Ljubljana : DZS.

Habert, Benoît, Nazarenko. Adeline, Salem, André (1997). Les linguistiques de corpus. Paris : Armand Colin.

Kennedy, Graeme (1998). An introduction to Corpus Linguistics. London et New York: Longman.

Mezeg, Adriana (2010). « Compiling and using a French-Slovenian parallel corpus. » In Xiao, Richard (éd.). Proceedings of The International Symposium on Using Corpora in Contrastive and Translation Studies : 2010 conference (UCCTS2010). Ormskirk : Edge Hill University<http://www.lancs.ac.uk/fass/projects/corpus/UCCTS2010Proceedings/papers/Mezeg.pdf>, accès mars-mai 2014.

Mezeg, Adriana (2011). Korpusno podprta analiza francoskih polstavkov in njihovih prevedkov v slovenščini : thèse du doctorat. Ljubljana: Univerza v Ljubljani.

Olohan, Maeve (2004). The use of corpora in translation studies. London-New York Routledge.

Schlamberger Brezar, Mojca (2000). « Les connecteurs en combinaison avec lesmarqueurs modaux : l'exemple du français et du slovène », In Linguistica 40 273-282.

Schlamberger Brezar, Mojca (2002). « Le rôle syntaxique et pragmatiquedes connecteurs dans le discours argumentatif français », In Linguistica 42 89-110.

Schlamberger Brezar, Mojca (2005). « Mais - inverseur d'orientation argumentative. Mais justement? ». In Vilkou-Poustovaia, Irina (éd.), L'exception entre les théories linguistiques et l'expérience, Faits de langues 25, Paris, Gap : Ophrys 146-150.

Schlamberger Brezar, Mojca (2009). Povezovalci v francoščini: od teoretičnih izhodišč do vloge v diskurzu. Ljubljana : Znanstvena založba Filozofske fakultete.

Schlamberger Brezar, Mojca (2010). « La préparation des corpus parallèles et comparables et leur utilité pour le traducteur », In Cahiers du GEPE Traduction et domaines de spécialités (Actes des Journées d’études de Strasbourg « Outils de traduction, outils du traducteur ? », Université Marc-Bloch- Strasbourg 2, 18-19 septembre 2008), <http://www.cahiersdugepe.fr/index.php?id=1654#tocto1n1> (accès septembre 2014)

Schlamberger Brezar, Mojca (2011). « Les marqueurs de l'oral en français et en slovène et la justification de leur utilisation en interprétation.» Pavelin Lešić, Bogdanka (éd.). Francontraste 2. La francophonie comme vecteur du transculturel. Mons : CIPA 255-262.

Schlamberger Brezar, Mojca (2012). « Les marqueurs discursifs « mais » et «alors » en tant qu'indicateurs du degré de l'oralité dans les discours officiels, les débats télévisés et les dialogues littéraires ». Linguistica 52, 225-237.

Schlamberger Brezar, Mojca (2013). « Primerjava slovenskih prevodnih variant povezovalca mais v francosko-slovenskem vzporednem korpusu. » Vintar, Špela (éd.): Slovenski prevodi skozi korpusno prizmo, Ljubljana : Znanstvena založba Filozofske fakultete.

Toporišič, Jože (1976, 2000). Slovenska slovnica. Maribor : Obzorja.

Vincenot, Claude (1975). Essai de grammaire slovène. Ljubljana : Mladinska knjiga.

Vintar, Špela (2013). Slovenski prevodi skozi korpusno prizmo. Ljubljana: Znanstvena založba Filozofske fakultete.

 

Sitographie

Beseda, Nova Beseda: www.bos.zrc-sazu.si/s_beseda.html (accès juillet-septembre 2014)

Fida plus: www.fidaplus.net (accès juillet-septembre 2014)

FraSloK: http://nl.ijs.si/noske (accès juillet-septembre 2014)

GigaFida: http://www.gigafida.net (accès juillet-septembre 2014, juillet 2016) [

SPOOK: http://nl.ijs.si/noske (accès juillet-septembre 2014)

Trésor de la Langue Française informatisé TLFi: http://atilf.atilf.fr (accès juillet-septembre 2014) 

Notes

 

[1] Špela Vintar, le projet J6-2009, Slovensko prevodoslovje – viri in raziskave (la traductologie slovène – ressources et recherche).

[2] Les romans originaux et leurs traductions (entre parenthèses) sont les suivants : Fou de Vincent de Hervé Guibert (Nor na Vincenta, traduction de Brane Mozetič), Un Secret de Philippe Grimbert (Skrivnost, traduction de Jožica Grum), Impératrice de Sa Shan (Cesarica, traduction de Ana Barič), Eldorado de Laurent Gaudé (Eldorado, traduction de Tjaša Mohar), Balzac et la petite tailleuse chinoise de Dai Sijie (Balzac in kitajska šiviljica, traduction de Alenka Moder Saje), Testament français d'Andreï Makine (Francoski testament, traduction de Nadja Dobnik), Amour du prochain de Pascal Bruckner (Ljubezen do bližnjega, traduction de Jaroslav Skrušny), Je m'en vais de Jean Echnoz (Grem, traduction de Suzana Koncut), Mammifères de Pierre Mérot (Sesalci, traduction de Jan Jona Javoršek), Le Ventre de l'Atlantique de Fatou Diome (Trebuh Atlantika, traduction de Ana Barič), Truismesde Marie Darrieusecq (Svinjarije, traduction de Marko Crnkovič), Plateforme de Michel Houellebecq (Platforma, traduction de Mojca Medvedšek.

[3] Le problème des droits d’auteuts n’ayant pas été résolu pour toutes les langues, le corpus n’est destiné qu’aux chercheurs qui ont participé au projet de Špela Vintar.

[4] Ces chiffres sont présentés en dehors du tableau par les limites spatiales.

[5] Ce genre d'interventions est assez fréquent en slovène aussi bien dans les textes littéraires qu'autres.

[6]Gigafida présente 662014 occurrences de ampak, 446531 occurrences de toda, 218994 occurrences de temveč et 22458 occurrences de marveč.

About the author(s)

Mojca Schlamberger Brezar is a full professor of French linguistics and translation at the Department of Translation Studies at the University of Ljubljana. She has a PhD in argumentative connectives in French spoken discours. Her main interests are contrastive grammar and translation between French and Slovene.

Email: [please login or register to view author's email address]

©inTRAlinea & Mojca Schlamberger Brezar (2017).
"Exploration des corpus littéraires à des fins linguistiques et traductionnels Exemple du connecteur 'mais' en français et de ses variantes traductionnelles en slovène"
inTRAlinea Special Issue: Corpora and Literary Translation
Edited by: Titika Dimitroulia and Dionysis Goutsos
This article can be freely reproduced under Creative Commons License.
Stable URL: https://www.intralinea.org/specials/article/2259

Go to top of page