Stadt: Paris

Frist: 2023-06-15

Beginn: 2023-11-30

Ende: 2023-12-01

Identifier les régularités stylistiques dans le discours littéraire

Journées d’étude co-organisée par Dominique Legallois (Lattice, Université Sorbonne Nouvelle), Dominique Longrée (Université de Liège, Lasla), Iva Novakova (Lidilem, Université Grenoble Alpes), Antoine Silvestre de Sacy (Thalim & Lattice, Université Sorbonne Nouvelle)

Jeudi 30 novembre et vendredi 1er décembre, Maison de la Recherche, 5 Rue des Irlandais, Paris

La journée que nous organisons invite les chercheurs à présenter des travaux portant sur l’analyse des caractéristiques stylistiques des textes littéraires, quelle que soit la période et la langue, dans la perspective du traitement automatique des textes, de la textométrie, de la stylométrie ou de l’analyse littéraire et stylistique. Il s’agira de discuter des méthodes et des unités qui paraissent pertinentes dans le cadre d’une analyse outillée pour mettre en évidence des régularités relevant du style (d’un auteur, d’une école, d’une époque, d’un genre, etc.) ou encore de la sémantique des textes (par ex. Siepmann, 2015). La caractérisation stylistique peut avoir de multiples finalités : interprétation des textes et support de l’analyse stylistique qualitative, attribution d’auteurs à des textes dont la paternité est contestée (Camps et Cafiero, 2019) ou qui ont été écrits à plusieurs mains (Rybicki et al., 2013), caractérisation des genres, des mouvements littéraires, classification des textes, outil de prédiction pour les algorithmes de machine et deep learning, l’étude de l’intertextualité.
Dans cette perspective, l’analyse outillée doit permettre d’interroger les textes à travers de nouveaux paradigmes et questionnements ; davantage qu’un outil de confirmation ou d’infirmation des hypothèses, les méthodes computationnelles doivent être envisagées comme moyen d’ouvrir de nouvelles problématiques et épistémologies de recherche.
Un exemple d’un champ de recherche et d’interrogation ouvert par ces méthodes est celui qui a été proposé ces dernières années autour de la notion de « motif » (notamment Ganascia (2001), Mellet et Longrée (2012,), Quiniou et al. (2012), Kraif (2016) et récemment, dans le cadre de l’apprentissage profond Vanni et al. (2020). Le motif a donné lieu à des définitions différentes (Legallois et Koch 2018) qui semblent cependant converger sur le fait qu’un motif est une unité supra-lexicale (par exemple, un patron lexico-grammatical, des unités collocatives, des segments non-séquentiels…) caractéristique d’un genre ou d’un style et pouvant être analysée et interprétée. Il a été également montré (Novakova & Siepmann, 2020) que la notion de motif assure le lien entre micro-niveau (les récurrences phraséologiques spécifiques) et macro-niveau (celui du script narratif et fictionnel).
Sans nécessairement s’inscrire directement dans une perspective articulée autour du « motif » tel qu’envisagé par les études susmentionnées, les propositions de communication développeront des analyses dans lesquelles seront mises en évidence par leur régularité des unités (au-delà du lexème) possédant un pouvoir descriptif pertinent, ou bien une valeur caractéristique démontrée permettant d’ouvrir à une interprétation des résultats computationnels. Les méthodes et outils automatiques de détection devront être présentées et les unités dégagées feront l’objet d’une discussion concernant leur statut, leur valeur et leurs divers cadres d’utilisation.

Procédure de soumission :
Pour soumettre une proposition, envoyer un document en anglais ou en français de deux pages (c’est-à-dire entre 600 et 1 000 mots) avant le 15 juin aux adresses électroniques suivantes :
Dominique Legallois (dominique.legallois@sorbonne-nouvelle.fr),
Dominique Longrée (dominique.longree@uliege.be),
Iva Novakova (iva.novakova@univ-grenoble-alpes.fr),
Antoine Silvestre de Sacy (Thalim & Lattice) (antoine.desacy@huma-num.fr).

Les notifications concernant les décisions relatives aux propositions seront envoyées en septembre. L’événement aura lieu le jeudi 30 novembre et le vendredi 1er décembre à la Maison de la Recherche, Paris, France.

Comité Scientifique :

  • Jean-Baptiste Camps (École nationale des chartes)
  • Thierry Charnois (LIPN, LABEX EFL, Université Sorbonne Paris Nord)
  • Sascha Diwersy (Praxiling, Université de Montpellier)
  • Francesca Frontini (Istituto di Linguistica Computazionale “A. Zampolli”, CNR Pisa)
  • Ioana Galleron (Lattice, Université Sorbonne Nouvelle)
  • Laetitia Gonon (CÉRÉdI, Université de Rouen)
  • Suzanne Mpouli (Centre des Humanités Numériques, Université de Paris Cité)
  • Thierry Poibeau (Lattice, CNRS)
  • Dirk Siepmann (Université d’Osnabrück)
  • Laurent Vanni (Université Côte d’Azur, BCL)

Bibliographie :
Camps, J.-B., Cafiero, F., « Why Molière most likely did write his plays », Science Advances, Vol. 5, no. 11, Nov. 2019.
Ganascia, Jean-Gabriel. 2001. “Extraction automatique de motifs syntaxiques” In Actes de la 8ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN’2001). Tours (France) Accessed January 28, 2019. http://talnarchives.atala.org/TALN/TALN-2001/taln2001-long-017.pdf
Frontini, F., M. A.Boukhaled, and J.G. Ganascia. 2018. “Approaching French Theatrical Characters by Syntactical Analysis: a Study with Motifs and Correspondence Analysis.” In Grammar of Genres and Styles. From Discrete to Non-Discrete Units, edited by D. Legallois, Th. Charnois, and M. Larjavaara, 118–139. Berlin/Boston: de Gruyter
Kraif, O. 2016. “Le lexicoscope: un outil d’extraction des séquences phraséologiques basé sur des corpus arborés.” Cahiers de Lexicologie 108: 91–106
Kraif O., Tutin A. 2017. Des motifs séquentiels aux motifs hiérarchiques : l’apport des arbres lexico-syntaxiques récurrents pour le repérage des routines discursives. Corpus, 2017, 17.
Legallois D., Th. Charnois, et M. Larjavaara. 2018. “The balance between quantitative and qualitative literary stylistics: how the method of “motifs” can help”. In The Grammar of Genres and Styles: from Discrete to Non-Discrete Units, edited by D. Legallois, Th. Charnois, and M. Larjavaara, 164–193. Berlin/Boston: de Gruyter.
Legallois, D., and Koch, S. 2020. The notion of motif where disciplines intersect: folkloristics, narrativity, bioinformatics, automatic text processing and linguistics. In I. Novakova & D. Siepmann (Eds.), Phraseology and Style in Subgenres of the Novel: A Synthesis of Corpus and Literary Perspectives (pp. 17-46). Cham: Palgrave Macmillan .
Longrée, D., et S. Mellet. 2018. “Towards a topological grammar of genres and styles: a way to combine paradigmatic quantitative analysis with a syntagmatic approach”. In The Grammar of Genres and Styles: From Discrete to Non-Discrete Units, edited by D. Legallois, Th. Charnois, and M. Larjavaara, 140–163. Berlin/Boston: de Gruyter.
Mahlberg, M. 2013. Corpus Stylistics and Dickens’s Fiction. London / New York: Routledge.
Mellet S., Barthélemy J.- P. 2009. « Topologie textuelle : légitimation d’une notion émergente », Lexicometrica 7.
Mellet, S., & Longrée, D. 2012. Légitimité d’une unité textométrique : le motif. In A. Dister, G. Purnelle, & D. Longrée, Actes des JADT 2012 :11e journées internationales d’analyse statistique des données textuelles (pp. 715-728). http://hdl.handle.net/2268/122518
Quiniou, S., P. Cellier, Th. Charnois, et D. Legallois. 2012. “What about Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics?” In Computational Linguistics and Intelligent Text Processing. Proceedings, Part I, edited by Alexander Gelbukh, 166–177. Berlin/Heidelberg: Springer.
Novakova, I., & Siepmann, D. (Eds.). 2020. Phraseology and Style in Subgenres of the Novel: A Synthesis of Corpus and Literary Perspectives. Cham: Palgrave Macmillan.
Rybicki, J.; Hoover, D.L. & Kestemont, M.,2013. ‘Collaborative Authorship: Conrad, Ford and Rolling Delta’, Digital Humanities 2013 (Lincoln, Nebraska, USA), pp. 368-371.
Siepmann, D. 2015. A corpus-based investigation into key words and key patterns in post-war fiction. Functions of Language, 22(3), 362-399
Vanni L., M. Corneli, D.Longrée, D.Mayaffre, F.Precioso. 2020. Hyperdeep : deep learning descriptif pour l’analyse de données textuelles. JADT 2020 – 15èmes Journées Internationales d’Analyse statistique des Données Textuelles, Jun 2020, Toulouse, France.

Beitrag von: Ludwig Fesenmeier

Redaktion: Ursula Winter