8-12 juil. 2024 Toulouse (France)

Programme > Programme

Les noms des auteurs sont indiqués en passant le curseur sur le titre de la communication ou sous le tableau (accès direct en cliquant sur le titre de la session)

Les présentations des différentes sessions ont une durée de 20 min. suivies de 10 min. de discussion

Chaque intervention et poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Lundi 8 juillet

Mardi 9 juillet

Mercredi 10 juillet

Jeudi 11 juillet

Vendredi 12 juillet

Ateliers_JTR2024
(lieux et horaires)

DEFT 2024

Evalllm

Hackatal

Lawbot, JP'24

9h00 Grand Amphi

Ouverture

9h30 Grand Amphi

Conférencière invitée

Véronique HOSTE

(Ghent University)
Towards a Reappraisal of the Linguistic Perspective in the LLM Era

Pause café (Sous la canopée)

Amphi C Session JEP - 1 : Parole pathologique		Amphi D Session TALN - 1 : Sur l'Interférence et l'Analogie
Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ?	11h00	Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales
Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales,	11h30	Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs
Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français	12h00	Méta-apprentissage pour l'analyse AMR translingue

Amphi C Session JEP - 3 : Parole non native		Amphi D Session TALN - 3 : Applications en pédagogie
Une comparaison de l'intonation ironique en français et en mandarin	9h00	Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital)
Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle	9h30	État de l’art des méthodes de génération automatique de listes de lectures (Recital)
Autisme et compliance phonique	10h00	CQuAE : Un nouveau corpus de question-réponse pour l'enseignement

Pause café (Sous la canopée)

11h00 Sous la canopée

Session poster JEP & TALN - 1

(lien vers les titres des posters de la session)

Les posters seront en place toute la journée

de 10h30 à 17h30

9h00 Grand Amphi

Conférencière invitée

Catia CUCCHIARINI

(Radboud University)
Automatic Speech Recognition technology for innovative research on reading development

Pause café (Sous la canopée)

Amphi C Session JEP - 4 : Multimodalité		Amphi D Session TALN - 4 : Grammaire et Biomédical
Synthèse de gestes communicatifs via STARGATE	10h30	Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire
Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ?	11h00	Reconnaissance d’entités cliniques en few-shot en trois langues
Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien	11h30	Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital)

Amphi C Session JEP - 5 : Annotation et inventaire		Amphi D Session TALN - 5 : De l'extraction à l'enrichessement
Un système d’annotation automatique de la structure prosodique	9h00	Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage
Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925	9h30	Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?
Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes	10h00	astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques

Pause café (Sous la canopée)

Amphi C Session JEP - 6 : Parole en interaction		Amphi D Session TALN - 6 : Préjugé et multimodalité
Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané	11h00	Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs
Disfluences en parole continue en français : paramètres prosodiques des répétitions	11h30	Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir
Étude de la qualité vocale dans la parole professionnelle des aides-soignants français	12h00	Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes

12h30 Grand Amphi

Clôture

12h30 : Repas (RU)

12h00 : Repas (RU)

Ateliers_JTR2024
(lieux et horaires)

Atelier Parole Spontanée

DEFT 2024

Evalllm

Hackatal

Lawbot, JP'24

Amphi C Session JEP - 2 : Oral et interprétabilité		Amphi D Session TALN - 2 : Défis en Traduction Automatique
Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés	14h00	À propos des difficultés de traduire automatiquement de longs documents
Identification du locuteur : ouvrir la boîte noire	14h30	Réduction des répétitions dans la Traduction Automatique Neuronale
Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles	15h00	Vers la traduction automatique des néologismes scientifiques
Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques	15h30	Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé

Pause café (Sous la canopée)

Grand Amphi

Session commune JEP & TALN - 1 : Du bas au haut niveau

16h30	SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation
17h00	Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole
17h30	Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ?
18h00	Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole

14h00 Grand Amphi

Conférencier invité

Laurent BESACIER

(Naver Labs Europe)
Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues

Grand Amphi

Session commune JEP & TALN - 2 : Représentation neuronale

15h00	Small Language Models are Good Too: An Empirical Study of Zero-Shot Classification
15h30	WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models
16h00	Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien
16h30	Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage

Pause café (Sous la canopée)

17h30 Grand Amphi

Prix de thèse AFCP et ATALA

Amphi C		Amphi D
AG AFCP	18h30	AG ATALA

13h30 Sous la canopée

Session poster JEP & TALN - 2

(lien vers les titres des posters de la session)

Les posters seront en place toute la journée

de 10h00 à 18h30

Salon PAREIL des industriels

(lien vers les industriels présents)

15h30 Grand Amphi

Le Voice Lab et Écouter-Parler :

collecte, annotation et valorisation de données vocales

Le laboratoire modbile "écouter-parler" sera présent
sur le campus les 11 et 12 juillet

Pause café (Sous la canopée)

16h30 Grand Amphi

30 ans TALN

Hackatal

18h30 Sous la canopée

Cocktail de bienvenue

19h30 à l'Espace Vanel

Dîner de Gala

CONFÉRENCES INVITÉS

Véronique HOSTE (Ghent University)

Towards a Reappraisal of the Linguistic Perspective in the LLM Era

Currently, Large Language Models (LLMs) have quickly become the norm and have shown impressive results for language applications in different research domains. Various discourse-related tasks usually requiring in-depth knowledge of the world, however, seem to remain largely understudied. Focusing on tasks such as event coreference resolution, emotion detection and irony detection, I would like to discuss how the rich history of Computational Linguistics can help us in identifying knowledge gaps in current methodologies and in attempting to address these. I will touch upon the issue of dataset selection and labeling and a heavy reliance on benchmark datasets, and discuss opportunities to unify both expert knowledge and modern-day learning frameworks and architectures.

Veronique Hoste is Senior Full Professor of Computational Linguistics at the Faculty of Arts and Philosophy at Ghent University. She is department head of the Department of Translation, Interpreting and Communication and director of the LT3 language and translation team at the same department. She is also research director of the Faculty of Arts and Philosophy. Veronique holds a PhD in computational linguistics from the University of Antwerp (Belgium) on "Optimization issues in machine learning of coreference resolution" (2005). She has expertise in machine learning of natural language, and more specifically in computational approaches to the modeling of semantics and discourse, such as event detection, entity and event coreference resolution, irony detection, emotion analysis, etc.

Laurent BESACIER (Naver Labs Europe)

Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues

Dans cet exposé, je partagerai mon expérience concernant trois projets collectifs d’entraînement de modèles de fondation auxquels j’ai participé au cours des cinq dernières années. Deux de ces projets ont fourni des ressources populaires pour le traitement automatique de la langue en français écrit (FlauBERT) et oral (LeBenchmark). Le troisième projet, le plus récent, concerne l’entraînement d’un modèle multilingue pour la parole, mHUBERT-147. Je mettrai en lumière les points communs et les différences entre ces initiatives, en insistant particulièrement sur l’importance du choix, de la préparation des données, ainsi que de l’évaluation des performances.

Laurent Besacier est professeur des universités à l’Université Grenoble Alpes, actuellement en détachement au sein du centre de recherche privé Naver Labs Europe. Il y occupe le poste de « principal scientist » où il dirige le groupe de recherche « interactive systems ». Auparavant, il a dirigé l’équipe TAL chez Naver Labs de 2021 à 2023, et avant cela, il était à la tête de l’équipe GETALP du LIG (Laboratoire d’Informatique de Grenoble) jusqu'en 2020.

Ses principaux domaines d'expertise et intérêts de recherche englobent le traitement automatique du langage naturel, la reconnaissance automatique de la parole, la traduction automatique, les langues peu dotées, la documentation des langues assistée par la machine ainsi que l'évaluation des systèmes de TAL.

Catia CUCCHIARINI (Radboud University)

Automatic Speech Recognition technology for innovative research on reading development

Reading tutors that incorporate Automatic Speech Recognition (ASR) technology have been proposed as valuable educational software that can provide additional practice and support in reading aloud. Most systems developed so far have been used to follow children while they read aloud so that support can be provided to indicate the correct form of the word when difficulties arise. In our own work we have investigated the use of ASR technology to conduct innovative research on reading development at earlier stages of learning to read, when children are still in the process of developing decoding skills. A Reading tutor equipped with logging capabilities was developed to record what happens during reading practice and to investigate the effect of different forms of feedback on reading aloud. This provides a considerable amount of data that can be used to improve the ASR technology and to fine-tune the system, but also to gain more detailed insights into how the process of learning to read unfolds.

Dr. Catia Cucchiarini holds a PhD from Radboud University, where she is now Principal Investigator in the research group Language and Speech, Learning and Therapy. She has conducted research on speech processing, language learning, AI and speech technology development for Computer Assisted Language Learning and e-health, for which she obtained numerous national and international grants.

Dr. Cucchiarini is also Head of Policy at the Dutch-Flemish intergouvernmental organization Union for the Dutch Language in the Hague.

SESSIONS ORALES COMMUNES (JEP-TALN)

Session Commune 1 : Du bas au haut niveau, 9 juillet 16h30-18h30

Chair : Patrick Paroubek

SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation, Barbara Gendron and Gaël Guibon
Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole, Adrien Pupier, Maximin Coavoux, Benjamin Lecouteux and Jérôme Goulian
Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ?, Yaru Wu, Kim Gerdes and Martine Adda-Decker
Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole, Thibault Bañeras Roux, Mickael Rouvier, Jane Wottawa and Richard Dufour

Session Commune 2 : Représentation neuronale, 10 juillet 15h-17h30

Chair : Benoit Favre

Les petits modèles sont bons : une étude empirique de classification dans un contexte zero-shot, Pierre Lepagnol, Thomas Gerald, Sahar Ghannay, Christophe Servan and Sophie Rosset
WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models, Hichem Ammar Khodja, Frédéric Béchet, Quentin Brabant, Alexis Nasr and Gwénolé Lecorvé
Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien, Antoine Caubrière and Elodie Gauthier
Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage, Maxime Fily, Guillaume Wisniewski, Séverine Guillaume, Gilles Adda and Alexis Michaud

SESSIONS ORALES JEP

Session JEP - 1 : "Parole pathologique", 9 juillet 11h-12h30

Chair : Véronique Delvaux

Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ?, Marie Rebourg, Muriel Lalain, Alain Ghio, Corinne Fredouille, Nicolas Fakhry and Virginie Woisard
Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales, Sebastiao Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard and Julien Pinquier
Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français, Cwiosna Roques, Fanny Guitart-Ivent, Christelle Dodane and Fabrice Hirsch

Session JEP - 2 : "Oral et interprétabilité", 9 juillet 14h-16h

Chair : Thomas Pellegrini

Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés, Maxime Jacquelin, Maëva Garnier, Laurent Girin, Rémy Vincent and Olivier Perrotin
Identification du locuteur : ouvrir la boîte noire, Carole Millot, Cédric Gendrot and Jean-François Bonastre
Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles, Vincent P. Martin, Colleen Beaumard and Jean-Luc Rouas
Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques, Lila Kim and Cedric Gendrot

Session JEP - 3 : "Parole non native", 10 juillet 9h-10h30

Chair : Claire Pillot-Loiseau

Une comparaison de l'intonation ironique en français et en mandarin, Ziqi Zhou, Jalal Al-Tamimi and Hiyon Yoo
Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle, Xuejing Chen, Pierre André Hallé and Rachid Ridouane
Autisme et compliance phonique, Eva Goeseels, Kathy Huet, Myriam Piccaluga, Virginie Roland and Véronique Delvaux

Session JEP - 4 : "Multimodalité", 11 juillet 10h30-12h

Chair : Christophe Savariaux

Synthèse de gestes communicatifs via STARGATE, Louis Abel, Vincent Colotte and Slim Ouni
Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ?, Delphine Charuau, Nathalie Henrich Bernardoni, Silvain Gerber and Olivier Perrotin
Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien, Raphael Vancheri, Coriandre Vilain, Nathalie Henrich-Bernardoni and Pierre Baraduc

Session JEP - 5 : "Annotation et inventaire", 12 juillet 9h-10h30

Chair : Marie Tahon

Un système d’annotation automatique de la structure prosodique, Philippe Martin
Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925, Juliusz Cęcelewski, Cédric Gendrot, Martine Adda-Decker and Philippe Boula de Mareüil
Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes, Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier and Virginie Woisard

Session JEP - 6 : "Parole en interaction", 12 juillet 11h-12h30

Chair : Nathalie Vallée

Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané, Suyuan Dong and Nicolas Audibert
Disfluences en parole continue en français : paramètres prosodiques des répétitions, Ivana Didirková, Yaru Wu and Anne Catherine Simon
Étude de la qualité vocale dans la parole professionnelle des aides-soignants français, Jean-Luc Rouas, Yaru Wu and Takaaki Shochi

SESSIONS ORALES TALN/RECITAL

Session TALN - 1 : "Sur l'Interférence et l'Analogie", 9 juillet 11h-12h30

Chair : Benoît Sagot

Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales, Julie Tytgat, Guillaume Wisniewski and Adrien Betrancourt
Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs, Hugo Thomas, Guillaume Gravier and Pascale Sébillot
Méta-apprentissage pour l'analyse AMR translingue, Jeongwoo Kang, Maximin Coavoux, Cédric Lopez and Didier Schwab

Session TALN - 2 : "Défis en Traduction Automatique", 9 juillet 14h-15h30

Chair : Emmanuel Morin

À propos des difficultés de traduire automatiquement de longs documents, Ziqian Peng, Rachel Bawden and François Yvon
Réduction des répétitions dans la Traduction Automatique Neuronale, Marko Avila, Anna Rebollo and Josep Crego
Vers la traduction automatique des néologismes scientifiques, Paul Lerner and François Yvon
Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé, Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader

Session TALN - 3 : "Applications en pédagogie", 10 juillet 9h-10h30

Chair : Lydia-Mai Ho-Dac

Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital), Martina Barletta
État de l’art des méthodes de génération automatique de listes de lectures (Recital), Julien Aubert-Béduchaud
CQuAE : Un nouveau corpus de question-réponse pour l'enseignement, Thomas Gerald, Louis Tamames, Sofiane Ettayeb, Patrick Paroubek and Anne Vilnat

Session TALN - 4 : "Grammaire et Biomédical ", 11 juillet 10h30-12h

Chair : Pierre Zweigenbaum

Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire, Santiago Herrera, Caio Corro and Sylvain Kahane
Reconnaissance d’entités cliniques en few-shot en trois langues, Marco Naguib, Aurélie Névéol and Xavier Tannier
Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital), Felix Herron

Session TALN - 5 : "De l'extraction à l'enrichissement", 12 juillet 9h-10h30

Chair : Farah Benamara

Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage, Aboubacar Tuo, Romaric Besançon, Olivier Ferret and Julien Tourille
Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?, Hee-Soo Choi, Priyansh Trivedi, Mathieu Constant, Karën Fort and Bruno Guillaume
astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques, Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum

Session TALN - 6 : "Préjugé et multimodalité", 12 juillet 11h-12h30

Chair : Chloé Braud

Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs, Fanny Ducel, Aurélie Névéol and Karën Fort
Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir, Léandre Adam-Cuvillier, Pierre-Jean Larpin and Antoine Simoulin
Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes, Cécile Macaire, Chloé Dion, Didier Schwab, Benjamin Lecouteux and Emmanuelle Esperança-Rodier

SESSIONS POSTERS

Session POSTER 1, 10 juillet 11h

Les posters seront en place toute la journée de 10h30 à 17h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Les numéros correspondent aux numéros des stands

Chair : Julie Mauclair

iHist et iScatter, outils en ligne d’exploration interactive de données : application aux valeurs aberrantes de f0 et de formants, Nicolas Audibert
Déplacement vertical du larynx dans la production des plosives en thaï, Paula Alejandra Cano Córdoba, Thi-Thuy-Hien Tran, Nathalie Vallée, Christophe Savariaux, Silvain Gerber, Nicha Yamlamai and Yu Chen
Le /r/ du mandarin est-il une fricative plutôt qu’une liquide ?, Yezhou Jiang, Rachid Ridouane and Pierre André Hallé
Implémentation ouverte et étude de BEST-RQ pour le traitement de la parole, Ryan Whetten, Titouan Parcollet, Marco Dinarelli and Yannick Estève
Evaluation de la dysarthrie parkinsonienne en lecture par la mesure de la déviation phonologique perçue : effets de la sévérité et du traitement dopaminergique, Alain Ghio, Muriel Lalain, Cindy Defais, Alexia Brevet, Manon Jayr, Marie Rebourg, Danielle Duez, Corinne Fredouille, Virginie Woisard and François Viallet
Effet du vieillissement sur l’anticipation d’arrondissement intra-syllabique en français, Louise Wohmann-Bruzzo, Cecile Fougeron and Nicolas Audibert
La sonorité n’est pas l’intensité: le cas des diphtongues dans une langue tonale, Yunzhuo Xiang, Jiayin Gao and Cédric Gendrot
Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE, Verdiana De Fino, Isabelle Ferrané, Julien Pinquier and Lionel Fontan
Analyse Factorielle de signaux sonores : développement d’une méthode automatique de détermination des frontières optimales entre canaux de fréquence, Olivier Crouzet, Agnieszka Duniec and Elisabeth Delais-Roussarie
Rôle de l’activité laryngale dans la production des consonnes d’arrière en arabe levantin, Jalal Al-Tamimi
Le rythme : un marqueur d’atteinte du nerf laryngé supérieur ?, Helene Massis, Marie-Hélène Degombert, Juliette Dindart, Diane Lazard, Christophe Trésallet, Frédérique Frouin and Claire Pillot-Loiseau
Une étude intra et inter-dialectale des voyelles du korebaju, Jenifer Andrea Vega Rodriguez, Nathalie Vallée, Thiago Chacon, Christophe Savariaux and Silvain Gerber
Effets du shadowing et de l'imitation en tant que méthodes d'entraînement à la prononciation du /ɥi/ en français, Wenxun Fu, Martine Adda-Decker and Barbara Kühnert
Détection automatique des schwas en français - Application à la détection des troubles du sommeil, Colleen Beaumard, Vincent P. Martin, Yaru Wu, Jean-Luc Rouas and Pierre Philip
Évaluation perceptive de l'anticipation de la prise de parole lors d'interactions dialogiques en français, Rémi Uro, Albert Rilliard, David Doukhan, Marie Tahon and Antoine Laurent
Une étude exploratoire de la parole sifflée en tant que signal modulé, Liem Landri, Benjamin O'Brien and Anna Marczyk
Auto-correction et oracle dynamique : certains effets n'apparaissent qu'à taille réduite Fang Zhao and Timothée Bernard
Vers une pédagogie inclusive : une classification multimodale des illustrations de manuels scolaires pour des environnements d'apprentissage adaptés Saumya Yadav, Élise Lincker, Caroline Huron, Stéphanie Martin, Camille Guinaudeau, Shin'Ichi Satoh and Jainendra Shukla
Extraction d’entités nommées décrivant des chaînes de traitement bioinformatiques dans des articles scientifiques en anglais Clémence Sebe, Sarah Cohen-Boulakia, Olivier Ferret and Aurélie Névéol
Approche multitâche pour l'amélioration de la fiabilité des systèmes de résumé automatique de conversation Eunice Akani, Benoit Favre, Frederic Bechet and Romain Gemignani
Évaluation de l’apport des chaînes de coréférences pour le liage d’entités Léo Labat and Lauriane Aufrant
Améliorer les modèles de langue pour l'analyse des émotions : perspectives venant des sciences cognitives Gustave Cortal and Constant Bonard
Étude des facteurs de complexité des modèles de langage dans une tâche de compréhension de lecture à l'aide d'une expérience contrôlée sémantiquement Elie Antoine, Frederic Bechet, Géraldine Damnati and Philippe Langlais
Analyse de la perception de l'offre INTERCITÉS de jour : Classification multi-étiquettes des émotions dans les tweets Chang Liu, Luce Lefeuvre, Hélène Flamein and Fanny Hanen
Améliorer la traduction au niveau du document grâce au sur-echantillonnage négatif et au masquage ciblé Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader
Technologies de la parole et données de terrain : le cas du créole haïtien William N. Havard, Renauld Govain, Daphne Gonçalves Teixeira, Benjamin Lecouteux and Emmanuel Schang
Construction d'une mesure de similarité thématique non supervisée pour les conversations Maxime Amblard and Amandine Decker
ParaPLUIE - une mesure automatique d’évaluation de la qualité sémantique des systèmes de paraphrases Quentin Lemesle, Jonathan Chevelu, Damien Lolive, Arnaud Delhay-Lorrain and Philippe Martin
Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital) Martina Barletta
État de l’art des méthodes de génération automatique de listes de lectures (Recital) Julien Aubert-Béduchaud
Évaluation de mesures d’accord sur des structures relationnelles par la dégradation contrôlée d’annotations (Recital) Antoine Boiteau
TAL et analyse de l’activité en ergonomie : extraction d’informations spécialisées dans des transcriptions d’entretiens (Recital) Andréa Blivet
ChiCA: un corpus de conversations face-à-face vs. Zoom entre enfants et parents Dhia Elhak Goumri, Abhishek Agrawal, Mitja Nikolaus, Hong Duc Thang Vu, Kübra Bodur, Elias Semmar, Cassandre Armand, Chiara Mazzocconi, Shreejata Gupta, Laurent Prévot, Benoit Favre, Leonor Becerra-Bonache and Abdellah Fourtassi
Sur les limites de l'identification par l'humain de textes générés automatiquement Nadége Alavoine, Maximin Coavoux, Emmanuelle Esperança-Rodier, Romane Gallienne, Carlos-Emiliano González-Gallardo, Jérôme Goulian, Jose G Moreno, Aurélie Névéol, Didier Schwab, Vincent Segonne and Johanna Simoens
Le corpus BrainKT: Etudier l’instanciation du common ground par l’analyse des indices verbaux, gestuels et neurophysiologiques Eliot Maës, Thierry Legou, Leonor Becerra-Bonache and Philippe Blache
Rééquilibrer la distribution des labels tout en éliminant le temps d'attente inhérent dans l'apprentissage actif multi-label appliqué aux transformers Maxime Arens, Jose G Moreno, Mohand Boughanem and Lucile Callebert
La subjectivité dans le journalisme québécois et belge : transfert de connaissance inter-médias et inter-cultures Louis Escouflaire, Antonin Descampe, Antoine Venant and Cédrick Fairon
Une approche zero-shot pour localiser les transferts d’informations en conversation naturelle Eliot Maës, Hossam Boudraa, Philippe Blache and Leonor Becerra-Bonache
Caractérisation de la ville du futur dans un corpus de science-fiction Sami Guembour, Chuanming Dong and Catherine Dominguès
Évaluer les modèles de langue pré-entraînés avec des propriétés de hiérarchie Jesus Lovon-Melgarejo, Jose G Moreno, Romaric Besançon, Olivier Ferret and Lynda Tamine
LOCOST: Modèles Espace-État pour le Résumé Abstractif de Documents Longs Florian Le Bronnec, Song Duong, Alexandre Allauzen, Vincent Guigue, Alberto Lumbreras, Laure Soulier and Patrick Gallinari

Session POSTER 2, 11 juillet 13h30

Les posters seront en place toute la journée de 10h00 à 18h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Les numéros correspondent aux numéros des stands

Chair : Jose G Moreno

Traitement incrémental de la prosodie en L2, Giuseppina Turco, Hiyon Yoo and Chie Nakamura
Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d'enfant, Lucas Block Medin, Lucile Gelin and Thomas Pellegrini
Perception des frontières prosodiques du français par des natifs : Études comportementale et électroencéphalographique, Lei Xi, Rachid Ridouane and Frédéric Isel
Frontières entre la perception de la voix normophonique et pathologique chez des auditeurs naïfs, Amelia Pettirossi, Nicolas Audibert and Lise Crevier-Buchman
Sandhi tonal en shanghaïen : une étude acoustique des contours dissyllabiques chez des locuteurs jeunes, Yu Chen, Nathalie Vallée, Thi-Thuy-Hien Tran and Silvain Gerber
L’impact du style de parole sur l’opposition de longueur des voyelles en arabe jordanien, Mohammad Abuoudeh, Jalal Al-Tamimi and Olivier Crouzet
Une nouvelle grammaire de l’intonation de la phrase française, Philippe Martin
Audiocite.net un grand corpus d'enregistrements vocaux de lecture en français, Soline Felice, Solène Evain, Solange Rossato and François Portet
Identification automatique de la voix après resynthèse à l’aide de PPG, Thibault Gaudier, Marie Tahon, Anthony Larcher and Yannick Estève
Allongement vocalique en italien L2 et en français L2 : une marque de focalisation ?, Bianca Maria De Paolis
Creating a Speaking Styles Parallel Corpus in Mandarin through Auto-transcription, Jingyi Sun, Martine Adda-Decker, Yaru Wu and Nicolas Audibert
La reconnaissance automatique de phonèmes est-elle réellement adaptée pour l’analyse de la parole spontanée ?, Vincent P. Martin, Colleen Beaumard, Charles Brazier, Jean-Luc Rouas and Yaru Wu
Comparaison de mesures pour la détection automatique de déviance dans la dysarthrie ataxique, Natacha Miniconi, Cédric Gendrot, Angélina Bourbon, Leonardo Lancia and Cécile Fougeron
Enseignement de l'intonation du français par une synthèse vocale contrôlée par le geste : étude longitudinale de faisabilité, Xiao Xiao, Corinne Bonnet, Haohan Zhang, Nicolas Audibert, Barbara Kühnert and Claire Pillot-Loiseau
Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers, Malo Maisonneuve, Corinne Fredouille, Muriel Lalain, Alain Ghio and Virginie Woisard
Entraînement de la coordination respiration-parole en apprentissage de la lecture assistée par ordinateur, Delphine Charuau, Andrea Briglia, Erika Godde and Gérard Bailly
Voix enfantines, genre et classe sociale : une étude de la fréquence fondamentale, Erwan Pépiot
Étude IRM de la production des /l/ de l’anglais par des locuteurs francophones, Alice Léger, Coline Caillol, Emmanuel Ferragne, Hannah King, Sylvain Charron, Clément Debacker, Maliesse Lui and Catherine Oppenheim
Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique, Romain Contrain, Julien Pinquier, Lionel Fontan and Isabelle Ferrané
Synthèse de syllabes avec un modèle de Maeda piloté par une représentation complexe, Frédéric Berthommier
Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA, Nadège Alavoine, Gaëlle Laperrière, Christophe Servan, Sahar Ghannay and Sophie Rosset
Preuve de concept d'un système de génération automatique en Langue française Parlée Complétée, Brigitte Bigi and Nuria Gala
Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024, Adrien Lafore, Clément Pagès, Leila Moudjari, Sebastiao Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau and Jérôme Farinas
Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction Maxime Bouthors, Josep Crego and François Yvon
Adaptation des modèles de langue à des domaines de spécialité par un masquage sélectif fondé sur le genre et les caractéristiques thématiques Anas Belfathi, Ygor Gallina, Nicolas Hernandez, Laura Monceaux and Richard Dufour
Utiliser l'explicabilité des modèles pour mettre en évidence les expressions genrées dans la parole François Buet, Camille Guinaudeau, Cyril Grouin, Sahar Ghannay and Shin'Ichi Satoh
Repérage et caractérisation automatique des émotions dans des textes : traiter aussi leurs modes d'expression indirects Aline Etienne, Delphine Battistelli and Gwénolé Lecorvé
Optimisation des performances d’un système de reconnaissance automatique de la parole pour les commentaires sportifs: fine-tuning de Whisper Camille Lavigne, Alex Stasica and Anna Kupsc
TCFLE-8 : un corpus de productions écrites d'apprenants de français langue étrangère et son application à la correction automatisée de textes Rodrigo Wilkens, Alice Pintard, David Alfter, Vincent Folny and Thomas François
Prédiction de la complexité lexicale : Une étude comparative entre ChatGPT et un modèle dédié à cette tâche. Abdelhak Kelious, Mathieu Constant and Christophe Coeur
De nouvelles méthodes pour l'exploration de l'interface syntaxe-prosodie : un treebank intonosyntaxique et un système de synthèse pour le pidgin nigérian Emmett Strickland, Anne Lacheret-Dujour, Marc Evrard, Sylvain Kahane, Dana Aubakirova, Dorin Doncenco, Diego Torres, Perrine Quennehen and Bruno Guillaume
Génération contrôlée de cas cliniques en français à partir de données médicales structurées Hugo Boulanger, Nicolas Hiebel, Olivier Ferret, Karën Fort and Aurélie Névéol
Extension d’AZee avec des règles de production concernant les gestes non-manuels pour la langue des signes française Camille Challant and Michael Filhol
The impact of genre on the prediction of text readability in FFL (French as a Foreign Language) Lingyun Gao, Rodrigo Souza Wilkens and Thomas François
astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum
CLAIRE: Large Language Models for Spontaneous French Dialogue Jérôme Louradour, Julie Hunter, Ismaïl Harrando, Guokan Shang, Virgile Rennard and Jean-Pierre Lorré
SUMM-RE: A corpus of French meeting-style conversations Julie Hunter, Hiroyoshi Yamasaki, Océane Granier, Jérôme Louradour, Roxane Bertrand, Kate Thompson and Laurent Prévot
La reconnaissance automatique des relations de cohérence RST en français. Martial Pastor, Nelleke Oostdijk and Erik Bran Marino
Modéliser la facilité d’écoute en FLE : vaut-il mieux lire la transcription ou écouter le signal vocal ? Minami Ozawa, Rodrigo Souza Wilkens, Kaori Sugiyama and Thomas François
Quel workflow pour les sciences du texte ? Antoine Widlöcher
LLM-Generated Contexts to Practice Specialised Vocabulary: Corpus Presentation and Comparison Iglika Nikolova-Stoupak, Serge Bibauw, Amandine Dumont, Françoise Stas, Patrick Watrin and Thomas François
Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital) Felix Herron
Géométrie des vecteurs de tâches pour l'association et la combinaison de modèles (Recital) Loic Fosse
Analyse sémantique du corpus des Cahiers citoyens (Recital) Sami Guembour
Exploration d’approches hybrides pour la lisibilité : expériences sur la complémentarité entre les traits linguistiques et les transformers Rodrigo Wilkens, Patrick Watrin, Rémi Cardon, Alice Pintard, Isabelle Gribomont and Thomas François
Jargon : Une suite de modèles de langues et de référentiels d'évaluation pour les domaines spécialisés du français Vincent Segonne, Aidan Mannion, Audibert Alexandre, Liu Xingyu, Cécile Macaire, Pupier Adrien, Yongxin Zhou, Mathilde Aguiar, Norré Magali, Felix Herron, Eshkol Taravella Iris, Thomas François, Goeuriot Lorraine, Jérôme Goulian, Mathieu Lafourcade, Benjamin Lecouteux, François Portet, Fabien Ringeval, Maximin Coavoux, Vincent Vandeghinste, Marco Dinarelli, Laura Alonzo-Canul, Amini Massih-Reza, Pierrette Bouillon, Didier Schwab and Esparança-Rodier Emmanuelle
Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes Cécile Macaire, Chloé Dion, Jordan Arrigo, Claire Lemaire, Emmanuelle Esperança-Rodier, Benjamin Lecouteux and Didier Schwab
Apport de la structure de tours à l'identification automatique de genre textuel: un corpus annoté de sites web de tourisme en français Remi Cardon, Trang Tran Hanh Pham, Julien Zakhia Doueihi and Thomas François

SALON PAREIL DES INDUSTRIELS

Liste des industriels présents (par ordre alphabétique) :

	Spécialisée dans le traitement des contenus médias (presse écrite, web, et TV/radios), Aday est une société technologique française. L'entreprise héberge toutes ses données médias sur sa propre infrastructure. Nous proposons un historique de données couvrant plus de 40 ans et acquérons quotidiennement 500 000 documents (articles textuels, images...) et 2 500 heures de programmes audiovisuels.
	ARCHEAN Technologies
	LINAGORA
	PostLab est spécialisée dans le développement, le déploiement et la maintenance de démonstrateurs et d’applications web, fondées sur des ressources logicielles ou des méthodes issues de la recherche académique. Notre mission est de lever les freins à l’accès, au partage et à la réutilisation de ressources logicielles de la recherche scientifique. Nous accompagnons les chercheuses et les chercheurs dans la diffusion et la mise en valeur de leurs ressources logicielles ou méthodes scientiﬁques. SOLUTIONS Démonstrateur Transformez vos travaux en démonstrateurs web graphique, accessibles à tous les niveaux d’expertise, et révélez le potentiel de vos recherches. Cartographie de logiciels académiques Recensez vos logiciels de manière collaborative et participative, et mettez en lumière votre expertise scientifique.
	LVL est une association soutenue par l'État qui propose : des IA vocales validées dans le respect du droit européen ; des données vocales pour permettre aux développeurs et chercheurs de l’écosystème français d’être concurrentiel au niveau mondial ; une expertise de plus de 30 acteurs institutionnels et entreprises technologiques. Plus d'informations aux liens suivants : https://www.levoicelab.org/ https://www.youtube.com/@LeVoiceLab https://www.linkedin.com/company/le-voice-lab/

Vie privée | Accessibilité