8-12 juil. 2024 Toulouse (France)

Programme > Programme

Les noms des auteurs sont indiqués en passant le curseur sur le titre de la communication ou sous le tableau (accès direct en cliquant sur le titre de la session)

Les présentations des différentes sessions ont une durée de 20 min. suivies de 10 min. de discussion

Chaque intervention et poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Lundi 8 juillet

Mardi 9 juillet

Mercredi 10 juillet

Jeudi 11 juillet

Vendredi 12 juillet

Ateliers_JTR2024
(lieux et horaires)

DEFT 2024

Evalllm

Hackatal

Lawbot, JP'24

 

9h00 Grand Amphi

Ouverture


9h30 Grand Amphi

Conférencière invitée

Véronique HOSTE

(Ghent University)
Towards a Reappraisal of the Linguistic Perspective in the LLM Era


Pause café (Sous la canopée)


Amphi C

Session JEP - 1 : Parole pathologique

 

Amphi D

Session TALN - 1 : Sur l'Interférence et l'Analogie


Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ?
11h00
Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales

Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales, 
11h30
Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs

Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français
12h00
Méta-apprentissage pour l'analyse AMR translingue

Amphi C

Session JEP - 3 : Parole non native

 

Amphi D

Session TALN - 3 : Applications en pédagogie


Une comparaison de l'intonation ironique en français et en mandarin
9h00
Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital)

Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle
9h30
État de l’art des méthodes de génération automatique de listes de lectures (Recital)

Autisme et compliance phonique
10h00
CQuAE : Un nouveau corpus de question-réponse pour l'enseignement

Pause café (Sous la canopée)


11h00 Sous la canopée

Session poster JEP & TALN - 1

(lien vers les titres des posters de la session)

Les posters seront en place toute la journée

de 10h30 à 17h30

9h00 Grand Amphi

Conférencière invitée

Catia CUCCHIARINI

(Radboud University)
Automatic Speech Recognition technology for innovative research on reading development


Pause café (Sous la canopée)


Amphi C

Session JEP - 4 : Multimodalité

 

Amphi D

Session TALN - 4 : Grammaire et Biomédical


Synthèse de gestes communicatifs via STARGATE
10h30
Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire

Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ?
11h00
Reconnaissance d’entités cliniques en few-shot en trois langues

Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien
11h30
Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital)

Amphi C

Session JEP - 5 : Annotation et inventaire

 

Amphi D

Session TALN - 5 : De l'extraction à l'enrichessement


Un système d’annotation automatique de la structure prosodique
9h00
Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage

Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925
9h30
Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?

Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes
10h00
astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques

Pause café (Sous la canopée)


Amphi C

Session JEP - 6 : Parole en interaction

 

Amphi D

Session TALN - 6 : Préjugé et multimodalité


Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané
11h00
Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs

Disfluences en parole continue en français : paramètres prosodiques des répétitions
11h30
Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir

Étude de la qualité vocale dans la parole professionnelle des aides-soignants français
12h00
Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes

12h30 Grand Amphi

Clôture

  12h30 : Repas (RU) 12h30 : Repas  (RU) 12h00 : Repas (RU) --

Ateliers_JTR2024
(lieux et horaires)

Atelier Parole Spontanée

DEFT 2024

Evalllm

Hackatal

Lawbot, JP'24

Amphi C

Session JEP - 2 : Oral et interprétabilité

 

Amphi D

Session TALN - 2 : Défis en Traduction Automatique


Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés
14h00
À propos des difficultés de traduire automatiquement de longs documents

Identification du locuteur : ouvrir la boîte noire
14h30
Réduction des répétitions dans la Traduction Automatique Neuronale

Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles
15h00
Vers la traduction automatique des néologismes scientifiques

Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques
15h30
Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé

Pause café (Sous la canopée)


Grand Amphi

Session commune JEP & TALN - 1 : Du bas au haut niveau

16h30
SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation
17h00
Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole
17h30
Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ?
18h00
Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole

14h00 Grand Amphi

Conférencier invité

Laurent BESACIER

(Naver Labs Europe)
Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues


Grand Amphi

  Session commune JEP & TALN - 2 : Représentation neuronale

15h00
Small Language Models are Good Too: An Empirical Study of Zero-Shot Classification
15h30
WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models
16h00
Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien
16h30
Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage

Pause café (Sous la canopée)


17h30 Grand Amphi

Prix de thèse AFCP et ATALA


Amphi C

 

Amphi D


AG AFCP
18h30
AG ATALA

13h30 Sous la canopée

Session poster JEP & TALN - 2

(lien vers les titres des posters de la session)

 Les posters seront en place toute la journée

de 10h00 à 18h30

Salon PAREIL des industriels

(lien vers les industriels présents)


15h30 Grand Amphi

Le Voice Lab et Écouter-Parler :

collecte, annotation et valorisation de données vocales 

Le laboratoire modbile "écouter-parler" sera présent
sur le campus les 11 et 12 juillet


Pause café (Sous la canopée)

16h30 Grand Amphi

30 ans TALN

 --

 Hackatal


18h30 Sous la canopée

Cocktail de bienvenue

 

19h30 à l'Espace Vanel

Dîner de Gala

 --

 

CONFÉRENCES INVITÉS

Véronique HOSTE (Ghent University)

Towards a Reappraisal of the Linguistic Perspective in the LLM Era

Currently, Large Language Models (LLMs) have quickly become the norm and have shown impressive results for language applications in different research domains. Various discourse-related tasks usually requiring in-depth knowledge of the world, however, seem to remain largely understudied. Focusing on tasks such as event coreference resolution, emotion detection and irony detection, I would like to discuss how the rich history of Computational Linguistics can help us in identifying knowledge gaps in current methodologies and in attempting to address these. I will touch upon the issue of dataset selection and labeling and a heavy reliance on benchmark datasets, and discuss opportunities to unify both expert knowledge and modern-day learning frameworks and architectures. 

Veronique Hoste is Senior Full Professor of Computational Linguistics at the Faculty of Arts and Philosophy at Ghent University. She is department head of the Department of Translation, Interpreting and Communication and director of the LT3 language and translation team at the same department. She is also research director of the Faculty of Arts and Philosophy. Veronique holds a PhD in computational linguistics from the University of Antwerp (Belgium) on "Optimization issues in machine learning of coreference resolution" (2005). She has expertise in machine learning of natural language, and more specifically in computational approaches to the modeling of semantics and discourse, such as event detection, entity and event coreference resolution, irony detection, emotion analysis, etc.

Laurent BESACIER (Naver Labs Europe)

Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues

Dans cet exposé, je partagerai mon expérience concernant trois projets collectifs d’entraînement de modèles de fondation auxquels j’ai participé au cours des cinq dernières années. Deux de ces projets ont fourni des ressources populaires pour le traitement automatique de la langue en français écrit (FlauBERT) et oral (LeBenchmark). Le troisième projet, le plus récent, concerne l’entraînement d’un modèle multilingue pour la parole, mHUBERT-147. Je mettrai en lumière les points communs et les différences entre ces initiatives, en insistant particulièrement sur l’importance du choix, de la préparation des données, ainsi que de l’évaluation des performances.

Laurent Besacier est professeur des universités à l’Université Grenoble Alpes, actuellement en détachement au sein du centre de recherche privé Naver Labs Europe. Il y occupe le poste de « principal scientist » où il dirige le groupe de recherche « interactive systems ». Auparavant, il a dirigé l’équipe TAL chez Naver Labs de 2021 à 2023, et avant cela, il était à la tête de l’équipe GETALP du LIG (Laboratoire d’Informatique de Grenoble) jusqu'en 2020.

Ses principaux domaines d'expertise et intérêts de recherche englobent le traitement automatique du langage naturel, la reconnaissance automatique de la parole, la traduction automatique, les langues peu dotées, la documentation des langues assistée par la machine ainsi que l'évaluation des systèmes de TAL.

Catia CUCCHIARINI (Radboud University)

Automatic Speech Recognition technology for innovative research on reading development

Reading tutors that incorporate Automatic Speech Recognition (ASR) technology have been proposed as valuable educational software that can provide additional practice and support in reading aloud. Most systems developed so far have been used to follow children while they read aloud so that support can be provided to indicate the correct form of the word when difficulties arise. In our own work we have investigated the use of ASR technology to conduct innovative research on reading development at earlier stages of learning to read, when children are still in the process of developing decoding skills. A Reading tutor equipped with logging capabilities was developed to record what happens during reading practice and to investigate the effect of different forms of feedback on reading aloud. This provides a considerable amount of data that can be used to improve the ASR technology and to fine-tune the system, but also to gain more detailed insights into how the process of learning to read unfolds.

Dr. Catia Cucchiarini holds a PhD from Radboud University, where she is now Principal Investigator in the research group Language and Speech, Learning and Therapy. She has conducted research on speech processing, language learning, AI and speech technology development for Computer Assisted Language Learning and e-health, for which she obtained numerous national and international grants.

Dr. Cucchiarini is also Head of Policy at the Dutch-Flemish intergouvernmental organization Union for the Dutch Language in the Hague.

SESSIONS ORALES COMMUNES (JEP-TALN)

Session Commune 1 : Du bas au haut niveau, 9 juillet 16h30-18h30

Chair : Patrick Paroubek

  • SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation, Barbara Gendron and Gaël Guibon pdflogo.png
  • Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole, Adrien Pupier, Maximin Coavoux, Benjamin Lecouteux and Jérôme Goulian pdflogo.png
  • Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ?, Yaru Wu, Kim Gerdes and Martine Adda-Decker pdflogo.png
  • Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole, Thibault Bañeras Roux, Mickael Rouvier, Jane Wottawa and Richard Dufour pdflogo.png

Session Commune 2 : Représentation neuronale, 10 juillet 15h-17h30

Chair : Benoit Favre

  • Les petits modèles sont bons : une étude empirique de classification dans un contexte zero-shot, Pierre Lepagnol, Thomas Gerald, Sahar Ghannay, Christophe Servan and Sophie Rosset pdflogo.png
  • WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models, Hichem Ammar Khodja, Frédéric Béchet, Quentin Brabant, Alexis Nasr and Gwénolé Lecorvé pdflogo.png
  • Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien, Antoine Caubrière and Elodie Gauthier pdflogo.png
  • Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage, Maxime Fily, Guillaume Wisniewski, Séverine Guillaume, Gilles Adda and Alexis Michaud pdflogo.png

SESSIONS ORALES JEP

Session JEP - 1 : "Parole pathologique", 9 juillet 11h-12h30

Chair : Véronique Delvaux

  • Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ?, Marie Rebourg, Muriel Lalain, Alain Ghio, Corinne Fredouille, Nicolas Fakhry and Virginie Woisard pdflogo.png
  • Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales, Sebastiao Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard and Julien Pinquier pdflogo.png
  • Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français, Cwiosna Roques, Fanny Guitart-Ivent, Christelle Dodane and Fabrice Hirsch pdflogo.png

Session JEP - 2 : "Oral et interprétabilité", 9 juillet 14h-16h

Chair : Thomas Pellegrini

  • Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés, Maxime Jacquelin, Maëva Garnier, Laurent Girin, Rémy Vincent and Olivier Perrotin pdflogo.png
  • Identification du locuteur : ouvrir la boîte noire, Carole Millot, Cédric Gendrot and Jean-François Bonastre pdflogo.png
  • Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles, Vincent P. Martin, Colleen Beaumard and Jean-Luc Rouas pdflogo.png
  • Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques, Lila Kim and Cedric Gendrot pdflogo.png

Session JEP - 3 : "Parole non native", 10 juillet 9h-10h30

Chair : Claire Pillot-Loiseau

  • Une comparaison de l'intonation ironique en français et en mandarin, Ziqi Zhou, Jalal Al-Tamimi and Hiyon Yoo pdflogo.png
  • Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle, Xuejing Chen, Pierre André Hallé and Rachid Ridouane pdflogo.png
  • Autisme et compliance phonique, Eva Goeseels, Kathy Huet, Myriam Piccaluga, Virginie Roland and Véronique Delvaux pdflogo.png

Session JEP - 4 : "Multimodalité", 11 juillet 10h30-12h

Chair : Christophe Savariaux

  • Synthèse de gestes communicatifs via STARGATE, Louis Abel, Vincent Colotte and Slim Ouni pdflogo.png
  • Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ?, Delphine Charuau, Nathalie Henrich Bernardoni, Silvain Gerber and Olivier Perrotin pdflogo.png
  • Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien, Raphael Vancheri, Coriandre Vilain, Nathalie Henrich-Bernardoni and Pierre Baraduc pdflogo.png

Session JEP - 5 : "Annotation et inventaire", 12 juillet 9h-10h30

Chair : Marie Tahon

  • Un système d’annotation automatique de la structure prosodique, Philippe Martin pdflogo.png
  • Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925, Juliusz Cęcelewski, Cédric Gendrot, Martine Adda-Decker and Philippe Boula de Mareüil pdflogo.png
  • Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes, Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier and Virginie Woisard pdflogo.png

Session JEP - 6 : "Parole en interaction", 12 juillet 11h-12h30

Chair : Nathalie Vallée

  • Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané, Suyuan Dong and Nicolas Audibert pdflogo.png
  • Disfluences en parole continue en français : paramètres prosodiques des répétitions, Ivana Didirková, Yaru Wu and Anne Catherine Simon pdflogo.png
  • Étude de la qualité vocale dans la parole professionnelle des aides-soignants français, Jean-Luc Rouas, Yaru Wu and Takaaki Shochi pdflogo.png

SESSIONS ORALES TALN/RECITAL

Session TALN - 1 : "Sur l'Interférence et l'Analogie", 9 juillet 11h-12h30

Chair : Benoît Sagot

  • Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales, Julie Tytgat, Guillaume Wisniewski and Adrien Betrancourt pdflogo.png
  • Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs, Hugo Thomas, Guillaume Gravier and Pascale Sébillot pdflogo.png
  • Méta-apprentissage pour l'analyse AMR translingue, Jeongwoo Kang, Maximin Coavoux, Cédric Lopez and Didier Schwab pdflogo.png

Session TALN - 2 : "Défis en Traduction Automatique", 9 juillet 14h-15h30

Chair : Emmanuel Morin

  • À propos des difficultés de traduire automatiquement de longs documents, Ziqian Peng, Rachel Bawden and François Yvon pdflogo.png
  • Réduction des répétitions dans la Traduction Automatique Neuronale, Marko Avila, Anna Rebollo and Josep Crego pdflogo.png
  • Vers la traduction automatique des néologismes scientifiques, Paul Lerner and François Yvon pdflogo.png
  • Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé, Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader pdflogo.png

Session TALN - 3 : "Applications en pédagogie", 10 juillet 9h-10h30

Chair : Lydia-Mai Ho-Dac

  • Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital), Martina Barletta pdflogo.png
  • État de l’art des méthodes de génération automatique de listes de lectures (Recital), Julien Aubert-Béduchaud pdflogo.png
  • CQuAE : Un nouveau corpus de question-réponse pour l'enseignement, Thomas Gerald, Louis Tamames, Sofiane Ettayeb, Patrick Paroubek and Anne Vilnat pdflogo.png

Session TALN - 4 : "Grammaire et Biomédical ", 11 juillet 10h30-12h

Chair : Pierre Zweigenbaum

  • Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire, Santiago Herrera, Caio Corro and Sylvain Kahane pdflogo.png
  • Reconnaissance d’entités cliniques en few-shot en trois langues, Marco Naguib, Aurélie Névéol and Xavier Tannier pdflogo.png
  • Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital), Felix Herron pdflogo.png

Session TALN - 5 : "De l'extraction à l'enrichissement", 12 juillet 9h-10h30

Chair : Farah Benamara

  • Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage, Aboubacar Tuo, Romaric Besançon, Olivier Ferret and Julien Tourille pdflogo.png
  • Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?, Hee-Soo Choi, Priyansh Trivedi, Mathieu Constant, Karën Fort and Bruno Guillaume pdflogo.png
  • astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques, Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum pdflogo.png

Session TALN - 6 : "Préjugé et multimodalité", 12 juillet 11h-12h30

Chair : Chloé Braud

  • Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs, Fanny Ducel, Aurélie Névéol and Karën Fort pdflogo.png
  • Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir, Léandre Adam-Cuvillier, Pierre-Jean Larpin and Antoine Simoulin pdflogo.png
  • Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes, Cécile Macaire, Chloé Dion, Didier Schwab, Benjamin Lecouteux and Emmanuelle Esperança-Rodier pdflogo.png

SESSIONS POSTERS

Session POSTER 1, 10 juillet 11h

Les posters seront en place toute la journée de 10h30 à 17h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Les numéros correspondent aux numéros des stands

Chair : Julie Mauclair

  1. iHist et iScatter, outils en ligne d’exploration interactive de données : application aux valeurs aberrantes de f0 et de formants, Nicolas Audibert
  2. Déplacement vertical du larynx dans la production des plosives en thaï, Paula Alejandra Cano Córdoba, Thi-Thuy-Hien Tran, Nathalie Vallée, Christophe Savariaux, Silvain Gerber, Nicha Yamlamai and Yu Chen
  3. Le /r/ du mandarin est-il une fricative plutôt qu’une liquide ?, Yezhou Jiang, Rachid Ridouane and Pierre André Hallé
  4. Implémentation ouverte et étude de BEST-RQ pour le traitement de la parole, Ryan Whetten, Titouan Parcollet, Marco Dinarelli and Yannick Estève
  5. Evaluation de la dysarthrie parkinsonienne en lecture par la mesure de la déviation phonologique perçue : effets de la sévérité et du traitement dopaminergique, Alain Ghio, Muriel Lalain, Cindy Defais, Alexia Brevet, Manon Jayr, Marie Rebourg, Danielle Duez, Corinne Fredouille, Virginie Woisard and François Viallet
  6. Effet du vieillissement sur l’anticipation d’arrondissement intra-syllabique en français, Louise Wohmann-Bruzzo, Cecile Fougeron and Nicolas Audibert
  7. La sonorité n’est pas l’intensité: le cas des diphtongues dans une langue tonale, Yunzhuo Xiang, Jiayin Gao and Cédric Gendrot
  8. Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE, Verdiana De Fino, Isabelle Ferrané, Julien Pinquier and Lionel Fontan
  9. Analyse Factorielle de signaux sonores : développement d’une méthode automatique de détermination des frontières optimales entre canaux de fréquence, Olivier Crouzet, Agnieszka Duniec and Elisabeth Delais-Roussarie
  10. Rôle de l’activité laryngale dans la production des consonnes d’arrière en arabe levantin, Jalal Al-Tamimi
  11. Le rythme : un marqueur d’atteinte du nerf laryngé supérieur ?, Helene Massis, Marie-Hélène Degombert, Juliette Dindart, Diane Lazard, Christophe Trésallet, Frédérique Frouin and Claire Pillot-Loiseau
  12. Une étude intra et inter-dialectale des voyelles du korebaju, Jenifer Andrea Vega Rodriguez, Nathalie Vallée, Thiago Chacon, Christophe Savariaux and Silvain Gerber
  13. Effets du shadowing et de l'imitation en tant que méthodes d'entraînement à la prononciation du /ɥi/ en français, Wenxun Fu, Martine Adda-Decker and Barbara Kühnert
  14. Détection automatique des schwas en français - Application à la détection des troubles du sommeil, Colleen Beaumard, Vincent P. Martin, Yaru Wu, Jean-Luc Rouas and Pierre Philip
  15. Évaluation perceptive de l'anticipation de la prise de parole lors d'interactions dialogiques en français, Rémi Uro, Albert Rilliard, David Doukhan, Marie Tahon and Antoine Laurent
  16. Une étude exploratoire de la parole sifflée en tant que signal modulé, Liem Landri, Benjamin O'Brien and Anna Marczyk
  17. Auto-correction et oracle dynamique : certains effets n'apparaissent qu'à taille réduite    Fang Zhao and Timothée Bernard
  18. Vers une pédagogie inclusive : une classification multimodale des illustrations de manuels scolaires pour des environnements d'apprentissage adaptés    Saumya Yadav, Élise Lincker, Caroline Huron, Stéphanie Martin, Camille Guinaudeau, Shin'Ichi Satoh and Jainendra Shukla
  19. Extraction d’entités nommées décrivant des chaînes de traitement bioinformatiques dans des articles scientifiques en anglais    Clémence Sebe, Sarah Cohen-Boulakia, Olivier Ferret and Aurélie Névéol
  20. Approche multitâche pour l'amélioration de la fiabilité des systèmes de résumé automatique de conversation    Eunice Akani, Benoit Favre, Frederic Bechet and Romain Gemignani
  21. Évaluation de l’apport des chaînes de coréférences pour le liage d’entités    Léo Labat and Lauriane Aufrant
  22. Améliorer les modèles de langue pour l'analyse des émotions : perspectives venant des sciences cognitives    Gustave Cortal and Constant Bonard
  23. Étude des facteurs de complexité des modèles de langage dans une tâche de compréhension de lecture à l'aide d'une expérience contrôlée sémantiquement    Elie Antoine, Frederic Bechet, Géraldine Damnati and Philippe Langlais
  24. Analyse de la perception de l'offre INTERCITÉS de jour : Classification multi-étiquettes des émotions dans les tweets    Chang Liu, Luce Lefeuvre, Hélène Flamein and Fanny Hanen
  25. Améliorer la traduction au niveau du document grâce au sur-echantillonnage négatif et au masquage ciblé    Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader
  26. Technologies de la parole et données de terrain : le cas du créole haïtien    William N. Havard, Renauld Govain, Daphne Gonçalves Teixeira, Benjamin Lecouteux and Emmanuel Schang
  27. Construction d'une mesure de similarité thématique non supervisée pour les conversations    Maxime Amblard and Amandine Decker
  28. ParaPLUIE - une mesure automatique d’évaluation de la qualité sémantique des systèmes de paraphrases    Quentin Lemesle, Jonathan Chevelu, Damien Lolive, Arnaud Delhay-Lorrain and Philippe Martin
  29. Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital)    Martina Barletta
  30. État de l’art des méthodes de génération automatique de listes de lectures (Recital)    Julien Aubert-Béduchaud
  31. Évaluation de mesures d’accord sur des structures relationnelles par la dégradation contrôlée d’annotations (Recital)    Antoine Boiteau
  32. TAL et analyse de l’activité en ergonomie : extraction d’informations spécialisées dans des transcriptions d’entretiens (Recital)    Andréa Blivet
  33. ChiCA: un corpus de conversations face-à-face vs. Zoom entre enfants et parents    Dhia Elhak Goumri, Abhishek Agrawal, Mitja Nikolaus, Hong Duc Thang Vu, Kübra Bodur, Elias Semmar, Cassandre Armand, Chiara Mazzocconi, Shreejata Gupta, Laurent Prévot, Benoit Favre, Leonor Becerra-Bonache and Abdellah Fourtassi
  34. Sur les limites de l'identification par l'humain de textes générés automatiquement    Nadége Alavoine, Maximin Coavoux, Emmanuelle Esperança-Rodier, Romane Gallienne, Carlos-Emiliano González-Gallardo, Jérôme Goulian, Jose G Moreno, Aurélie Névéol, Didier Schwab, Vincent Segonne and Johanna Simoens
  35. Le corpus BrainKT: Etudier l’instanciation du common ground par l’analyse des indices verbaux, gestuels et neurophysiologiques    Eliot Maës, Thierry Legou, Leonor Becerra-Bonache and Philippe Blache
  36. Rééquilibrer la distribution des labels tout en éliminant le temps d'attente inhérent dans l'apprentissage actif multi-label appliqué aux transformers    Maxime Arens, Jose G Moreno, Mohand Boughanem and Lucile Callebert
  37. La subjectivité dans le journalisme québécois et belge : transfert de connaissance inter-médias et inter-cultures    Louis Escouflaire, Antonin Descampe, Antoine Venant and Cédrick Fairon
  38. Une approche zero-shot pour localiser les transferts d’informations en conversation naturelle    Eliot Maës, Hossam Boudraa, Philippe Blache and Leonor Becerra-Bonache
  39. Caractérisation de la ville du futur dans un corpus de science-fiction    Sami Guembour, Chuanming Dong and Catherine Dominguès
  40. Évaluer les modèles de langue pré-entraînés avec des propriétés de hiérarchie    Jesus Lovon-Melgarejo, Jose G Moreno, Romaric Besançon, Olivier Ferret and Lynda Tamine
  41. LOCOST: Modèles Espace-État pour le Résumé Abstractif de Documents Longs    Florian Le Bronnec, Song Duong, Alexandre Allauzen, Vincent Guigue, Alberto Lumbreras, Laure Soulier and Patrick Gallinari

Session POSTER 2, 11 juillet 13h30

Les posters seront en place toute la journée de 10h00 à 18h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/

Les numéros correspondent aux numéros des stands

Chair : Jose G Moreno

  1. Traitement incrémental de la prosodie en L2, Giuseppina Turco, Hiyon Yoo and Chie Nakamura
  2. Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d'enfant, Lucas Block Medin, Lucile Gelin and Thomas Pellegrini
  3. Perception des frontières prosodiques du français par des natifs : Études comportementale et électroencéphalographique, Lei Xi, Rachid Ridouane and Frédéric Isel
  4. Frontières entre la perception de la voix normophonique et pathologique chez des auditeurs naïfs, Amelia Pettirossi, Nicolas Audibert and Lise Crevier-Buchman
  5. Sandhi tonal en shanghaïen : une étude acoustique des contours dissyllabiques chez des locuteurs jeunes, Yu Chen, Nathalie Vallée, Thi-Thuy-Hien Tran and Silvain Gerber
  6. L’impact du style de parole sur l’opposition de longueur des voyelles en arabe jordanien, Mohammad Abuoudeh, Jalal Al-Tamimi and Olivier Crouzet
  7. Une nouvelle grammaire de l’intonation de la phrase française, Philippe Martin
  8. Audiocite.net un grand corpus d'enregistrements vocaux de lecture en français, Soline Felice, Solène Evain, Solange Rossato and François Portet
  9. Identification automatique de la voix après resynthèse à l’aide de PPG, Thibault Gaudier, Marie Tahon, Anthony Larcher and Yannick Estève
  10. Allongement vocalique en italien L2 et en français L2 : une marque de focalisation ?, Bianca Maria De Paolis
  11. Creating a Speaking Styles Parallel Corpus in Mandarin through Auto-transcription, Jingyi Sun, Martine Adda-Decker, Yaru Wu and Nicolas Audibert
  12. La reconnaissance automatique de phonèmes est-elle réellement adaptée pour l’analyse de la parole spontanée ?, Vincent P. Martin, Colleen Beaumard, Charles Brazier, Jean-Luc Rouas and Yaru Wu
  13. Comparaison de mesures pour la détection automatique de déviance dans la dysarthrie ataxique, Natacha Miniconi, Cédric Gendrot, Angélina Bourbon, Leonardo Lancia and Cécile Fougeron
  14. Enseignement de l'intonation du français par une synthèse vocale contrôlée par le geste : étude longitudinale de faisabilité, Xiao Xiao, Corinne Bonnet, Haohan Zhang, Nicolas Audibert, Barbara Kühnert and Claire Pillot-Loiseau
  15. Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers, Malo Maisonneuve, Corinne Fredouille, Muriel Lalain, Alain Ghio and Virginie Woisard
  16. Entraînement de la coordination respiration-parole en apprentissage de la lecture assistée par ordinateur, Delphine Charuau, Andrea Briglia, Erika Godde and Gérard Bailly
  17. Voix enfantines, genre et classe sociale : une étude de la fréquence fondamentale, Erwan Pépiot
  18. Étude IRM de la production des /l/ de l’anglais par des locuteurs francophones, Alice Léger, Coline Caillol, Emmanuel Ferragne, Hannah King, Sylvain Charron, Clément Debacker, Maliesse Lui and Catherine Oppenheim
  19. Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique, Romain Contrain, Julien Pinquier, Lionel Fontan and Isabelle Ferrané
  20. Synthèse de syllabes avec un modèle de Maeda piloté par une représentation complexe, Frédéric Berthommier
  21. Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA, Nadège Alavoine, Gaëlle Laperrière, Christophe Servan, Sahar Ghannay and Sophie Rosset
  22. Preuve de concept d'un système de génération automatique en Langue française Parlée Complétée, Brigitte Bigi and Nuria Gala
  23. Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024, Adrien Lafore, Clément Pagès, Leila Moudjari, Sebastiao Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau and Jérôme Farinas
  24. Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction    Maxime Bouthors, Josep Crego and François Yvon
  25. Adaptation des modèles de langue à des domaines de spécialité par un masquage sélectif fondé sur le genre et les caractéristiques thématiques    Anas Belfathi, Ygor Gallina, Nicolas Hernandez, Laura Monceaux and Richard Dufour
  26. Utiliser l'explicabilité des modèles pour mettre en évidence les expressions genrées dans la parole    François Buet, Camille Guinaudeau, Cyril Grouin, Sahar Ghannay and Shin'Ichi Satoh
  27. Repérage et caractérisation automatique des émotions dans des textes : traiter aussi leurs modes d'expression indirects    Aline Etienne, Delphine Battistelli and Gwénolé Lecorvé
  28. Optimisation des performances d’un système de reconnaissance automatique de la parole pour les commentaires sportifs: fine-tuning de Whisper    Camille Lavigne, Alex Stasica and Anna Kupsc
  29. TCFLE-8 : un corpus de productions écrites d'apprenants de français langue étrangère et son application à la correction automatisée de textes    Rodrigo Wilkens, Alice Pintard, David Alfter, Vincent Folny and Thomas François
  30. Prédiction de la complexité lexicale : Une étude comparative entre ChatGPT et un modèle dédié à cette tâche.    Abdelhak Kelious, Mathieu Constant and Christophe Coeur
  31. De nouvelles méthodes pour l'exploration de l'interface syntaxe-prosodie : un treebank intonosyntaxique et un système de synthèse pour le pidgin nigérian    Emmett Strickland, Anne Lacheret-Dujour, Marc Evrard, Sylvain Kahane, Dana Aubakirova, Dorin Doncenco, Diego Torres, Perrine Quennehen and Bruno Guillaume
  32. Génération contrôlée de cas cliniques en français à partir de données médicales structurées    Hugo Boulanger, Nicolas Hiebel, Olivier Ferret, Karën Fort and Aurélie Névéol
  33. Extension d’AZee avec des règles de production concernant les gestes non-manuels pour la langue des signes française    Camille Challant and Michael Filhol
  34. The impact of genre on the prediction of text readability in FFL (French as a Foreign Language)    Lingyun Gao, Rodrigo Souza Wilkens and Thomas François
  35. astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques    Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum
  36. CLAIRE: Large Language Models for Spontaneous French Dialogue    Jérôme Louradour, Julie Hunter, Ismaïl Harrando, Guokan Shang, Virgile Rennard and Jean-Pierre Lorré
  37. SUMM-RE: A corpus of French meeting-style conversations    Julie Hunter, Hiroyoshi Yamasaki, Océane Granier, Jérôme Louradour, Roxane Bertrand, Kate Thompson and Laurent Prévot
  38. La reconnaissance automatique des relations de cohérence RST en français.    Martial Pastor, Nelleke Oostdijk and Erik Bran Marino
  39. Modéliser la facilité d’écoute en FLE : vaut-il mieux lire la transcription ou écouter le signal vocal ?    Minami Ozawa, Rodrigo Souza Wilkens, Kaori Sugiyama and Thomas François
  40. Quel workflow pour les sciences du texte ?    Antoine Widlöcher
  41. LLM-Generated Contexts to Practice Specialised Vocabulary: Corpus Presentation and Comparison    Iglika Nikolova-Stoupak, Serge Bibauw, Amandine Dumont, Françoise Stas, Patrick Watrin and Thomas François
  42. Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital)    Felix Herron
  43. Géométrie des vecteurs de tâches pour l'association et la combinaison de modèles (Recital)    Loic Fosse
  44. Analyse sémantique du corpus des Cahiers citoyens (Recital)    Sami Guembour
  45. Exploration d’approches hybrides pour la lisibilité : expériences sur la complémentarité entre les traits linguistiques et les transformers    Rodrigo Wilkens, Patrick Watrin, Rémi Cardon, Alice Pintard, Isabelle Gribomont and Thomas François
  46. Jargon : Une suite de modèles de langues et de référentiels d'évaluation pour les domaines spécialisés du français    Vincent Segonne, Aidan Mannion, Audibert Alexandre, Liu Xingyu, Cécile Macaire, Pupier Adrien, Yongxin Zhou, Mathilde Aguiar, Norré Magali, Felix Herron, Eshkol Taravella Iris, Thomas François, Goeuriot Lorraine, Jérôme Goulian, Mathieu Lafourcade, Benjamin Lecouteux, François Portet, Fabien Ringeval, Maximin Coavoux, Vincent Vandeghinste, Marco Dinarelli, Laura Alonzo-Canul, Amini Massih-Reza, Pierrette Bouillon, Didier Schwab and Esparança-Rodier Emmanuelle
  47. Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes    Cécile Macaire, Chloé Dion, Jordan Arrigo, Claire Lemaire, Emmanuelle Esperança-Rodier, Benjamin Lecouteux and Didier Schwab
  48. Apport de la structure de tours à l'identification automatique de genre textuel: un corpus annoté de sites web de tourisme en français    Remi Cardon, Trang Tran Hanh Pham, Julien Zakhia Doueihi and Thomas François

SALON PAREIL DES INDUSTRIELS

Liste des industriels présents (par ordre alphabétique) :

Spécialisée dans le traitement des contenus médias (presse écrite, web, et TV/radios), Aday est une société technologique française. L'entreprise héberge toutes ses données médias sur sa propre infrastructure.
Nous proposons un historique de données couvrant plus de 40 ans et acquérons quotidiennement 500 000 documents (articles textuels,  images...) et 2 500 heures de programmes audiovisuels.

ARCHEAN Technologies

LINAGORA

 

PostLab est spécialisée dans le développement, le déploiement et la maintenance de démonstrateurs et d’applications web, fondées sur des ressources logicielles ou des méthodes issues de la recherche académique. 

Notre mission est de lever les freins à l’accès, au partage et à la réutilisation de ressources logicielles de la recherche scientifique. 

Nous accompagnons les chercheuses et les chercheurs dans la diffusion et la mise en valeur de leurs ressources logicielles ou méthodes scientifiques.

SOLUTIONS 

Démonstrateur

Transformez vos travaux en démonstrateurs web graphique, accessibles à tous les niveaux d’expertise, et révélez le potentiel de vos recherches.

Cartographie de logiciels académiques 

Recensez vos logiciels de manière collaborative et participative, et mettez en lumière votre expertise scientifique.

LVL est une association soutenue par l'État qui propose : des IA vocales validées dans le respect du droit européen ; des données vocales pour permettre aux développeurs et chercheurs de l’écosystème français d’être concurrentiel au niveau mondial ; une expertise de plus de 30 acteurs institutionnels et entreprises technologiques.
Plus d'informations aux liens suivants :

 

Personnes connectées : 2 Vie privée
Chargement...