Les noms des auteurs sont indiqués en passant le curseur sur le titre de la communication ou sous le tableau (accès direct en cliquant sur le titre de la session)
Les présentations des différentes sessions ont une durée de 20 min. suivies de 10 min. de discussion
Chaque intervention et poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/
Lundi 8 juillet
|
Mardi 9 juillet
|
Mercredi 10 juillet
|
Jeudi 11 juillet
|
Vendredi 12 juillet
|
Ateliers_JTR2024 (lieux et horaires)
DEFT 2024
Evalllm
Hackatal
Lawbot, JP'24
|
9h00 Grand Amphi
Ouverture
9h30 Grand Amphi
Conférencière invitée
Véronique HOSTE
(Ghent University) Towards a Reappraisal of the Linguistic Perspective in the LLM Era
Pause café (Sous la canopée)
Amphi C
Session JEP - 1 : Parole pathologique
|
|
Amphi D
Session TALN - 1 : Sur l'Interférence et l'Analogie
|
Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ? |
11h00 |
Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales |
Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales, |
11h30 |
Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs |
Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français |
12h00 |
Méta-apprentissage pour l'analyse AMR translingue |
|
Amphi C
Session JEP - 3 : Parole non native
|
|
Amphi D
Session TALN - 3 : Applications en pédagogie
|
Une comparaison de l'intonation ironique en français et en mandarin |
9h00 |
Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital) |
Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle |
9h30 |
État de l’art des méthodes de génération automatique de listes de lectures (Recital) |
Autisme et compliance phonique |
10h00 |
CQuAE : Un nouveau corpus de question-réponse pour l'enseignement |
Pause café (Sous la canopée)
11h00 Sous la canopée
Session poster JEP & TALN - 1
(lien vers les titres des posters de la session)
Les posters seront en place toute la journée
de 10h30 à 17h30
|
9h00 Grand Amphi
Conférencière invitée
Catia CUCCHIARINI
(Radboud University) Automatic Speech Recognition technology for innovative research on reading development
Pause café (Sous la canopée)
Amphi C
Session JEP - 4 : Multimodalité
|
|
Amphi D
Session TALN - 4 : Grammaire et Biomédical
|
Synthèse de gestes communicatifs via STARGATE |
10h30 |
Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire |
Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ? |
11h00 |
Reconnaissance d’entités cliniques en few-shot en trois langues |
Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien |
11h30 |
Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital) |
|
Amphi C
Session JEP - 5 : Annotation et inventaire
|
|
Amphi D
Session TALN - 5 : De l'extraction à l'enrichessement
|
Un système d’annotation automatique de la structure prosodique |
9h00 |
Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage |
Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925 |
9h30 |
Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ? |
Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes |
10h00 |
astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques |
Pause café (Sous la canopée)
Amphi C
Session JEP - 6 : Parole en interaction
|
|
Amphi D
Session TALN - 6 : Préjugé et multimodalité
|
Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané |
11h00 |
Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs |
Disfluences en parole continue en français : paramètres prosodiques des répétitions |
11h30 |
Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir |
Étude de la qualité vocale dans la parole professionnelle des aides-soignants français |
12h00 |
Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes |
12h30 Grand Amphi
Clôture
|
|
12h30 : Repas (RU) |
12h30 : Repas (RU) |
12h00 : Repas (RU) |
-- |
Ateliers_JTR2024 (lieux et horaires)
Atelier Parole Spontanée
DEFT 2024
Evalllm
Hackatal
Lawbot, JP'24
|
Amphi C
Session JEP - 2 : Oral et interprétabilité
|
|
Amphi D
Session TALN - 2 : Défis en Traduction Automatique
|
Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés |
14h00 |
À propos des difficultés de traduire automatiquement de longs documents |
Identification du locuteur : ouvrir la boîte noire |
14h30 |
Réduction des répétitions dans la Traduction Automatique Neuronale |
Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles |
15h00 |
Vers la traduction automatique des néologismes scientifiques |
Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques |
15h30 |
Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé |
Pause café (Sous la canopée)
Grand Amphi
Session commune JEP & TALN - 1 : Du bas au haut niveau
16h30 |
SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation |
17h00 |
Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole |
17h30 |
Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ? |
18h00 |
Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole |
|
14h00 Grand Amphi
Conférencier invité
Laurent BESACIER
(Naver Labs Europe) Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues
Grand Amphi
Session commune JEP & TALN - 2 : Représentation neuronale
15h00 |
Small Language Models are Good Too: An Empirical Study of Zero-Shot Classification |
15h30 |
WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models |
16h00 |
Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien |
16h30 |
Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage |
Pause café (Sous la canopée)
17h30 Grand Amphi
Prix de thèse AFCP et ATALA
|
13h30 Sous la canopée
Session poster JEP & TALN - 2
(lien vers les titres des posters de la session)
Les posters seront en place toute la journée
de 10h00 à 18h30
Salon PAREIL des industriels
(lien vers les industriels présents)
15h30 Grand Amphi
Le Voice Lab et Écouter-Parler :
collecte, annotation et valorisation de données vocales Le laboratoire modbile "écouter-parler" sera présent sur le campus les 11 et 12 juillet
Pause café (Sous la canopée)
16h30 Grand Amphi
30 ans TALN
|
-- |
Hackatal
|
18h30 Sous la canopée
Cocktail de bienvenue
|
|
19h30 à l'Espace Vanel
Dîner de Gala
|
-- |
CONFÉRENCES INVITÉS
Towards a Reappraisal of the Linguistic Perspective in the LLM Era
Currently, Large Language Models (LLMs) have quickly become the norm and have shown impressive results for language applications in different research domains. Various discourse-related tasks usually requiring in-depth knowledge of the world, however, seem to remain largely understudied. Focusing on tasks such as event coreference resolution, emotion detection and irony detection, I would like to discuss how the rich history of Computational Linguistics can help us in identifying knowledge gaps in current methodologies and in attempting to address these. I will touch upon the issue of dataset selection and labeling and a heavy reliance on benchmark datasets, and discuss opportunities to unify both expert knowledge and modern-day learning frameworks and architectures.
Veronique Hoste is Senior Full Professor of Computational Linguistics at the Faculty of Arts and Philosophy at Ghent University. She is department head of the Department of Translation, Interpreting and Communication and director of the LT3 language and translation team at the same department. She is also research director of the Faculty of Arts and Philosophy. Veronique holds a PhD in computational linguistics from the University of Antwerp (Belgium) on "Optimization issues in machine learning of coreference resolution" (2005). She has expertise in machine learning of natural language, and more specifically in computational approaches to the modeling of semantics and discourse, such as event detection, entity and event coreference resolution, irony detection, emotion analysis, etc.
Modèles de Fondation pour l'Encodage du Texte et de la Parole en Français et dans d'Autres Langues
Dans cet exposé, je partagerai mon expérience concernant trois projets collectifs d’entraînement de modèles de fondation auxquels j’ai participé au cours des cinq dernières années. Deux de ces projets ont fourni des ressources populaires pour le traitement automatique de la langue en français écrit (FlauBERT) et oral (LeBenchmark). Le troisième projet, le plus récent, concerne l’entraînement d’un modèle multilingue pour la parole, mHUBERT-147. Je mettrai en lumière les points communs et les différences entre ces initiatives, en insistant particulièrement sur l’importance du choix, de la préparation des données, ainsi que de l’évaluation des performances.
Laurent Besacier est professeur des universités à l’Université Grenoble Alpes, actuellement en détachement au sein du centre de recherche privé Naver Labs Europe. Il y occupe le poste de « principal scientist » où il dirige le groupe de recherche « interactive systems ». Auparavant, il a dirigé l’équipe TAL chez Naver Labs de 2021 à 2023, et avant cela, il était à la tête de l’équipe GETALP du LIG (Laboratoire d’Informatique de Grenoble) jusqu'en 2020.
Ses principaux domaines d'expertise et intérêts de recherche englobent le traitement automatique du langage naturel, la reconnaissance automatique de la parole, la traduction automatique, les langues peu dotées, la documentation des langues assistée par la machine ainsi que l'évaluation des systèmes de TAL.
Automatic Speech Recognition technology for innovative research on reading development
Reading tutors that incorporate Automatic Speech Recognition (ASR) technology have been proposed as valuable educational software that can provide additional practice and support in reading aloud. Most systems developed so far have been used to follow children while they read aloud so that support can be provided to indicate the correct form of the word when difficulties arise. In our own work we have investigated the use of ASR technology to conduct innovative research on reading development at earlier stages of learning to read, when children are still in the process of developing decoding skills. A Reading tutor equipped with logging capabilities was developed to record what happens during reading practice and to investigate the effect of different forms of feedback on reading aloud. This provides a considerable amount of data that can be used to improve the ASR technology and to fine-tune the system, but also to gain more detailed insights into how the process of learning to read unfolds.
Dr. Catia Cucchiarini holds a PhD from Radboud University, where she is now Principal Investigator in the research group Language and Speech, Learning and Therapy. She has conducted research on speech processing, language learning, AI and speech technology development for Computer Assisted Language Learning and e-health, for which she obtained numerous national and international grants.
Dr. Cucchiarini is also Head of Policy at the Dutch-Flemish intergouvernmental organization Union for the Dutch Language in the Hague.
SESSIONS ORALES COMMUNES (JEP-TALN)
Session Commune 1 : Du bas au haut niveau, 9 juillet 16h30-18h30
Chair : Patrick Paroubek
- SEC : contexte émotionnel phrastique intégré pour la reconnaissance émotionnelle efficiente dans la conversation, Barbara Gendron and Gaël Guibon
- Une approche par graphe pour l’analyse syntaxique en dépendances de bout en bout de la parole, Adrien Pupier, Maximin Coavoux, Benjamin Lecouteux and Jérôme Goulian
- Réductions temporelles en français parlé : Où peut-on trouver les zones de réduction ?, Yaru Wu, Kim Gerdes and Martine Adda-Decker
- Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole, Thibault Bañeras Roux, Mickael Rouvier, Jane Wottawa and Richard Dufour
Session Commune 2 : Représentation neuronale, 10 juillet 15h-17h30
Chair : Benoit Favre
- Les petits modèles sont bons : une étude empirique de classification dans un contexte zero-shot, Pierre Lepagnol, Thomas Gerald, Sahar Ghannay, Christophe Servan and Sophie Rosset
- WikiFactDiff: A Large, Realistic, and Temporally Adaptable Dataset for Atomic Factual Knowledge Update in Causal Language Models, Hichem Ammar Khodja, Frédéric Béchet, Quentin Brabant, Alexis Nasr and Gwénolé Lecorvé
- Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte subsaharien, Antoine Caubrière and Elodie Gauthier
- Mesure du niveau de proximité entre enregistrements audio et évaluation indirecte du niveau d’abstraction des représentations issues d’un grand modèle de langage, Maxime Fily, Guillaume Wisniewski, Séverine Guillaume, Gilles Adda and Alexis Michaud
SESSIONS ORALES JEP
Session JEP - 1 : "Parole pathologique", 9 juillet 11h-12h30
Chair : Véronique Delvaux
- Pertinence des pseudo-mots dans l’évaluation de l’intelligibilité : Effet du nombre ou du caractère non lexical ?, Marie Rebourg, Muriel Lalain, Alain Ghio, Corinne Fredouille, Nicolas Fakhry and Virginie Woisard
- Les représentations de locuteurs pour prédire l’intelligibilité de la parole lors de conversations médicales, Sebastiao Quintas, Mathieu Balaguer, Julie Mauclair, Virginie Woisard and Julien Pinquier
- Effet de la tâche sur le débit articulatoire d’enfants et adolescents avec et sans trouble du spectre de l’autisme en français, Cwiosna Roques, Fanny Guitart-Ivent, Christelle Dodane and Fabrice Hirsch
Session JEP - 2 : "Oral et interprétabilité", 9 juillet 14h-16h
Chair : Thomas Pellegrini
- Exploration de la représentation multidimensionnelle de paramètres acoustiques unidimensionnels de la parole extraits par des modèles profonds non supervisés, Maxime Jacquelin, Maëva Garnier, Laurent Girin, Rémy Vincent and Olivier Perrotin
- Identification du locuteur : ouvrir la boîte noire, Carole Millot, Cédric Gendrot and Jean-François Bonastre
- Comment l'oreille humaine perçoit-elle la somnolence dans la parole ? Une analyse rétrospective d'études perceptuelles, Vincent P. Martin, Colleen Beaumard and Jean-Luc Rouas
- Utilisation de wav2vec 2.0 pour des tâches de classifications phonétiques : aspects méthodologiques, Lila Kim and Cedric Gendrot
Session JEP - 3 : "Parole non native", 10 juillet 9h-10h30
Chair : Claire Pillot-Loiseau
- Une comparaison de l'intonation ironique en français et en mandarin, Ziqi Zhou, Jalal Al-Tamimi and Hiyon Yoo
- Perception et production des clusters en position initiale par des sinophones : le rôle du Principe de Sonorité Séquentielle, Xuejing Chen, Pierre André Hallé and Rachid Ridouane
- Autisme et compliance phonique, Eva Goeseels, Kathy Huet, Myriam Piccaluga, Virginie Roland and Véronique Delvaux
Session JEP - 4 : "Multimodalité", 11 juillet 10h30-12h
Chair : Christophe Savariaux
- Synthèse de gestes communicatifs via STARGATE, Louis Abel, Vincent Colotte and Slim Ouni
- Peut-on marquer un focus contrastif par le geste manuel en suppléance vocale ?, Delphine Charuau, Nathalie Henrich Bernardoni, Silvain Gerber and Olivier Perrotin
- Retour auditif interne de la production de parole : mesures préliminaires de la vibration osseuse par accélérométrie et comparaison au son aérien, Raphael Vancheri, Coriandre Vilain, Nathalie Henrich-Bernardoni and Pierre Baraduc
Session JEP - 5 : "Annotation et inventaire", 12 juillet 9h-10h30
Chair : Marie Tahon
- Un système d’annotation automatique de la structure prosodique, Philippe Martin
- Étude en temps réel de la fusion des /a/ ~ /ɑ/ en français depuis 1925, Juliusz Cęcelewski, Cédric Gendrot, Martine Adda-Decker and Philippe Boula de Mareüil
- Étude des liens acoustico-moteurs après cancer oral ou oropharyngé, via la réalisation d’un inventaire phonémique automatique des consonnes, Mathieu Balaguer, Lucile Gelin, Clémence Devoucoux, Camille Galant, Muriel Lalain, Alain Ghio, Jérôme Farinas, Julien Pinquier and Virginie Woisard
Session JEP - 6 : "Parole en interaction", 12 juillet 11h-12h30
Chair : Nathalie Vallée
- Caractérisation acoustique des réalisations approximantes du /v/ intervocalique en français spontané, Suyuan Dong and Nicolas Audibert
- Disfluences en parole continue en français : paramètres prosodiques des répétitions, Ivana Didirková, Yaru Wu and Anne Catherine Simon
- Étude de la qualité vocale dans la parole professionnelle des aides-soignants français, Jean-Luc Rouas, Yaru Wu and Takaaki Shochi
SESSIONS ORALES TALN/RECITAL
Session TALN - 1 : "Sur l'Interférence et l'Analogie", 9 juillet 11h-12h30
Chair : Benoît Sagot
- Évaluation de la Similarité Textuelle : Entre Sémantique et Surface dans les Représentations Neuronales, Julie Tytgat, Guillaume Wisniewski and Adrien Betrancourt
- Recherche de relation à partir d’un seul exemple fondée sur un modèle N-way K-shot : une histoire de distracteurs, Hugo Thomas, Guillaume Gravier and Pascale Sébillot
- Méta-apprentissage pour l'analyse AMR translingue, Jeongwoo Kang, Maximin Coavoux, Cédric Lopez and Didier Schwab
Session TALN - 2 : "Défis en Traduction Automatique", 9 juillet 14h-15h30
Chair : Emmanuel Morin
- À propos des difficultés de traduire automatiquement de longs documents, Ziqian Peng, Rachel Bawden and François Yvon
- Réduction des répétitions dans la Traduction Automatique Neuronale, Marko Avila, Anna Rebollo and Josep Crego
- Vers la traduction automatique des néologismes scientifiques, Paul Lerner and François Yvon
- Améliorer la traduction au niveau du document grâce au sur-échantillonnage négatif et au masquage ciblé, Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader
Session TALN - 3 : "Applications en pédagogie", 10 juillet 9h-10h30
Chair : Lydia-Mai Ho-Dac
- Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital), Martina Barletta
- État de l’art des méthodes de génération automatique de listes de lectures (Recital), Julien Aubert-Béduchaud
- CQuAE : Un nouveau corpus de question-réponse pour l'enseignement, Thomas Gerald, Louis Tamames, Sofiane Ettayeb, Patrick Paroubek and Anne Vilnat
Session TALN - 4 : "Grammaire et Biomédical ", 11 juillet 10h30-12h
Chair : Pierre Zweigenbaum
- Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire, Santiago Herrera, Caio Corro and Sylvain Kahane
- Reconnaissance d’entités cliniques en few-shot en trois langues, Marco Naguib, Aurélie Névéol and Xavier Tannier
- Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital), Felix Herron
Session TALN - 5 : "De l'extraction à l'enrichissement", 12 juillet 9h-10h30
Chair : Farah Benamara
- Extraction des arguments d'événements à partir de peu d'exemples par méta-apprentissage, Aboubacar Tuo, Romaric Besançon, Olivier Ferret and Julien Tourille
- Au-delà de la performance des modèles : la prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?, Hee-Soo Choi, Priyansh Trivedi, Mathieu Constant, Karën Fort and Bruno Guillaume
- astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques, Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum
Session TALN - 6 : "Préjugé et multimodalité", 12 juillet 11h-12h30
Chair : Chloé Braud
- Évaluation automatique des biais de genre dans des modèles de langue auto-régressifs, Fanny Ducel, Aurélie Névéol and Karën Fort
- Les représentations contextuelles stéréotypées dans les modèles de langue français : mieux les identifier pour ne pas les reproduir, Léandre Adam-Cuvillier, Pierre-Jean Larpin and Antoine Simoulin
- Approches cascade et de bout-en-bout pour la traduction automatique de la parole en pictogrammes, Cécile Macaire, Chloé Dion, Didier Schwab, Benjamin Lecouteux and Emmanuelle Esperança-Rodier
SESSIONS POSTERS
Les posters seront en place toute la journée de 10h30 à 17h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/
Les numéros correspondent aux numéros des stands
Chair : Julie Mauclair
- iHist et iScatter, outils en ligne d’exploration interactive de données : application aux valeurs aberrantes de f0 et de formants, Nicolas Audibert
- Déplacement vertical du larynx dans la production des plosives en thaï, Paula Alejandra Cano Córdoba, Thi-Thuy-Hien Tran, Nathalie Vallée, Christophe Savariaux, Silvain Gerber, Nicha Yamlamai and Yu Chen
- Le /r/ du mandarin est-il une fricative plutôt qu’une liquide ?, Yezhou Jiang, Rachid Ridouane and Pierre André Hallé
- Implémentation ouverte et étude de BEST-RQ pour le traitement de la parole, Ryan Whetten, Titouan Parcollet, Marco Dinarelli and Yannick Estève
- Evaluation de la dysarthrie parkinsonienne en lecture par la mesure de la déviation phonologique perçue : effets de la sévérité et du traitement dopaminergique, Alain Ghio, Muriel Lalain, Cindy Defais, Alexia Brevet, Manon Jayr, Marie Rebourg, Danielle Duez, Corinne Fredouille, Virginie Woisard and François Viallet
- Effet du vieillissement sur l’anticipation d’arrondissement intra-syllabique en français, Louise Wohmann-Bruzzo, Cecile Fougeron and Nicolas Audibert
- La sonorité n’est pas l’intensité: le cas des diphtongues dans une langue tonale, Yunzhuo Xiang, Jiayin Gao and Cédric Gendrot
- Peut-on évaluer la compréhensibilité de la parole sans référence quant aux intentions de communication du locuteur ? Une étude auprès d’apprenants germanophones de FLE, Verdiana De Fino, Isabelle Ferrané, Julien Pinquier and Lionel Fontan
- Analyse Factorielle de signaux sonores : développement d’une méthode automatique de détermination des frontières optimales entre canaux de fréquence, Olivier Crouzet, Agnieszka Duniec and Elisabeth Delais-Roussarie
- Rôle de l’activité laryngale dans la production des consonnes d’arrière en arabe levantin, Jalal Al-Tamimi
- Le rythme : un marqueur d’atteinte du nerf laryngé supérieur ?, Helene Massis, Marie-Hélène Degombert, Juliette Dindart, Diane Lazard, Christophe Trésallet, Frédérique Frouin and Claire Pillot-Loiseau
- Une étude intra et inter-dialectale des voyelles du korebaju, Jenifer Andrea Vega Rodriguez, Nathalie Vallée, Thiago Chacon, Christophe Savariaux and Silvain Gerber
- Effets du shadowing et de l'imitation en tant que méthodes d'entraînement à la prononciation du /ɥi/ en français, Wenxun Fu, Martine Adda-Decker and Barbara Kühnert
- Détection automatique des schwas en français - Application à la détection des troubles du sommeil, Colleen Beaumard, Vincent P. Martin, Yaru Wu, Jean-Luc Rouas and Pierre Philip
- Évaluation perceptive de l'anticipation de la prise de parole lors d'interactions dialogiques en français, Rémi Uro, Albert Rilliard, David Doukhan, Marie Tahon and Antoine Laurent
- Une étude exploratoire de la parole sifflée en tant que signal modulé, Liem Landri, Benjamin O'Brien and Anna Marczyk
- Auto-correction et oracle dynamique : certains effets n'apparaissent qu'à taille réduite Fang Zhao and Timothée Bernard
- Vers une pédagogie inclusive : une classification multimodale des illustrations de manuels scolaires pour des environnements d'apprentissage adaptés Saumya Yadav, Élise Lincker, Caroline Huron, Stéphanie Martin, Camille Guinaudeau, Shin'Ichi Satoh and Jainendra Shukla
- Extraction d’entités nommées décrivant des chaînes de traitement bioinformatiques dans des articles scientifiques en anglais Clémence Sebe, Sarah Cohen-Boulakia, Olivier Ferret and Aurélie Névéol
- Approche multitâche pour l'amélioration de la fiabilité des systèmes de résumé automatique de conversation Eunice Akani, Benoit Favre, Frederic Bechet and Romain Gemignani
- Évaluation de l’apport des chaînes de coréférences pour le liage d’entités Léo Labat and Lauriane Aufrant
- Améliorer les modèles de langue pour l'analyse des émotions : perspectives venant des sciences cognitives Gustave Cortal and Constant Bonard
- Étude des facteurs de complexité des modèles de langage dans une tâche de compréhension de lecture à l'aide d'une expérience contrôlée sémantiquement Elie Antoine, Frederic Bechet, Géraldine Damnati and Philippe Langlais
- Analyse de la perception de l'offre INTERCITÉS de jour : Classification multi-étiquettes des émotions dans les tweets Chang Liu, Luce Lefeuvre, Hélène Flamein and Fanny Hanen
- Améliorer la traduction au niveau du document grâce au sur-echantillonnage négatif et au masquage ciblé Gaëtan Caillaut, Mariam Nakhlé, Jingshu Liu and Raheel Qader
- Technologies de la parole et données de terrain : le cas du créole haïtien William N. Havard, Renauld Govain, Daphne Gonçalves Teixeira, Benjamin Lecouteux and Emmanuel Schang
- Construction d'une mesure de similarité thématique non supervisée pour les conversations Maxime Amblard and Amandine Decker
- ParaPLUIE - une mesure automatique d’évaluation de la qualité sémantique des systèmes de paraphrases Quentin Lemesle, Jonathan Chevelu, Damien Lolive, Arnaud Delhay-Lorrain and Philippe Martin
- Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats (Recital) Martina Barletta
- État de l’art des méthodes de génération automatique de listes de lectures (Recital) Julien Aubert-Béduchaud
- Évaluation de mesures d’accord sur des structures relationnelles par la dégradation contrôlée d’annotations (Recital) Antoine Boiteau
- TAL et analyse de l’activité en ergonomie : extraction d’informations spécialisées dans des transcriptions d’entretiens (Recital) Andréa Blivet
- ChiCA: un corpus de conversations face-à-face vs. Zoom entre enfants et parents Dhia Elhak Goumri, Abhishek Agrawal, Mitja Nikolaus, Hong Duc Thang Vu, Kübra Bodur, Elias Semmar, Cassandre Armand, Chiara Mazzocconi, Shreejata Gupta, Laurent Prévot, Benoit Favre, Leonor Becerra-Bonache and Abdellah Fourtassi
- Sur les limites de l'identification par l'humain de textes générés automatiquement Nadége Alavoine, Maximin Coavoux, Emmanuelle Esperança-Rodier, Romane Gallienne, Carlos-Emiliano González-Gallardo, Jérôme Goulian, Jose G Moreno, Aurélie Névéol, Didier Schwab, Vincent Segonne and Johanna Simoens
- Le corpus BrainKT: Etudier l’instanciation du common ground par l’analyse des indices verbaux, gestuels et neurophysiologiques Eliot Maës, Thierry Legou, Leonor Becerra-Bonache and Philippe Blache
- Rééquilibrer la distribution des labels tout en éliminant le temps d'attente inhérent dans l'apprentissage actif multi-label appliqué aux transformers Maxime Arens, Jose G Moreno, Mohand Boughanem and Lucile Callebert
- La subjectivité dans le journalisme québécois et belge : transfert de connaissance inter-médias et inter-cultures Louis Escouflaire, Antonin Descampe, Antoine Venant and Cédrick Fairon
- Une approche zero-shot pour localiser les transferts d’informations en conversation naturelle Eliot Maës, Hossam Boudraa, Philippe Blache and Leonor Becerra-Bonache
- Caractérisation de la ville du futur dans un corpus de science-fiction Sami Guembour, Chuanming Dong and Catherine Dominguès
- Évaluer les modèles de langue pré-entraînés avec des propriétés de hiérarchie Jesus Lovon-Melgarejo, Jose G Moreno, Romaric Besançon, Olivier Ferret and Lynda Tamine
- LOCOST: Modèles Espace-État pour le Résumé Abstractif de Documents Longs Florian Le Bronnec, Song Duong, Alexandre Allauzen, Vincent Guigue, Alberto Lumbreras, Laure Soulier and Patrick Gallinari
Les posters seront en place toute la journée de 10h00 à 18h30. Chaque poster correspond à un article dans les actes accessibles sur HAL : https://hal.science/JEP-TALN-RECITAL2024/
Les numéros correspondent aux numéros des stands
Chair : Jose G Moreno
- Traitement incrémental de la prosodie en L2, Giuseppina Turco, Hiyon Yoo and Chie Nakamura
- Adaptation de modèles auto-supervisés pour la reconnaissance de phonèmes dans la parole d'enfant, Lucas Block Medin, Lucile Gelin and Thomas Pellegrini
- Perception des frontières prosodiques du français par des natifs : Études comportementale et électroencéphalographique, Lei Xi, Rachid Ridouane and Frédéric Isel
- Frontières entre la perception de la voix normophonique et pathologique chez des auditeurs naïfs, Amelia Pettirossi, Nicolas Audibert and Lise Crevier-Buchman
- Sandhi tonal en shanghaïen : une étude acoustique des contours dissyllabiques chez des locuteurs jeunes, Yu Chen, Nathalie Vallée, Thi-Thuy-Hien Tran and Silvain Gerber
- L’impact du style de parole sur l’opposition de longueur des voyelles en arabe jordanien, Mohammad Abuoudeh, Jalal Al-Tamimi and Olivier Crouzet
- Une nouvelle grammaire de l’intonation de la phrase française, Philippe Martin
- Audiocite.net un grand corpus d'enregistrements vocaux de lecture en français, Soline Felice, Solène Evain, Solange Rossato and François Portet
- Identification automatique de la voix après resynthèse à l’aide de PPG, Thibault Gaudier, Marie Tahon, Anthony Larcher and Yannick Estève
- Allongement vocalique en italien L2 et en français L2 : une marque de focalisation ?, Bianca Maria De Paolis
- Creating a Speaking Styles Parallel Corpus in Mandarin through Auto-transcription, Jingyi Sun, Martine Adda-Decker, Yaru Wu and Nicolas Audibert
- La reconnaissance automatique de phonèmes est-elle réellement adaptée pour l’analyse de la parole spontanée ?, Vincent P. Martin, Colleen Beaumard, Charles Brazier, Jean-Luc Rouas and Yaru Wu
- Comparaison de mesures pour la détection automatique de déviance dans la dysarthrie ataxique, Natacha Miniconi, Cédric Gendrot, Angélina Bourbon, Leonardo Lancia and Cécile Fougeron
- Enseignement de l'intonation du français par une synthèse vocale contrôlée par le geste : étude longitudinale de faisabilité, Xiao Xiao, Corinne Bonnet, Haohan Zhang, Nicolas Audibert, Barbara Kühnert and Claire Pillot-Loiseau
- Apprentissage profond pour l’analyse de la parole pathologique : étude comparative entre modèles CNN et à base de transformers, Malo Maisonneuve, Corinne Fredouille, Muriel Lalain, Alain Ghio and Virginie Woisard
- Entraînement de la coordination respiration-parole en apprentissage de la lecture assistée par ordinateur, Delphine Charuau, Andrea Briglia, Erika Godde and Gérard Bailly
- Voix enfantines, genre et classe sociale : une étude de la fréquence fondamentale, Erwan Pépiot
- Étude IRM de la production des /l/ de l’anglais par des locuteurs francophones, Alice Léger, Coline Caillol, Emmanuel Ferragne, Hannah King, Sylvain Charron, Clément Debacker, Maliesse Lui and Catherine Oppenheim
- Erreurs de prononciation en L2 : comparaison de méthodes pour la détection et le diagnostic guidés par la didactique, Romain Contrain, Julien Pinquier, Lionel Fontan and Isabelle Ferrané
- Synthèse de syllabes avec un modèle de Maeda piloté par une représentation complexe, Frédéric Berthommier
- Nouvelle tâche sémantique pour le corpus de compréhension de parole en français MEDIA, Nadège Alavoine, Gaëlle Laperrière, Christophe Servan, Sahar Ghannay and Sophie Rosset
- Preuve de concept d'un système de génération automatique en Langue française Parlée Complétée, Brigitte Bigi and Nuria Gala
- Premier système IRIT-MyFamillyUp pour la compétition sur la reconnaissance des émotions Odyssey 2024, Adrien Lafore, Clément Pagès, Leila Moudjari, Sebastiao Quintas, Isabelle Ferrané, Hervé Bredin, Thomas Pellegrini, Farah Benamara, Jérôme Bertrand, Marie-Françoise Bertrand, Véronique Moriceau and Jérôme Farinas
- Optimiser le choix des exemples pour la traduction automatique augmentée par des mémoires de traduction Maxime Bouthors, Josep Crego and François Yvon
- Adaptation des modèles de langue à des domaines de spécialité par un masquage sélectif fondé sur le genre et les caractéristiques thématiques Anas Belfathi, Ygor Gallina, Nicolas Hernandez, Laura Monceaux and Richard Dufour
- Utiliser l'explicabilité des modèles pour mettre en évidence les expressions genrées dans la parole François Buet, Camille Guinaudeau, Cyril Grouin, Sahar Ghannay and Shin'Ichi Satoh
- Repérage et caractérisation automatique des émotions dans des textes : traiter aussi leurs modes d'expression indirects Aline Etienne, Delphine Battistelli and Gwénolé Lecorvé
- Optimisation des performances d’un système de reconnaissance automatique de la parole pour les commentaires sportifs: fine-tuning de Whisper Camille Lavigne, Alex Stasica and Anna Kupsc
- TCFLE-8 : un corpus de productions écrites d'apprenants de français langue étrangère et son application à la correction automatisée de textes Rodrigo Wilkens, Alice Pintard, David Alfter, Vincent Folny and Thomas François
- Prédiction de la complexité lexicale : Une étude comparative entre ChatGPT et un modèle dédié à cette tâche. Abdelhak Kelious, Mathieu Constant and Christophe Coeur
- De nouvelles méthodes pour l'exploration de l'interface syntaxe-prosodie : un treebank intonosyntaxique et un système de synthèse pour le pidgin nigérian Emmett Strickland, Anne Lacheret-Dujour, Marc Evrard, Sylvain Kahane, Dana Aubakirova, Dorin Doncenco, Diego Torres, Perrine Quennehen and Bruno Guillaume
- Génération contrôlée de cas cliniques en français à partir de données médicales structurées Hugo Boulanger, Nicolas Hiebel, Olivier Ferret, Karën Fort and Aurélie Névéol
- Extension d’AZee avec des règles de production concernant les gestes non-manuels pour la langue des signes française Camille Challant and Michael Filhol
- The impact of genre on the prediction of text readability in FFL (French as a Foreign Language) Lingyun Gao, Rodrigo Souza Wilkens and Thomas François
- astroECR : enrichissement d'un corpus astrophysique en entités nommées, coréférences et relations sémantiques Atilla Kaan Alkan, Felix Grezes, Cyril Grouin, Fabian Schüssler and Pierre Zweigenbaum
- CLAIRE: Large Language Models for Spontaneous French Dialogue Jérôme Louradour, Julie Hunter, Ismaïl Harrando, Guokan Shang, Virgile Rennard and Jean-Pierre Lorré
- SUMM-RE: A corpus of French meeting-style conversations Julie Hunter, Hiroyoshi Yamasaki, Océane Granier, Jérôme Louradour, Roxane Bertrand, Kate Thompson and Laurent Prévot
- La reconnaissance automatique des relations de cohérence RST en français. Martial Pastor, Nelleke Oostdijk and Erik Bran Marino
- Modéliser la facilité d’écoute en FLE : vaut-il mieux lire la transcription ou écouter le signal vocal ? Minami Ozawa, Rodrigo Souza Wilkens, Kaori Sugiyama and Thomas François
- Quel workflow pour les sciences du texte ? Antoine Widlöcher
- LLM-Generated Contexts to Practice Specialised Vocabulary: Corpus Presentation and Comparison Iglika Nikolova-Stoupak, Serge Bibauw, Amandine Dumont, Françoise Stas, Patrick Watrin and Thomas François
- Évaluation de benchmarking actuel pour des modèles de langage biomédicaux français (Recital) Felix Herron
- Géométrie des vecteurs de tâches pour l'association et la combinaison de modèles (Recital) Loic Fosse
- Analyse sémantique du corpus des Cahiers citoyens (Recital) Sami Guembour
- Exploration d’approches hybrides pour la lisibilité : expériences sur la complémentarité entre les traits linguistiques et les transformers Rodrigo Wilkens, Patrick Watrin, Rémi Cardon, Alice Pintard, Isabelle Gribomont and Thomas François
- Jargon : Une suite de modèles de langues et de référentiels d'évaluation pour les domaines spécialisés du français Vincent Segonne, Aidan Mannion, Audibert Alexandre, Liu Xingyu, Cécile Macaire, Pupier Adrien, Yongxin Zhou, Mathilde Aguiar, Norré Magali, Felix Herron, Eshkol Taravella Iris, Thomas François, Goeuriot Lorraine, Jérôme Goulian, Mathieu Lafourcade, Benjamin Lecouteux, François Portet, Fabien Ringeval, Maximin Coavoux, Vincent Vandeghinste, Marco Dinarelli, Laura Alonzo-Canul, Amini Massih-Reza, Pierrette Bouillon, Didier Schwab and Esparança-Rodier Emmanuelle
- Un corpus multimodal alignant parole, transcription et séquences de pictogrammes dédié à la traduction automatique de la parole vers des pictogrammes Cécile Macaire, Chloé Dion, Jordan Arrigo, Claire Lemaire, Emmanuelle Esperança-Rodier, Benjamin Lecouteux and Didier Schwab
- Apport de la structure de tours à l'identification automatique de genre textuel: un corpus annoté de sites web de tourisme en français Remi Cardon, Trang Tran Hanh Pham, Julien Zakhia Doueihi and Thomas François
SALON PAREIL DES INDUSTRIELS
Liste des industriels présents (par ordre alphabétique) :
|
Spécialisée dans le traitement des contenus médias (presse écrite, web, et TV/radios), Aday est une société technologique française. L'entreprise héberge toutes ses données médias sur sa propre infrastructure. Nous proposons un historique de données couvrant plus de 40 ans et acquérons quotidiennement 500 000 documents (articles textuels, images...) et 2 500 heures de programmes audiovisuels.
|
|
ARCHEAN Technologies
|
|
LINAGORA
|
|
PostLab est spécialisée dans le développement, le déploiement et la maintenance de démonstrateurs et d’applications web, fondées sur des ressources logicielles ou des méthodes issues de la recherche académique.
Notre mission est de lever les freins à l’accès, au partage et à la réutilisation de ressources logicielles de la recherche scientifique.
Nous accompagnons les chercheuses et les chercheurs dans la diffusion et la mise en valeur de leurs ressources logicielles ou méthodes scientifiques.
SOLUTIONS
Démonstrateur
Transformez vos travaux en démonstrateurs web graphique, accessibles à tous les niveaux d’expertise, et révélez le potentiel de vos recherches.
Cartographie de logiciels académiques
Recensez vos logiciels de manière collaborative et participative, et mettez en lumière votre expertise scientifique.
|
|
LVL est une association soutenue par l'État qui propose : des IA vocales validées dans le respect du droit européen ; des données vocales pour permettre aux développeurs et chercheurs de l’écosystème français d’être concurrentiel au niveau mondial ; une expertise de plus de 30 acteurs institutionnels et entreprises technologiques. Plus d'informations aux liens suivants :
|