Extension d'un système intelligent de surveillance des contenus audio diffusés par les médias : Application aux langues nationales Baatonum, Yoruba et Fongbe
RÉSUMÉ
Nos travaux ont porté sur la conception et réalisation d’un système intelligent de surveillance des contenus audio diffusés par les médias en langues locales Bariba, Yoruba et Fon. L’objectif est d’établir un processus autonome et multifonctionnel de suivi, afin d’assurer la conformité juridique et d’augmenter la qualité des contenus radiodiffusés dans ces langues. Partant d’un système existant pour le contrôle des émission en Français et Anglais dans le contexte béninois, ainsi que de modèles d’IA existants pour le traitement numérique de langage naturel (TLN), le système obtenu prend désormais en compte la détection automatique de langues locales ainsi qu’une possibilité d’analyse lorsque la détection automatique n’est pas correctement effectuée, d’une part. D’autre part, le système permet la transcription des émissions dans leur langue d’origine puis leur traduction en Français afin de procéder à l’analyse du contenu. Notons que nous avons également mis en place des modèles expérimentaux d’IA pour faire la détection automatique de langue dans les émissions en Fon et Bariba d’une part, pour faire les transcription et traduction des émissions en Bariba d’autre part (en raison de la quasi inexistence de modèles d’IA pour ces tâches avec ces deux langues). De la collecte des données à l’obtention des différents modèles expérimentaux, une méthodologie cohérente a été définie afin de permettre l’inclusion de nouvelles langues. Des tests pratiques effectuées, nous avons constaté que nos travaux permettent effectivement le contrôle des contenus en langues locales puis d’ouvrir une piste pour l’inclusion de bien d’autres langues. Cette approche pourrait être intéressante pour aider à l’amélioration de la transcription et traduction des langues béninoises dans des applications diverses comme les traductions audio en direct. Mots-clés : modèles d’IA, TLN, système intelligent, langues béninoises, médias.
Informations projet
- Client IITECH
- Date projet 2023-01-15