Inauguration de la transcription automatique des programmes TV/video

Le 1 mars 2010

Depuis décembre dernier, FRANCE 24 propose sur son site Internet une nouvelle expérience de télévision interactive : le lecteur HD. Retour d'experience, par Mikiane.

Mikiane fait partie des membres fondateurs de la soucoupe. Responsable des nouveaux médias à France 24, il présente dans ce billet un projet chapeauté au sein du Lab de France 24. Analyse et explications par un insider, c’est le moins que l’on puisse dire /-)

Titre original :

Demo: inauguration de la transcription automatique des programmes TV/video live

J’ai déja eu l’occasion de parler de ce projet mené au sein du Lab de FRANCE 24 depuis plus de 6 mois. Vous retrouverez les différentes étapes de la conception et réalisation de cette expérimentation dans les billets suivants:

Aujourd’hui, cette expérimentation vit une nouvelle étape grâce à un partenariat avec Yacast Media, Exalead et Vecsys: le lecteur vidéo haut débit de FRANCE 24 permet à présent de transcrire automatiquement sous forme de texte les 24 dernières heures d’antenne.

Depuis décembre dernier, FRANCE 24 propose sur son site Internet une nouvelle expérience de télévision interactive : le lecteur HD. Ce lecteur haut débit offre aux internautes la possibilité de « contrôler le direct », car il peut balayer les 24 dernières heures de programmes en quelques secondes, en déplaçant le curseur sous l’image sur un simple navigateur web.

Fort de cette innovation, le LAB de FRANCE 24 fait aujourd’hui évoluer cette application en y ajoutant une nouvelle fonctionnalité permettant de faire figurer automatiquement sur ce même lecteur chaque mot prononcé à l’antenne, depuis les commentaires des présentateurs, les récits de reportages jusqu’aux interviews de tous les invités.

Cette première technologique est basée sur une analyse sémantique automatique des scripts extraits de chaque vidéo. Elle permet de générer en 24 heures, sans intervention humaine, une variété de mots-clés, de lieux, de noms de personnalités ou d’organisations citées sur FRANCE 24 et donc, d’en optimiser le référencement.

L’algorithme de transcription permet dans la majorité des cas de générer un texte fidèle au discours prononcé à l’antenne. Cette capacité que nous avons désormais à retranscrire le flux en léger différé (quelques minutes), ouvre des possibilités considérables. Certes les textes obtenus contiennent parfois des erreurs, mais demain, l’ensemble des contenus pourraient être découpés automatiquement, enrichis en métadonnées, sous-titrés, et éventuellement traduits automatiquement. A court terme, cette technologie peut grandement améliorer le référencement de nos contenus. Elle offre un meilleur confort de lecture quand l’audio pose des difficultés et en particulier pour les malentendants. Enfin, elle peut être une aide potentielle dans le cadre de l’apprentissage des langues.

>> Un aperçu du prototype incluant cette toute nouvelle fonctionnalité est accessible sur le LAB de FRANCE 24

» Article initialement publié sur Mikiane.com

Laisser un commentaire

Derniers articles publiés