David
 
Doukhan

David Doukhan est ingénieur de recherche à l’Institut national de l’audiovisuel (INA) depuis 2016. Il a auparavant été chercheur postdoctoral au Limsi-CNRS et à l’Ircam, et research assistant au MIT. Il est titulaire depuis 2013 d’un doctorat de l’université Paris Sud portant sur l’analyse automatique du langage écrit et oral pour la synthèse de parole.

Il est également titulaire d’un diplôme d’ingénieur informatique Epita spécialisé en intelligence artificielle, et d’un master recherche Atiam (Acoustique, traitement du signal et informatique appliqué à la musique) obtenu à l’Ircam.

Il a contribué à la rédaction d'une vingtaine d'articles de recherche portant sur l’analyse automatique du signal audio (parole, musique, locuteur, prosodie, son 3D), l’intelligence artificielle, les humanités numériques, la linguistique de corpus et la gestion des collections audiovisuelles. Depuis 2020, il coordonne le projet transdisciplinaire Gender Equality Monitor, financé par l’Agence nationale de la recherche (ANR-19-CE38-0012). Ce projet rassemble un consortium de 7 partenaires, dont deux industriels (INA, Deezer), deux laboratoires spécialisé en informatique, traitement du langage et de la parole (Limsi, Lium) et trois laboratoires en sciences humaines (Carism, Lerass, CMW). Le projet GEM vise à décrire de manière automatique les différences de représentation et de traitement existant entre les femmes et les hommes dans les médias en langue française que sont la TV, la radio, la presse écrite et les collections musicales.

Il est intervenant au sein du cursus d'Intelligence artificielle de l'Epita, ainsi que dans les formations proposées par l'INA

Enfin, il est tromboniste et tubiste dans diverses formations punk et fanfares, dont Fabrika Skank.

Publications dans la Revue des médias

À la radio et à la télé, les femmes parlent deux fois moins que les hommes

Pour la première fois, une intelligence artificielle a mesuré le temps de parole des femmes et des hommes dans les médias français. Réalisée sur 700 000 heures de programmes, soit le plus gros volume de données jamais analysé au monde, cette étude dresse un état des lieux, chaîne par chaîne, depuis 2001.