Une étude révèle que le cerveau humain réagit différemment aux voix fausses et aux voix réelles

Une étude révèle que le cerveau humain réagit différemment aux voix fausses et aux voix réelles

Notre cerveau traite-t-il différemment les voix naturelles et les voix deepfakes ? Des recherches menées à l'Université de Zurich indiquent que c'est le cas. Dans une nouvelle étude, les chercheurs ont identifié deux régions du cerveau qui réagissent différemment aux voix naturelles et aux voix fausses. L'ouvrage est publié dans la revue Biologie des communications.

Tout comme les empreintes digitales, nos voix sont uniques et peuvent nous aider à identifier les personnes. Les derniers algorithmes de synthèse vocale sont devenus si puissants qu’il est désormais possible de créer de faux clones qui ressemblent étroitement aux caractéristiques identitaires des locuteurs naturels. Cela signifie qu’il devient de plus en plus facile d’utiliser la technologie deepfake pour imiter les voix naturelles, par exemple pour arnaquer les gens au téléphone ou reproduire la voix d’un acteur célèbre dans un assistant vocal IA.

Cependant, jusqu’à présent, on ne savait pas exactement comment le cerveau humain réagissait face à de telles fausses voix. Notre cerveau les accepte-t-il comme réels ou reconnaît-il les « faux » ? Une équipe de chercheurs de l’Université de Zurich a découvert que les gens acceptent souvent les fausses identités vocales comme réelles, mais que notre cerveau réagit différemment aux voix profondément fausses qu’à celles des locuteurs naturels.

Identité dans des voix deepfakes presque trompeusement similaires

Les chercheurs ont d’abord utilisé des méthodes psychoacoustiques pour tester dans quelle mesure l’identité vocale humaine est préservée dans les voix deepfakes. Pour ce faire, ils ont enregistré les voix de quatre locuteurs masculins, puis ont utilisé un algorithme de conversion pour générer de fausses voix.

Dans l'expérience principale, 25 participants ont écouté plusieurs voix et ont été invités à décider si les identités de deux voix étaient identiques ou non. Les participants devaient soit faire correspondre l’identité de deux voix naturelles, soit celle d’une voix naturelle et d’une voix fausse.

Les deepfakes ont été correctement identifiés dans deux tiers des cas. „Cela montre que les fausses voix actuelles ne peuvent pas imiter parfaitement une identité, mais ont le potentiel de tromper les gens”, déclare Claudia Roswandowitz, première auteure et postdoctorante au Département de linguistique informatique.

Le système de récompense réagit aux voix naturelles mais pas aux deepfakes

Les chercheurs ont ensuite utilisé des techniques d’imagerie pour examiner quelles régions du cerveau réagissaient différemment aux voix fausses et aux voix naturelles. Ils ont réussi à identifier deux régions capables de reconnaître les fausses voix : le noyau accumbens et le cortex auditif.

„Le noyau accumbens est un élément crucial du système de récompense du cerveau. Il était moins actif lorsque les participants étaient chargés de faire correspondre l'identité entre les deepfakes et les voix naturelles”, explique Roswandowitz. En revanche, le noyau accumbens a montré beaucoup plus d’activité lorsqu’il s’agissait de comparer deux voix naturelles.

Le cortex auditif distingue la qualité acoustique des voix naturelles et des voix fausses

La deuxième région cérébrale active lors des expériences, le cortex auditif, semble répondre aux différences acoustiques entre les voix naturelles et les deepfakes. Cette région, qui traite les informations auditives, était plus active lorsque les participants devaient faire la distinction entre les deepfakes et les voix naturelles.

„Nous soupçonnons que cette région réagit à l'imitation imparfaite des voix deepfakes pour tenter de compenser les informations acoustiques manquantes dans les deepfakes”, explique Roswandowitz. Moins une fausse voix était perçue de manière naturelle et sympathique par rapport à la voix naturelle correspondante, plus les différences d'activité dans le cortex auditif étaient grandes.

Les voix Deepfake semblent moins agréables à écouter, presque quelle que soit la qualité du son acoustique. „Les humains ne peuvent donc être que partiellement trompés par les deepfakes. Les mécanismes neuronaux identifiés lors du traitement des deepfakes mettent particulièrement en évidence notre résilience face aux fausses informations, que nous rencontrons plus fréquemment dans la vie quotidienne”, explique Roswandowitz.