Passer au contenu principalPasser à la recherchePasser au pied de page
Avec son intelligence artificielle Gemini, Google transforme tous vos fichiers en podcasts animés et interactifs.
News

Gemini : comment Google transforme vos fichiers en podcasts animés par l'IA

Avec son intelligence artificielle Gemini, Google transforme tous vos fichiers en podcasts animés et interactifs. © Getty Images

Le 18 mars 2025, Google a dévoilé une nouvelle fonctionnalité basée sur son intelligence artificielle Gemini pour révolutionner l'expérience utilisateur audio. Grâce à celle-ci, vous pouvez dès à présent transformer tous vos fichiers en podcasts générés et animés par des robots. SFR Actus vous explique comment cela fonctionne.

Dans un monde où l'intelligence artificielle ne cesse de repousser les limites de l'innovation, les géants de la Tech redoublent continuellement d'ingéniosté pour étoffer les fonctionnalités de leurs systèmes. Et c'est récemment Google qui a frappé fort, avec une nouvelle annonce pour son IA ''maison'', Gemini. L'entreprise américaine vient de révéler de nouvelles fonctionnalités pour l'enrichir, avec la naissance de Canvas, un nouvel espace interactif conçu pour simplifier la création et l'édition de documents et de codages. On y retrouve également l'intégration d'Audio Overviews, une fonction issue de Notebook LM, permettant de donner vie aux fichiers sous forme de discussions dynamiques et engageantes, à l'image de podcasts. Une avancée audio, qui marque une nouvelle étape significative dans l'évolution de l'interaction entre l'Homme et la machine, et la façon de consommer du contenu.

Google dévoile un podcast animé par l'IA grâce à Gemini

La dernière innovation de Google propulse Gemini dans une nouvelle dimension dans le domaine de la création audio interactive. La fonctionnalité baptisée "Audio Overviews", soit "Résumé audio" en français, a initialement vu le jour dans l'application NotebookLM par Google. Cette dernière permet aux utilisateurs de transformer des recherches web, des documents ou des diapositives en une discussion audio captivante et engageante. L'intelligence va plus loin qu'une simple retranscription audio, puisqu'elle convertit les données en une conversation naturelle entre deux animateurs virtuels, comme lors d'un épisode de podcast. Cette technologie permet de simuler une véritable émission de radio, avec des transitions fluides et des interactions réalistes entre les présentateurs. Ainsi, ils peuvent résumer des contenus, établir des liens entre les différents sujets et donner vie à un échange naturel.

L'aspect interactif de cette fonctionnalité est tout aussi révolutionnaire. En effet, l'utilisateur qui devient un auditeur peut poser des questions en temps réel, comme s'il prenait part à une émission en direct. L'intelligence artificelle simule alors un appel auditeur, intégrant de manière fluide la réponse dans la conversation. Ainsi, Audio Overviews offre aux utilisateurs la possibilité d'apprendre de manière ludique et productive.

Comment accéder à la fonctionnalité Audio Overviews ?

La fonctionnalité "Audio Overviews" est disponible pour les abonnés Gemini et Gemini Advanced du monde entier. Google a d'ailleurs plus récemment annoncé que cette dernière était dorénavant proposée en français et dans plus de 50 langues différentes. Une extension permettant à un large public de profiter de cette innovation dans sa langue de prédilection. "Audio Overviews" est accessible directement depuis l'application Gemini ou depuis une page web.

Pour l'utiliser, il suffit donc de vous rendre dans votre application ou sur votre page de recherche, et suivre ces quelques étapes :

  • Téléchargez votre fichier dans Gemini ou saisissez votre recherche ;
  • Cliquez sur l’option "Audio Overviews" qui apparaît au-dessus de la zone de saisie de texte ;
  • Gemini génère automatiquement une discussion audio entre deux présentateurs virtuels qui analysent et commentent les informations présentes dans votre fichier.

Avec le lancement de cette fonctionnalité révolutionnaire de podcast animé par l'IA, Google offre aux utilisateurs la possibilité de consommer l'information d'une toute autre façon.

Sources : Numerama, Google

Charline Tchikaya Boukhelifa
Charline Tchikaya Boukhelifa Rédactrice