Passer au contenu principalPasser à la recherchePasser au pied de page
Voici tout ce qu'il faut comprendre de Gemini, l'IA développée par Google.
Smartphones

Gemini : présentation de l'IA de Google qui va faciliter la vie des utilisateurs de smartphone

Voici tout ce qu'il faut comprendre de Gemini, l'IA développée par Google. © Google

Alors que le vaste sujet de l’intelligence artificielle n’a jamais fait couler autant d’encre, le géant de la Tech Google s’est également lancé à son tour dans la course à l’IA. Si vous n’avez pas tout compris à Gemini, l'IA développée par la firme de Mountain View, pas de panique : SFR Actus vous explique tout ce qu’il faut savoir.

Le 14 mai dernier, Google dévoilait son lot d’innovations lors de sa fameuse conférence Google I/O. Si la firme de Mountain View livrait les premières infos au sujet d’Android 15, la nouvelle version de son OS destiné aux smartphones Android, c’est surtout Gemini, l’intelligence artificielle de Google, qui était la véritable tête d’affiche de la conférence.

Qu’est-ce que Gemini ?

Concrètement, qu’est-ce que Gemini ? Lorsqu’on se rend sur le chatbot Gemini (à l’image de ChatGPT via Open AI) et qu’on lui pose directement la question, voici ce que l’intelligence artificielle maison de Google nous répond :

''Google Gemini, également connu sous le nom de Gemini AI ou simplement Gemini, est un modèle d'intelligence artificielle (IA) de type réseau neuronal multimodal génératif développé par Google AI et DeepMind. Cet outil d'intelligence artificielle conversationnelle est un modèle de langage avancé capable de générer du texte, de traduire des langues, d'écrire différents types de contenu créatif et de répondre à vos questions de manière informative.''

Similaire et même concurrent direct de ChatGPT, Gemini remplace définitivement et totalement Bard, le premier chatbot de Google arrivé en février 2023. Lancé avant le début de l’année 2024, Gemini est toutefois bien plus qu’un simple chatbot. L’outil rassemble en effet plusieurs modèles de langage (LLM) capables de comprendre le langage naturel, les images, l’audio, la vidéo et même le code.

En intégrant de nouvelles informations et en affinant ses capacités au fil du temps, Gemini va apprendre et s’améliorer de façon continue. Se basant et puisant dans les avancées technologiques issues des recherches menées par Google Brain et DeepMind, Gemini se dote d'un triple champ d’action :

  • Traitement du langage naturel (NLP), afin de suivre vos instructions et répondre à vos demandes de manière réfléchie, générer du texte de manière fluide et cohérente, traduire des langues ou encore écrire du contenu créatif et s’adapter à divers styles d'écriture.
  • Génération d'images et de vidéos : à partir de descriptions textuelles, qu’elles soient complexes ou simples, l’outil de Google va pouvoir créer des images et des vidéos réalistes.
  • Raisonnement et résolution de problèmes : afin d’aider à une prise de décision dans un domaine complexe (tel qu’un domaine scientifique par exemple), Gemini est capable de raisonner sur des informations complexes afin de résoudre ou d’analyser des problèmes logiques.

Une intégration en profondeur dans l’écosystème Android

Lors de l’ouverture de la Google I/O le 14 mai dernier, le directeur général de Google Sundar Pichai a immédiatement donné le ton : remplaçant Google Assistant, Gemini va progressivement s’intégrer dans la nouvelle version d’Android, soit Android 15, dévoilée dans sa version définitive lors de la sortie des Pixel 9.

L’intégration en profondeur s’effectue dans les applications phares de Google : Gmail, Calendar, Tasks, Docs, Drive ou encore Keep. L’objectif est simple : faciliter la vie de l’utilisateur au quotidien. Par exemple, vous pouvez prendre en photo une liste d’évènements et solliciter Gemini afin qu’elle les intègre directement à votre agenda. Utilisant tout le potentiel de l’écosystème du géant de la Tech, Gemini navigue entre toutes les applications natives de Google, de quoi garantir praticité et fluidité.

Gemini décliné en quatre modèles

En fonction de la complexité des demandes et des besoins, Google a décidé de décliner son IA Gemini en quatre modèles qui diffèrent par leur capacité et leurs fonctionnalités :

  • Gemini Nano, soit la version ''allégée'' de Gemini. Concrètement, Gemini Nano est optimisé pour fonctionner directement sur les appareils mobiles comme les smartphones, sans forcément nécessiter de connexion internet.
  • Gemini Pro, le modèle LLM alimentant le chatbot Gemini de Google. Cette version plus lourde et complète peut traiter des données en grande quantité (approximativement 700 000 mots, 30 000 lignes de code, ou 11 heures d'audio). C'est la version qui est la plus mise en avant par Google et sûrement celle qui est la plus complète et multi-tâche.
  • Gemini Flash possède plus ou moins les mêmes capacités que Gemino Pro en ce qui concerne la quantité de données analysables, à la seule différence qu'il est conçu pour être beaucoup plus rapide. En contrepartie, il perd un peu en précision, mais il se rattrape par son coût moins élevé. Gemini Flash se destine plutôt aux développeurs.
  • Gemini Ultra, soit la version la plus premium et aboutie de Gemini. Ce modèle se destine à des tâches très complexes, comme l’analyse d’articles scientifiques ou la résolution de problèmes avancés qu'ils soient mathématiques, physiques ou même médicaux. Gemini Ultra a été confronté à différents problèmes complexes sur 57 sujets différents : 90 % ont été résolus contre seulement 86,4 % pour GPT-4 et 89,8 % par un panel d'experts humains.

Le meilleur de Gemini pour tous dans Gemini Advanced

Bien que, par défaut, ce soit Gemini Nano qui soit intégré aux applications et appareils Google, la firme de Mountain View donne accès aux autres modèles contre rémunération. D'abord, Gemini Flash et Ultra sont disponibles via Google AI Studio, un API, et Vertex AI, un outil de machine learning destiné aux ingénieurs. Ces derniers sont alors dédiés bien plus aux entreprises.

Celui qui nous intéresse toutefois le plus ici, c'est Gemini Pro, l'IA "tout-terrain" du géant américain. Cette dernière, par ses différentes capacités et son adaptabilité, peut être très utile, même pour le grand public. Pour en profiter, il faut souscire à Gemini Advanced. Cette option, à 21,99€/mois, confère donc l'accès à Gemini Pro, qui peut traiter jusqu'à un million de jetons. Le nombre de jetons est relatif au nombre de mots qu'une IA peut traiter en une seule fois ou un prompt. Par exemple, 100 jetons équivalent à environ 75 mots. A titre de comparaison, Chat GPT (GPT-4) peut traiter 128 000 jetons, soit presque 8 fois moins.

Ainsi, l'IA de Google peut vous permettre de traiter 1500 pages en une seule fois. Grâce à Gemini Advanced et Gemini Pro, vous pourrez importer des documents types Google Docs ou PDF pour les faire analyser, commenter, ou résumer... Même les feuilles de calcul pourront être traitées afin d'obtenir des graphiques ou d'autres informations. En bonus, la souscription vous offre également 2 To de stockage dans Google One.

Jeudi 14 novembre 2024, la firme de Mountain View annonçait la grande nouvelle : l’application Gemini débarque (enfin) sur l’App Store d’Apple, à destination donc des smartphones de la marque à la pomme. Profitant d’une expérience optimisée, les utilisateurs vous pouvoir ''accéder facilement aux fonctionnalités qui boostent l’apprentissage, la collaboration et la productivité''. Directement depuis leur iPhone, ils pourront échanger de vive voix avec Gemini Live, décliné pour l’heure en 10 voix et 10 langues différentes.

Évidemment, il sera possible de solliciter l’IA de Google en lui posant directement une question, ou même en joignant un schéma, un graphique ou une feuille de calcul. Plus que jamais axée sur l’apprentissage et la connaissance, l’intelligence artificielle vous guidera tout en s’adaptant à votre style d’apprentissage. Il sera même possible, sous la forme de quiz, de demander à Gemini de tester ses connaissances – une fonctionnalité innovante et pratique, surtout avant un examen ou une présentation.

Enfin, et au sein même d’une conversation avec l’IA, il sera possible d’accéder à l’ensemble des applications Google depuis l’application Gemini. Ainsi, vous retrouverez, de manière intuitive et naturelle, le meilleur de YouTube, Google Maps, Gmail ou encore Agenda au sein de l’application Gemini.

C’est désormais à vous de tester les fonctionnalités infinies de Gemini, même sur votre iPhone !

Sources : Gemini, Les Numériques, Frandroid, Google

Arthur Mathur
Arthur Mathur Rédacteur