Google a déjà ce qu’il faut face à Bing ChatGPT

La capacité de ChatGPT à répondre aux questions de manière conversationnelle et directe a conduit certains à proclamer que le chat IA tuera le moteur de recherche traditionnel.

Google a déjà ce qu’il faut pour contrer ChatGPT dans Bing

Sommaire


Google réagit sérieusement à cela, et – d’après ce qu’il a déjà montré – devrait être plus que capable de rivaliser avec Microsoft qui a annoncé intégrer ChatGPT à son moteur Bing Search.

Toutefois, la question centrale reste l’expérience utilisateur.

Questions et réponses

Fondamentalement, la mission de Google « d’organiser l’information mondiale et de la rendre universellement accessible et utile » peut être divisée en deux composantes.

Les utilisateurs posent des questions et Google fournit des réponses. Les requêtes – d’abord des mots-clés, puis des questions formulées naturellement – étaient à l’origine tapées dans une box et plus tard elles ont été prononcées (recherche vocale).

Les réponses ont commencé par des liens vers des sites Web qui pourraient contenir des informations pertinentes, mais qui ont également évolué.

Google a commencé à fournir des réponses immédiates (avec ses Featured Snippets) à des questions plus simples qui sont plus ou moins des faits, en utilisant des informations provenant de bases de données, de listes et, le plus souvent, de Wikipédia.

Ce passage aux réponses directes coïncide avec les smartphones, et leurs écrans relativement plus petits, devenant l’appareil principal. Puis sont venus les appareils portables et d’autres appareils audio comme les haut-parleurs et les écrans intelligents.

D’autres questions ne peuvent pas être répondues facilement, mais Google essaie toujours et utilise quelque chose appelé « extrait optimisé » (ou featured snippet), ou des citations directes d’un site Web qui, selon lui, répondra à votre question.

Ces dernières années, Google a été critiqué pour ces extraits, de tous les côtés. Il choisit parfois de citer une source qui est clairement fausse, tandis que les propriétaires de ce contenu reprochent à Google de voler des clics (recherche à zéro clic) pour garder les utilisateurs sur son moteur de recherche.

Ce même type de question complexe est quelque chose dans lequel ChatGPT excelle, tout comme ChatSonic qui fait déjà mieux, en étant capables de générer la réponse pour beaucoup de choses au lieu de vous envoyer ailleurs sur le Web.

Les premiers utilisateurs ont pris cette habitude et croient que l’avenir de la recherche impliquera d’obtenir des réponses directes tout le temps par le biais d’un va-et-vient avec la possibilité de demander des suivis.

En fait, ChatGPT et ChatSonic sont également en mesure de poser des questions pour vous amener à clarifier votre requête si nécessaire. Pendant ce temps, ils peuvent également déboguer du code, écrire des essais (avec la possibilité de spécifier des paragraphes), résumer, expliquer et bien plus encore.

Et c’est alors que Microsoft débarque et annonce que fin Mars 2023, ChatGPT sera nativement ajouté à son moteur de recherche Bing pour initier des recherches et réponses via l’intelligence artificielle conversationnelle.

Ce qui, vous le devinez aisément, aurait dû pousser Google à réagir car c’est la domination sans partage de son moteur Google Search qui serait a priori ainsi taquinée.

Mais, ce que beaucoup ignorent, c’est que Google dispose déjà de toutes ces fonctionnalités IA pour maintenir sa place de leader dans la recherche internet.

Qu’est-ce que Google a pour ne pas s’inquiéter ?

3 modèles de langage permettent actuellement à Google de tenir la dragée haute à qui voudrait le défier.

LaMBDA

Google travaille sur la même technologie de modèle de langage sur lequel repose ChatGPT depuis un certain temps, bien que ce soit d’une manière moins tape-à-l’œil.

Cela dit, Google a beaucoup travaillé sur la compréhension du langage naturel ou natural language understand (NLU) et les grands modèles de langage.

LaMDA (Language Model for Dialog Applications) est « l’IA conversationnelle la plus avancée à ce jour » de Google. Il a été dévoilé lors de l’ I/O 2021 « pour converser sur n’importe quel sujet », avec la mise en garde qu’il était encore en phase de R & D.

LaMDA (Language Model for Dialog Applications) est « l’IA conversationnelle la plus avancée à ce jour » de Google. Il a été dévoilé lors de l’ I/O 2021 « pour converser sur n’importe quel sujet », avec la mise en garde qu’il était encore en phase de R & D.

Les exemples de Google parlant à la planète Pluton et à un avion en papier étaient destinés à démontrer comment LaMDA a « relevé plusieurs des nuances qui distinguent les conversations ouvertes », y compris des réponses sensées et spécifiques qui encouragent d’autres allers-retours.

D’autres qualités recherchées par Google sont « intéressantes » (si les réponses sont perspicaces, inattendues ou spirituelles) et la « factualité », ou s’en tenir aux faits.

Un an plus tard, LaMDA 2 a été annoncé et Google a commencé à permettre au public de découvrir trois exemples spécifiques de LaMDA avec l’application AI Test Kitchen.

Outre LaMDA, Google a mis en évidence des modèles multimodaux (multimodal models) qui « permettent aux gens de poser naturellement des questions sur différents types d’informations » avec MUM (Multitask Unified Model).

Il convient de noter l’exemple de requête proposé par Google qui ne peut pas être répondu par un moteur de recherche aujourd’hui, mais c’est quelque chose que cette nouvelle technologie peut aborder :

J’ai fait de la randonnée sur le mont Adams et je veux maintenant faire de la randonnée sur le mont Fuji l’automne prochain, que dois-je faire différemment pour me préparer ?

Mum comprendrait que vous comparez deux montagnes, et que la plage horaire que vous avez fournie est la saison des pluies du mont Fuji, nécessitant ainsi un équipement étanche.

Il pourrait faire apparaître des articles écrits en japonais où il y a plus d’informations locales, alors que l’exemple le plus impressionnant était plus ou moins lié à Google Lens :

Alors maintenant, imaginez prendre une photo de vos chaussures de randonnée et demander : « Puis-je les utiliser pour faire de la randonnée sur le mont Fuji? »

MUM serait en mesure de comprendre le contenu de l’image et l’intention derrière votre requête et vous faire savoir que vos chaussures de randonnée fonctionneraient bien, avant de vous diriger vers une liste d’équipements recommandés et un blog sur le Mont Fuji.

C’était encore une requête exploratoire, mais plus concrètement, Google a annoncé comment il ajoute MUM à Lens afin que vous puissiez prendre une photo d’une partie cassée de votre vélo (dont vous n’êtes pas au courant) et obtenir des instructions sur la façon de la réparer.

PaLM

Si MUM permet de poser des questions avec une variété de supports et que LaMDA peut poursuivre les conversations, PaLM (Pathways Language Model) est ce qui peut répondre aux questions. Il a été annoncé en Avril 2022 et a reçu une mention sur scène à I/O.

Si MUM permet de poser des questions avec une variété de supports et que LaMDA peut poursuivre les conversations, PaLM (Pathways Language Model) est ce qui peut répondre aux questions. Il a été annoncé en Avril 2022 et a reçu une mention sur scène à I/O.

PaLM est capable de :

Répondre aux questions, faire des analyses sémantiques, des proverbes, de l’arithmétique, complétion de code, connaissances générales, compréhension de lecture, résumé, chaînes d’inférence logique, raisonnement de bon sens, reconnaissance de formes, traduction, dialogue, explications de blagues, assurance qualité physique et compréhension du langage.

Si MUM permet de poser des questions avec une variété de supports et que LaMDA peut poursuivre les conversations, PaLM (Pathways Language Model) est ce qui peut répondre aux questions. Il a été annoncé en Avril 2022 et a reçu une mention sur scène à I/O.

PaLM est alimenté par une architecture d’IA (intelligence artificielle) de nouvelle génération appelée Pathways qui peut « former un seul modèle à faire des milliers ou des millions de choses »par rapport à l’approche actuelle hautement individualisée.

Jusqu’aux produits Google avec l’IA

Lorsque Google a annoncé LaMDA en 2021, Sundar Pichai a déclaré :

Ses capacités de conversation naturelles ont le potentiel de rendre l’information et l’informatique radicalement plus accessibles et plus faciles à utiliser.

Google Assistant, Search et Workspace ont été spécifiquement nommés en tant que produits dans lesquels Google espèrent « intégrer de meilleures fonctionnalités conversationnelles ».

Google pourrait également offrir « des capacités aux développeurs et aux entreprises clientes ».

Dans ce monde post-ChatGPT, plus de quelques personnes ont remarqué que les réponses directes pourraient nuire au modèle commercial basé sur la publicité de Google, l’idée étant que les gens n’auraient plus besoin de cliquer sur les liens s’ils avaient déjà la réponse.

Dans les exemples fournis par Google, rien n’indique qu’il veuille arrêter de créer des liens vers du contenu.

Il y a de gros problèmes de sécurité et de précision, que Google a toujours soulignés lors de la démonstration. Le fait que ces modèles « peuvent inventer des choses » semble être le plus gros goulot d’étranglement plus que tout.

Pendant ce temps, il n’est pas clair si les gens veulent que chaque interaction avec un moteur de recherche soit une conversation. Cela dit, Google a reconnu en interne que l’approche conversationnelle « répond vraiment à un besoin que les gens semblent avoir ».

Google serait en « code rouge » sur ChatGPT et aurait réaffecté diverses équipes pour travailler sur des produits d’IA concurrents et des démos.

Est-ce que cela signifie que LaMDA, MUM et PaLM vont être intégrés de manière proéminente dans les plus grands produits de Google ? La question reste posée…

En mai dernier, Sundar Pichai a réitéré à quel point « la conversation et le traitement du langage naturel sont des moyens puissants de rendre les ordinateurs plus accessibles à tous ».

De tout ce que l’entreprise a prévu, l’objectif final est de faire en sorte que Google Search soit capable de répondre aux questions comme un humain.

Sans surprise, Google a la technologie pour y arriver, mais l’éternel défi de l’entreprise est de déplacer la R & D dans des produits réels, et se précipiter ne semble pas être sage pour le moteur de recherche qui estime que le monde doit être toujours correct.

Source : 9to5google