Invité du podcast de Cleo Abram, Demis Hassabis, le patron de Google DeepMind, est longuement revenu sur l'émergence de l'IA générative commerciale en 2022, qui a d'abord pris Google par surprise. Le prix Nobel de chimie s'interroge sur l'intérêt d'avoir publié aussi rapidement cette technologie au grand public : les laboratoires auraient peut-être utilisé leur temps autrement si la lutte acharnée pour avoir le meilleur modèle n'avait pas commencé.
Invité du podcast de Cleo Abram, Demis Hassabis, le patron de Google DeepMind, est longuement revenu sur l'émergence de l'IA générative commerciale en 2022, qui a d'abord pris Google par surprise. Le prix Nobel de chimie s'interroge sur l'intérêt d'avoir publié aussi rapidement cette technologie au grand public : les laboratoires auraient peut-être utilisé leur temps autrement si la lutte acharnée pour avoir le meilleur modèle n'avait pas commencé.
DeepSeek fait trembler la sphère IA, et tout le monde attendait la réaction de Google. Ainsi, Sundar Pichai, son CEO, vient enfin de s’exprimer sur le sujet… et sa réponse est loin d’être celle que vous attendiez ! Plutôt que d’entrer en mode rivalité, il joue la carte de la reconnaissance… tout en préparant une riposte.
DeepSeek, la startup chinoise, s’est récemment fait remarquer avec son modèle IA prometteur et il semble déjà bousculer les géants du secteur. Alors, Google, leader historiqu
DeepSeek fait trembler la sphère IA, et tout le monde attendait la réaction de Google. Ainsi, Sundar Pichai, son CEO, vient enfin de s’exprimer sur le sujet… et sa réponse est loin d’être celle que vous attendiez ! Plutôt que d’entrer en mode rivalité, il joue la carte de la reconnaissance… tout en préparant une riposte.
DeepSeek, la startup chinoise, s’est récemment fait remarquer avec son modèle IA prometteur et il semble déjà bousculer les géants du secteur. Alors, Google, leader historique de l’IA, allait-il paniquer ? Minimiser l’impact de cette nouvelle concurrence ?
Sundar Pichai a plutôt surpris tout le monde en saluant le travail accompli par DeepSeek. Mais bien sûr tout en précisant que Google reste bien armé dans cette bataille.
Entre admiration et stratégie, Google Livre son point de vue sur DeepSeek
Comme beaucoup, j’attendais aussi avec impatience que Sundar Pichai, le CEO de Google, se prononce sur DeepSeek. Et franchement, sa réaction m’a surpris !
Lors du World Government Summit à Dubaï, ce 12 février, Sundar Pichai a reconnu que DeepSeek avait fait du « très bon travail ». Il n’y a donc pas eu de dénigrement, ni de rivalité affichée, juste une reconnaissance honnête du fait que l’IA n’a pas de frontières et que de gros progrès sont faits partout dans le monde.
Toutefois, Google ne se laisse pas impressionner si facilement. Demis Hassabis, le boss de DeepMind, a mis un petit tacle en affirmant que les coûts annoncés par DeepSeek étaient probablement sous-estimés.
Selon lui, ils ne prennent en compte que la dernière phase d’entraînement et pas tout le processus. DeepSeek aurait donc peut-être un peu enjolivé les chiffres.
Par ailleurs, Sundar Pichai n’a pas tardé à rappeler que Google reste un géant dans le domaine de l’IA. D’après lui, leur modèle Gemini est tout aussi rentable que DeepSeek. Et pour bien marquer le coup, Google prévoit de claquer… 75 milliards de dollars en IA cette année !
Mais ce n’est pas sans conséquences ! Cette annonce a fait plonger les actions de Google de 8 % en post-marché. Eh oui, les investisseurs ne sont pas toujours fans des dépenses XXL, même quand c’est pour dominer le monde technologique.
Qu’en pensez-vous ? Google peut-il vraiment rester leader face à DeepSeek et d’autres startups innovantes ? Donnez votre avis dans les commentaires !
Google lance Gemini 2.0 : la deuxième version de son modèle IA. Il peut désormais raisonner, produire des images ou de l’audio, et se multiplier pour mener des tâches en toute autonomie. Avec cette nouvelle version, Google répond à la concurrence et termine 2024 en entrant dans la guerre des agents IA !
En mars 2023, quelques mois après le lancement triomphal de ChatGPT par OpenAI, Google lançait à son tour son propre chatbot IA : Gemini.
Initialement baptisé Bard, l’outil a changé de nom
Google lance Gemini 2.0 : la deuxième version de son modèle IA. Il peut désormais raisonner, produire des images ou de l’audio, et se multiplier pour mener des tâches en toute autonomie. Avec cette nouvelle version, Google répond à la concurrence et termine 2024 en entrant dans la guerre des agents IA !
En mars 2023, quelques mois après le lancement triomphal de ChatGPT par OpenAI, Google lançait à son tour son propre chatbot IA : Gemini.
Initialement baptisé Bard, l’outil a changé de nom et a connu son lot de controverses. Il s’était notamment illustré par son refus de représenter positivement des personnes blanches, même lorsqu’il s’agissait de personnages historiques.
Néanmoins, au fil du temps et au gré des nouvelles versions, Gemini s’est hissé parmi les chatbots les plus réputés aux côtés de ChatGPT-4o ou Anthropic Claude.
À présent, comme une réponse à OpenAI et ses nouveaux outils lancés dans le cadre des 12 jours de « Shipmas » de décembre 2024, Google vient d’annoncer Gemini 2.0 !
Gemini 2 Flash : un premier modèle très léger, mais plus puissant que Gemini Pro 1.5 !
Il s’agit d’une nouvelle famille de modèles IA, et la première version déployée est Gemini 2 Flash. Ce modèle est particulièrement rapide et léger, mais il s’avère aussi très puissant.
Ses performances surpassent la version précédente sur presque tous les benchmarks ! Selon Google, il est deux fois plus rapide que Gemini Pro 1.5.
D’après Demis Hassabis, le CEO de Google DeepMind, Gemini 2.0 Flash est un modèle de type « bête de somme » avec une faible latence et des performances accrues.
Il surpasse aussi tous les précédents modèles Gemini en termes deraisonnement et de compréhension visuelle. Il peut également traduire le discours audio en temps réel, et analyse mieux les vidéos que Gemini Pro 1.5.
On peut s’attendre au lancement prochain d’une version Pro, comme pour le premier Gemini. Ce nouveau modèle va alimenter tous les produits Gemini dont l’application Android, le chatbot et les diverses expériences…
Une IA nativement multimodale et capable de raisonnement
Selon le CEO de Google , Sundar Pichai, Gemini 2 est doté de capacités avancées de raisonnement. Or, ces facultés seront prochainement incorporées à la fonctionnalité « AI Overviews » de Google Recherche pour offrir des réponses plus précises aux questions complexes à étapes multiples.
Par exemple, si vous bloquez face à un problème mathématique, vous pouvez uploader une photo de l’équation et AI Overview vous guidera vers la solution étape par étape.
De même, pour déboguer un code, il suffit de décrire le problème et AI Overview vous expliquera sa cause et rédigera une version corrigée.
Non seulement capable de raisonnement avancé comme OpenAI o1, Gemini 2 est une IA multimodale capable de produire du texte, du discours audio, des images et bien plus encore.
Jusqu’à présent, le premier Gemini avait besoin de faire appel à d’autres modèlescomme Imagen pour effectuer ce type de tâches.
Thrilled to kick off the Gemini 2.0 era with Gemini 2.0 Flash, an update to our workhorse model that outperforms even 1.5 Pro at twice the speed. It has really great multilingual skills, and can natively call tools, like Google Search. It’s the first release in the Gemini 2.0… pic.twitter.com/pjndTAf1PY
D’après Google, Gemini 2 marque le début de « l’ère de l’IA agentique ». Si vous ne suivez pas l’actualité de l’intelligence artificielle, vous vous demandez peut-être ce que signifie ce terme…
Un agent IA est une entité capable d’effectuer des tâches sans intervention humaine. Il suffit de formuler une requête initiale, et l’agent se charge lui-même de poursuivre les différentes étapes jusqu’à apporter une réponse satisfaisante !
Ce type d’IA est en effet capable de créer différentes versions de lui-même pour effectuer plusieurs fonctions simultanément. Parallèlement au lancement de Gemini 2, Google a lancé un nouvel outil dénommé Deep Research et capable de chercher sur le web à votre place.
Le but ? Vous fournir un rapport sur un sujet complexe. Ce nouvel outil est directement incorporé à Gemini Advanced.
L’ère agentique est considérée comme la prochaine étape dans l’évolution de l’IA, après l’ère des chatbots avec lesquels il était seulement possible de converser ou de créer du contenu.
En réalité, ce nouvel arc a débuté avec l’arrivéed’OpenAI o1. Avec Gemini 2, Google rejoint à son tour OpenAI, Microsoft, Anthropicet Salesforce qui ont également lancé leurs agents.
Aux yeux d’Hassabis, «l’application pratique des agents IA est un domaine de recherche plein de possibilités passionnantes. Nous explorons cette nouvelle frontière avec une série de prototypes qui peuvent aider les gens à accomplir des tâches et à faire les choses ».
Cette série de produits inclut aussi le Project Astra : un assistant virtuel universel initialement dévoilé pendant la Google I.O. Elle intègre aussi le nouveau Project Mariner, visant à explorer le futur de l’interaction humain-agent en commençant par votre navigateur.
De son côté, Jules est un agent de code conçu pour aider les développeurs. Vous l’aurez compris : les agents seront la principale innovation du début 2025 dans le domaine de l’intelligence artificielle !
Comment tester Gemini 2.0 ?
Dans un premier temps, Gemini 2 n’est disponible que pour les développeurs, ou en tant que modèle expérimental pour les abonnés à Gemini Advanced.
Si vous êtes abonné, vous pouvez choisir Gemini 2.0 Flash dans le menu déroulant dédié aux choix de modèle. Malgré sa qualification expérimentale, il fonctionne très bien selon les premiers retours.
De leur côté, les développeurs peuvent l’utiliser dans l’API Gemini ou le Google Gemini AI Studio. Au fil de l’année 2025, Gemini 2.0 sera progressivement incorporé à tous les produits Google…
We’re kicking off the start of our Gemini 2.0 era with Gemini 2.0 Flash, which outperforms 1.5 Pro on key benchmarks at 2X speed (see chart below). I’m especially excited to see the fast progress on coding, with more to come.
Alors, qu’en pensez-vous ? Gemini 2.0 peut-il permettre à Google de prendre la tête de la course à l’IA ? Ou bien le géant du web est-il condamné à courir derrière OpenAI pour se maintenir à flot ? Partagez votre avis en commentaire !
OpenAI prépare une nouvelle révolution dans le domaine de l’intelligence artificielle avec Orion. Suite au succès spectaculaire de GPT-4, l’excitation autour de ce dernier reste intense. Ce modèle linguistique avancé appliqué dans divers usages est sur le point d’être lancé. Je vous explique tout.
https://youtu.be/QoqZbxaP9tk
OpenAI Orion, le modèle IA derrière ChatGPT 5
Objet de nombreuses spéculations, OpenAI Orion ne se contente pas d’être une simple mise à jour de GPT-4. Ce modèle
OpenAI prépare une nouvelle révolution dans le domaine de l’intelligence artificielle avec Orion. Suite au succès spectaculaire de GPT-4, l’excitation autour de ce dernier reste intense. Ce modèle linguistique avancé appliqué dans divers usages est sur le point d’être lancé. Je vous explique tout.
Objet de nombreuses spéculations, OpenAI Orion ne se contente pas d’être une simple mise à jour de GPT-4. Ce modèle IA est conçu pour être une transformation du langage naturel à un tout autre niveau. Les avancements analytiques apportés par OpenAI au fil des années sont à leur apogée.
Pour comprendre comment Orion surpasse ses prédécesseurs, il faut regarder l’historique des différentes versions de ChatGPT. Depuis l’introduction de GPT-2 en 2019, chaque mise à jour apporte des améliorations significatives en termes de compréhension et de génération du langage. GPT-3 avait déjà étonné par sa capacité à produire du texte d’une manière qui semblait quasiment humaine. Avec GPT-4, OpenAIa franchi une étape décisive grâce à un processus computationnel sophistiqué.
Orion n’arrive pas seul : OpenAI Strawberry est en route
Faisant la fierté d’OpenAI, Orion pousse ses limites encore plus loin. Effectivement, il intègre les acquis de ses prédécesseurs, mais aussi de nouvelles compétences. Ces capacités technologiques cumulées permettent une interaction plus fluide et intuitive avec ses utilisateurs. Le but ultime est de créer un partenaire capable de participer à des discussions complexes, de résoudre des problèmes et même d’élaborer des stratégies.
Point focal de cette nouveauté IA, Strawberry est également connue pour ses prouesses technologiques. Grâce à sa logique avancée et sa précision, ce modèle d’intelligence artificielle peut facilement résoudre les tâches les plus complexes. C’est la raison pour laquelle son arrivée prochaine dans le système ChatGPT ne surprend plus le public.
Grâce à Strawberry, le chatbot GPT-5 égalise l’intelligence d’un humain. Outre le fait d’être un as des calculs et du code, ce programme IA est aussi doué pour effectuer des recherches approfondies. Il pourra même élaborer des stratégies, planifier des tâches ou manier des données qualifiées.
Par ailleurs, Strawberry fait écho à STaR (Self-Taught Reasoner). Il s’agit d’une technique de Stanford qui cherche à affiner la réflexion des IA. Cette similitude annonce de belles avancées dans ce domaine. Grâce à sa synergie avec Orion, OpenAI espère réduire les erreurs et dans la foulée améliorer les performances du futur modèle IA.
Un projet qui aurait demandé quelques milliards de dollars
Pour comprendre l’ampleur des efforts nécessaires à la création d’Orion, il est crucial de regarder les chiffres. L’entraînement du nouveau modèle d’IA a coûté pas moins de 6,6 milliards de dollars, selon les suppositions. Ce chiffre reste à vérifier, mais l’investissement couvre divers aspects. Il a permis de financer l’infrastructure informatique, payer les équipes de recherche, acquérir les données d’entraînement massives et régler la consommation énergétique.
Ce montant souligne l’importance accordée au projet, mais aussi l’engagement d’OpenAI à rester à la pointe de l’innovation en intelligence artificielle. Tous ces investissements visent à garantir qu’Orion soit bien plus qu’un simple successeur de GPT-4. Sam Altman et son équipe ambitionnent véritablement de définir une nouvelle norme dans le domaine.
Les développeurs ont travaillé sans relâche pour créer des algorithmes sophistiqués et optimiser chaque aspect du système, des réseaux neuronaux aux techniques de régularisation utilisées. C’est ce genre d’investissement qui permet de faire évoluer la technologie à des niveaux jusque-là inaccessibles.
À titre de comparaison, le modèle GPT-3, lancé en juin 2020, a demandé environ 12 millions de dollars. Les coûts opérationnels pour maintenir ChatGPT en fonctionnement sont également élevés, estimés à 700 000 dollars par jour. Cela est dû à la puissance de calcul nécessaire pour traiter les requêtes des utilisateurs de manière efficace.
Une arrivée planifiée pour décembre 2024
La date marquée d’une pierre blanche pour tous les passionnés d’IA est décembre 2024. À cette période, OpenAI prévoit de lancer officiellement Orion. Cette échéance suscite une énorme anticipation, car elle promet de nouvelles fonctionnalités et améliorations, mais aussi des implications profondes pour de nombreux secteurs industriels.
Annoncée comme la plus puissante IA du moment, OpenAI Orion devrait introduire des capacités inédites dans la génération et l’analyse du langage. Attendez-vous à voir des applications allant de la création de contenu ultra-réaliste à l’assistance personnalisée dans des contextes variés, y compris le médical et le juridique. Chaque interaction pourrait devenir plus riche et plus naturelle grâce à l’intelligence supérieure d’Orion.
Le lancement coïncide également avec plusieurs autres prévisions de la part des experts. Ils anticipent une montée en flèche de l’intégration de modèles IA dans les solutions quotidiennes. Cela renforce davantage l’omniprésence de ces technologies dans nos vies. Les attentes autour d’Orion sont élevées et il est probable que cette IA surpassera même les estimations les plus optimistes.
Les fonctionnalités attendues avant la fin de l’année
Entraîné par OpenAI Orion et Strawberry, GPT-5 introduit plusieurs fonctionnalités inédites qui le distinguent de ses prédécesseurs. Il prend en charge le format vidéo, en plus du texte, de la parole, du code et des images. Ce sera alors le premier modèle d’OpenAI à cumuler autant de fonctionnalités. Il est conçu pour être plus fiable et précis, avec une meilleure vérification de la véracité des informations.
La personnalisation accrue permet d’adapter GPT-5 à des tâches spécifiques grâce à des modules dédiés. De plus, une analyse contextuelle améliorée offre une interaction plus fluide et naturelle, ce qui rend les échanges plus intuitifs. Enfin, GPT-5 reconnaît et signale ses propres incertitudes, ce qui améliore la transparence des réponses et renforce la confiance des utilisateurs. Cette innovation constitue un bond en avant pour l’intelligence artificielle. Elle transforme radicalement les interactions homme-machine.
Une intelligence artificielle conjointement développée avec Microsoft
Dans ce contexte, il convient de noter un partenariat stratégique crucial. OpenAI collabore étroitement avec Microsoft dans le développement d’Orion. Ce rapprochement symbolise une synergie technologique d’envergure. Si OpenAI apporte son expertise en matière de modèles de langage naturel, Microsoft offre une infrastructure technologique puissante et des ressources logicielles robustes qui accélèrent le processus de développement et de déploiement.
Ce partenariat stratégique vise à maximiser l’impact d’Orion à travers différents canaux. On peut, par exemple, s’attendre à une intégration profonde d’Orion dans les produits Microsoft, tels que Windows et Azure. Une telle collaboration assure non seulement une diffusion large et immédiate du modèle, mais aussi une adaptation spécifique aux écosystèmes professionnels et personnels courants.
Les spécialistes du monde entier suivent de près ce développement et s’accordent à dire que cette initiative profite à toutes les parties impliquées. Microsoft, ayant déjà investi massivement dans les infrastructures cloud et les outils de productivité, permet à OpenAI de mener des expérimentations à grande échelle, ce qui facilite l’amélioration continue d’Orion.
Fondée par Demis Hassabis et Shane Legg, Google DeepMind s’est imposée dans le domaine de l’intelligence artificielle grâce à ses avancées impressionnantes. Leur modèle AlphaGo a marqué l’histoire en battant des champions humains au jeu de Go, un exploit qui semblait impossible il y a encore quelques années.
Dès le début, ce modèle IA vise à surpasser, même les attentes les plus élevées. Sa capacité à maîtriser plusieurs jeux de données complexes sans instruction spécifique montre la puissance et la flexibilité de cette intelligence artificielle. Ces succès illustrent que DeepMind pourrait très bien détrôner ChatGPT.
Baidu, une adversaire venue d’orient
En Asie, Baidu se positionne comme un challenger puissant à OpenAI Orion. Réputée pour sa domination sur le marché des moteurs de recherche en Chine, l’entreprise ne se repose pas sur ses lauriers. À travers Baidu Brain, elle développe activement des modèles d’intelligence artificielle avancés utilisés dans diverses applications pratiques allant de la reconnaissance vocale à la conduite autonome.
Baidu mise sur une technologie poussée, combinée à une immense quantité de données locales, pour perfectionner ses plateformes. Leurs laboratoires d’IA collaborent étroitement avec des institutions académiques et assurent une expertise scientifique à la hauteur des défis mondiaux. La vision stratégique de Baidu inclut la domination du paysage technologique chinois, mais aussi le fait de s’imposer à l’international. Leur ambition transparaît dans des projets comme Apollo, leur plateforme ouverte de conduite autonome.
Facebook AI Research (FAIR) et son empreinte numérique
Développée par Meta, Facebook AI Research (FAIR) développe des modèles d’intelligence artificielle polyvalents. FAIR se distingue particulièrement dans le domaine de la vision par ordinateur et de la traduction automatique, domaines cruciaux pour améliorer l’interaction utilisateur sur les plateformes numériques.
La force de l’entraînement avec données synthétiques de FAIR permet d’affiner constamment leurs algorithmes. Cela réduit ainsi certaines contraintes liées aux données réelles. Emmené par une équipe de chercheurs renommés et soutenu par des ressources colossales, FAIR représente un concurrent redoutable sur le chemin d’OpenAI Orion.
Parmi les projets phares de FAIR figure BlenderBot, conçu pour converser de manière naturelle avec les utilisateurs tout en comprenant le contexte. Il s’agit d’un atout certain face aux concurrents du marché des assistants virtuels. Leur approche proactive et centrée sur l’utilisateur final ajoute une dimension intéressante dans cette bataille IA.
Les niveaux de QI des agents d'intelligence artificielle (IA) actuels sont comparables à ceux des chats domestiques. Demis Hassabis, PDG de Google DeepMind, a affirmé cela lors de la conférence Future of Britain 2024.
« Nous n'en sommes même pas encore à l'intelligence féline, en tant que système général. », a déclaré Hassabis. Bien que la recherche progresse rapidement, il reste encore un long chemin à parcourir.
Une réflexion avec Tony Blair
Lors de cette conférence, Hassabis a
Les niveaux de QI des agents d'intelligence artificielle (IA) actuels sont comparables à ceux des chats domestiques. Demis Hassabis, PDG de GoogleDeepMind, a affirmé cela lors de la conférence Future of Britain 2024.
« Nous n'en sommes même pas encore à l'intelligence féline, en tant que système général. », a déclaré Hassabis. Bien que la recherche progresse rapidement, il reste encore un long chemin à parcourir.
Une réflexion avec Tony Blair
Lors de cette conférence, Hassabis a discuté avec Tony Blair, ancien Premier ministre britannique. Cette discussion a mis en lumière les différences entre l'intelligence artificielle générale (AGI) et l'intelligence actuelle des systèmes d'IA. Selon Hassabis, une IA peut écrire ou peindre de manière convaincante, mais elle n'a pas encore une intelligence générale comme celle d'un chat domestique.
Hassabis a souligné les défis majeurs à surmonter pour atteindre une AGI de niveau humain. Ces défis incluent la planification, la mémoire, l'utilisation d'outils et le questionnement intelligent. Malgré les progrès dans certains domaines, notamment les jeux où l'IA surpasse les meilleurs humains, une intelligence de niveau humain reste hors de portée.
Le potentiel de l'IA à transformer nos vies est immense, selon Hassabis. Il compare son impact potentiel à celui de la révolution industrielle ou de la maîtrise du feu et de l'électricité. L'IA pourrait accélérer les découvertes scientifiques dans des domaines tels que l'énergie, la science des matériaux, les soins de santé, le climat et les mathématiques.
Project Astra, qu'est-ce que c'est ?
Hassabis a présenté Project Astra, un projet de DeepMind visant à libérer l'IA des contraintes actuelles. Contrairement à des chatbots comme ChatGPT ou Google Gemini, Project Astra vise à créer un « agent IA universel ». Cet agent connaîtra mieux la situation, l'environnement, les préférences et l'historique d'un utilisateur afin de rendre l'IA plus utile au quotidien.
L'investissement en IA
La recherche en AGI progresse grâce à d'énormes investissements en argent et en calcul. Certains s'attendent à ce que l'AGI éclipse l'intelligence humainedans les cinq prochaines années. Hassabis reste optimiste quant à l'avenir de l'IA et son potentiel à transformer notre monde de manière significative.
Bien que la recherche en AGI progresse rapidement, Hassabis admet que nous sommes loin d'une intelligence de niveau humain dans tous les domaines. Il reconnaît que de grandes avancées et une mise à l'échelle des calculs sont nécessaires pour atteindre ce niveau. Les obstacles actuels nécessitent encore beaucoup de travail et d'innovation.
En somme, bien que les IA actuelles n'aient que le niveau de QI d'un chat, leur potentiel futur est immense. Grâce à des projets comme Project Astra et à des investissements massifs, l'avenir de l'IA semble prometteur. Les progrès rapides nous rapprochent de plus en plus de l'atteinte d'une intelligence artificielle générale. Les prochaines années seront cruciales pour voir si l'AGI pourra un jour égaler ou même surpasser l'intelligence humaine.
Sora n'est plus seul dans l'arène. Après la conférence I/O, Google a lancé Veo. Cette IA générative est aussi capable de générer des vidéos 1080p, destinés spécialement aux spécialistes de l'audiovisuel.
La dernière conférence de Google pour les développeurs a été un élément majeur pour cette année 2024. On a eu des mises à jour de Gemini, et d'autres innovations intéressantes. Mais la nouvelle IA de Google, Veo, a été le summum du spectacle. C'est la plus grande rivale de Sora actuellement.
Sora n'est plus seul dans l'arène. Après la conférence I/O, Google a lancé Veo. Cette IA générative est aussi capable de générer des vidéos 1080p, destinés spécialement aux spécialistes de l'audiovisuel.
La dernière conférence de Google pour les développeurs a été un élément majeur pour cette année 2024. On a eu des mises à jour de Gemini, et d'autres innovations intéressantes. Mais la nouvelle IA de Google, Veo, a été le summum du spectacle. C'est la plus grande rivale de Sora actuellement. En effet, elle est aussi capable de générer des vidéos d'une minute, en se basant sur de simples requêtes textuelles. Toutefois, cet outil réserve quelques surprises aux utilisateurs.
« Une compréhension avancée du langage naturel »
La création de vidéo avec une résolution de 1080p est déjà un exploit pour Google Veo. Cependant, ce n'est pas son seul atout. Selon le communiqué de presse de l'entreprise américaine, cette nouvelle IA est capable d'analyser les prompts avec une précision optimale. Il sera alors plus facile de générer des vidéos spécifiques, avec seulement des mots simples. Par exemple, l'utilisateur peut ajouter des mentions comme les « timelapses », ou les « prises de vue aériennes » dans les prompts. L'IA va fournir des rendus qui se rapprochent le plus de ces requêtes.
De plus, il est possible de créer des vidéos plus longues. Selon Demis Hassabis, le PDG de DeepMind, cette fonctionnalité nécessite quelques manipulations spécifiques.
Actuellement, l'outil n'est pas encore disponible pour le grand public. Seuls quelques cinéastes, ou spécialistes du secteur auront le privilège de tester Google Veo. Cette approche permet de déterminer les lacunes de cette IA. Il sera alors plus facile de les corriger, avec de lancer l'outil pour tous les utilisateurs.
Introducing Veo: our most capable generative video model.
It can create high-quality, 1080p clips that can go beyond 60 seconds.
Google Veo, bientôt disponible sur les différentes plateformes de l'entreprise
Comme à son habitude, le géant de la tech veut améliorer ses plateformes avec ses propres innovations. Google Veo sera alors intégré à YouTube Shorts d'ici peu. C'est une aubaine, surtout pour les créateurs de contenu. En effet, ces spécialistes pourront créer des vidéos en quelques minutes. L'imagination sera la seule limite.
« À l'avenir, nous intégrerons également certaines fonctionnalités de Veo à YouTube Shorts et à d'autres produits », expliquent les spécialistes de Google dans un communiqué de presse.
Ce n'est pas tout, car Google envisage aussi de créer une nouvelle plateforme. Dénommée VideoFX, cette innovation permettra aux cinéastes de générer plusieurs séquences de vidéo avec Veo. C'est comme un logiciel de montage, mais en mieux.
Google a alors conquis tous les aspects de l'audiovisuel avec Veo. Rappelons que l'entreprise américaine a déjà lancé Imagen 3 (une IA spécialisée en image), MusicFX, et maintenant VideoFX.
À votre avis, quelle IA va gagner la compétition dans le domaine des vidéos ? Sora a été la pionnière dans ce secteur. Cependant, Veo a beaucoup de fonctionnalités spécifiques pour les cinéastes. Quelle IA choisir ? Comme toujours, orientez-vous vers celle qui répondra le mieux à vos attentes.
La conférence annuelle Google I/O attire déjà l'attention du public. Après les mises à jour de Gemini, le géant de la tech a lancé le Project Astra. Cette approche permettra à Google de se placer devant les meilleurs assistants virtuels du moment. Tout savoir.
Google a-t-il réussi à briser la barrière entre la réalité et la science-fiction ? Certains vont dire que le géant américain a accompli cette mission. En effet, le Project Astra remplit parfaitement les conditions pour créer un assistan
La conférence annuelle Google I/O attire déjà l'attention du public. Après les mises à jour de Gemini, le géant de la tech a lancé le Project Astra. Cette approche permettra à Google de se placer devant les meilleurs assistants virtuels du moment. Tout savoir.
Google a-t-il réussi à briser la barrière entre la réalité et la science-fiction ? Certains vont dire que le géant américain a accompli cette mission. En effet, le Project Astra remplit parfaitement les conditions pour créer un assistant virtuel complet. Une IA capable de communiquer avec son utilisateur, comme un véritable compagnon de vie. Bientôt, l'IA du film « Her », ou de la série « Star Trek » sera dans votre domicile.
« J'ai cette vision en tête depuis un certain temps »
Cette déclaration de Demis Hassabis, directeur de Google DeepMindrésume parfaitement les ambitions du géant américain. En effet, le Project Astra était déjà dans les coulisses de Google il y a plus de cinq ans. L'entreprise a alors choisi l'évènement I/O pour dévoiler cette innovation à la planète entière.
Cet assistant virtuel, connu aussi comme une IA multimodale, est capable de décortiquer les informations en temps réel. Ses capacités sont extraordinaires, disait Demis Hassabis. En effet, on peut utiliser cette IA dans toutes les tâches de la vie quotidienne.
Lors de la démonstration, des spécialistes ont demandé à l'IA de chercher des données sur internet, d'analyser des lignes de code, etc. La rapidité de cet assistant virtuel a ébahi la foule. En quelques secondes seulement, elle arrivait à répondre à l'utilisateur. C'est comme une discussion en temps réel avec une vraie personne.
Là, Demis Hassabis a réalisé un de ses objectifs de vie. Il y a quelques années, il a déclaré : « J'ai cette vision en tête depuis un certain temps. Nous aurions cet assistant universel. C'est multimodal, c'est avec vous tout le temps. Appelez-le comme le communicateur Star Trek, appelez cela la voix de Her, appelez ça comme vous voulez ».
Project Astra : l'assistant virtuel qui dépassera Siri et Alexa
L'ambition de Google ne s'arrêtera pas en si bon chemin. Effectivement, le Project Astra ne se limite pas à répondre aux requêtes des utilisateurs. Sa capacité dépasse largement les outils les plus connus actuellement. La réputation de cette nouvelle IA repose alors sur sa réactivité, ainsi que sa précision.
« Nous avions des éléments de ce projet il y a six mois, mais l'un des problèmes était simplement la vitesse et la latence. Sans cela, la convivialité n'est pas vraiment là. Ainsi, depuis six mois, l'accélération du système a été l'une des tâches les plus importantes de l'équipe » explique Demins Hassabis.
Les autres annonces lors de la conférence Google I/O
Le Project Astra n'est pas la seule innovation de Google pour cette année. L'entreprise a aussi boosté Gemini. Vous pourrez désormais profiter de la performance de cette IA à travers Gemini 1.5 Pro. Ce n'est pas tout, car le géant américain a amélioré Google Lens, et les autres outils.