Bill Gates n’a pas retourné sa veste, il l’avait dit dès 2017 : si l’IA vole nos jobs, elle devra payer des impôts à notre place.
Le cofondateur de Microsoft, qui a passé sa vie à accélérer le progrès technologique, brandit désormais un carton jaune. Il ne rejette pas l’IA — Bill Gates l’a même portée à bout de bras chez Microsoft et la soutient encore via sa fondation. Cependant, le milliardaire réclame des règles claires, avant que cette technologie n’engloutisse des millions d’emplois san
Bill Gates n’a pas retourné sa veste, il l’avait dit dès 2017 : si l’IA vole nos jobs, elle devra payer des impôts à notre place.
Le cofondateur de Microsoft, qui a passé sa vie à accélérer le progrès technologique, brandit désormais un carton jaune. Il ne rejette pas l’IA — Bill Gates l’a même portée à bout de bras chez Microsoft et la soutient encore via sa fondation. Cependant, le milliardaire réclame des règles claires, avant que cette technologie n’engloutisse des millions d’emplois sans offrir de véritable retour à la société.
Une prédiction qui se réalise sous nos yeux
Depuis 2017, Bill Gates répète la même phrase, presque mot pour mot : « L’automatisation va remplacer les humains dans la plupart des tâches, et cela arrivera brutalement. » À l’époque, beaucoup souriaient. Huit ans plus tard, personne ne rit plus.
Les chauffeurs de camion voient Waymo et Tesla tester des poids lourds sans conducteur sur les autoroutes américaines. Les employés d’entrepôts regardent des robots Figure et Boston Dynamics déplacer des colis plus vite qu’eux.
Les rédacteurs, graphistes, codeurs découvrent que ChatGPT, Midjourney ou GitHub Copilot accomplissent 80 % de leur travail en quelques secondes. Les cabinets de conseil et les banques licencient des promotions entières d’analystes juniors.
L’IA ne remplace plus seulement les tâches répétitives. Elle s’attaque aux métiers intellectuels que l’on croyait protégés.
Bill Gates avait aussi annoncé que le grand remplacement ne viendra pas progressivement. Il frappera d’un coup, dès que les coûts de l’IA deviendront inférieurs au salaire moyen.
La taxe de l’équité
Un salarié qui produit 60 000 euros de valeur par an verse aujourd’hui environ 25 000 euros en cotisations et impôts. Si une machine prend sa place, l’entreprise économise ces 25 000 euros. La productivité augmente, les charges diminuent, mais les recettes fiscales s’effondrent.
Bill Gates propose de récupérer cette somme sous forme de taxe sur l’IA ou le robot. L’argent servirait ensuite à financer trois priorités.
La première consiste à former massivement les travailleurs déplacés. La seconde, renforcer l’éducation et la santé, secteurs où l’humain reste irremplaçable. Et enfin, soutenir les revenus de ceux qui perdront leur emploi.
En gros, l’IA paierait pour adoucir le choc qu’elle provoque. L’idée n’est pas de stopper le progrès, mais de le rendre socialement supportable.
C’est au Forum économique mondial de Davos, en février 2017, que Bill Gates lance publiquement ce concept. Huit ans plus tard, la proposition n’apparaît plus comme une excentricité de milliardaire repenti.
La Commission européenne a commandé des études. La Corée du Sud, championne de la robotique industrielle, a déjà réduit certains avantages fiscaux accordés aux entreprises qui automatisent massivement. En France, des économistes comme Thomas Piketty ou Julia Cagé défendent des versions similaires.
Les objections, et pourquoi elles ne tiennent plus
« Taxer les robots freinera l’innovation », disent les entrepreneurs. Bill Gates répond que l’innovation pure ne sert à rien si elle détruit la cohésion sociale.
Les entreprises délocaliseront, mais une coordination internationale, comme pour la taxation minimale des multinationales, rendrait la fuite impossible. Des pays taxent déjà la valeur ajoutée des plateformes numériques. Le principe existe.
Bill Gates propose simplement de traiter l’IA comme n’importe quel autre facteur de production qui génère de la richesse. Le pétrole paie des taxes. L’électricité paie des taxes. Pourquoi la productivité des machines échapperait-elle à toute contribution ?
Le fondateur de Microsoft n’a jamais été un techno-optimiste aveugle. Dès les années 2010, il alertait sur les risques d’une IA non maîtrisée. Aujourd’hui, il finance des projets d’IA pour la santé et l’éducation, mais toujours avec l’idée que la technologie doit servir l’humain, pas l’inverse.
Microsoft captured quantum news headlines on February 19, 2025 by publishing an arXiv blueprint for its future fault-tolerant quantum computers (FTQCs) using Majorana fermions, a Nature paper about the measurement of Majorana Zero Modes (MZMs) in a chip containing the equivalent of half a physical topological qubit, and then a press release summarizing the whole and introducing […]
Microsoft captured quantum news headlines on February 19, 2025 by publishing an arXiv blueprint for its future fault-tolerant quantum computers (FTQCs) using Majorana fermions, a Nature paper about the measurement of Majorana Zero Modes (MZMs) in a chip containing the equivalent of half a physical topological qubit, and then a press release summarizing the whole and introducing […]
L’intelligence artificielle (IA) s’infiltre partout. Elle rédige des articles, compose de la musique, diagnostique des maladies… Tout le monde a peur pour sa carrière.
Bill Gates, l’un des plus grands visionnaires de la tech, par contre, est confiant en affirmant que certaines professions sont tout simplement indétrônables. Selon lui, trois métiers résisteront coûte que coûte à la montée des machines.
Voyons dans cet article lesquels.
Les métiers que les machines ne pourront pas rempla
L’intelligence artificielle (IA) s’infiltre partout. Elle rédige des articles, compose de la musique, diagnostique des maladies… Tout le monde a peur pour sa carrière.
Bill Gates, l’un des plus grands visionnaires de la tech, par contre, est confiant en affirmant que certaines professions sont tout simplement indétrônables. Selon lui, trois métiers résisteront coûte que coûte à la montée des machines.
Voyons dans cet article lesquels.
Les métiers que les machines ne pourront pas remplacer
L’avenir est imprévisible, et anticiper ce qui nous attend demain relève souvent de la spéculation. Pourtant, s’il y a bien une voix qui mérite d’être écoutée sur l’évolution des métiers face à l’IA, c’est celle de Bill Gates.
Visionnaire depuis la création de Microsoft, il a vu son entreprise devenir un géant incontournable de la tech. Fort de cette expérience, il affirme que trois postes resteront à l’abri des robots et des algorithmes : biologistes, programmeurs et experts en énergie.
Depuis des siècles, la biologie progresse sans l’aide des algorithmes, en s’appuyant sur l’observation, l’expérimentation et l’analyse. L’IA peut traiter des données, mais elle est incapable d’explorer l’inconnu ou de formuler des hypothèses innovantes.
L’intuition, le jugement humain et la capacité à s’adapter aux imprévus restent des éléments clés du travail des biologistes. Sur le terrain comme dans les laboratoires, l’humain reste irremplaçable.
Si certains outils automatisent déjà des tâches de codage, ils ne peuvent ni innover, ni résoudre des problèmes complexes sans intervention humaine. Tant que l’IA existera, elle aura besoin de programmeurs pour lui donner un cadre et une direction.
Pour finir, gérer des infrastructures critiques comme les centrales électriques ou les réseaux d’approvisionnement en énergie ne se limite pas à surveiller des écrans.
L’IA peut optimiser certains processus. Cependant, elle ne pourra jamais remplacer la réactivité et l’expertise humaine en cas de crise. Lorsqu’une panne ou un incident survient, c’est l’humain qui prend les décisions cruciales.
Cela dit, gardez toujours une longueur d’avance sur l’IA
À l’heure actuelle, l’IA est excellente dans presque tout ce qu’elle fait. Alors, pour garder votre carrière prometteuse, optimiser votre profil en exploitant les failles de l’IA.
Primo, soyez plus créatif. L’IA peut générer du contenu en se basant sur des données existantes. Toutefois, elle peine à concevoir des idées véritablement originales.
Alors, développez votre capacité à innover, à remettre en question les idées établies et à imaginer des solutions inédites. Surtout si vous travaillez dans le digital.
Secundo, améliorer votre intelligence émotionnelle. La capacité à comprendre et à gérer vos émotions – ainsi qu’à percevoir celles de vos interlocuteurs – est cruciale pour le management, la négociation et la collaboration.
Cette qualité humaine reste un domaine où l’IA est encore très limitée. Traduction : à exploiter.
Tertio, suivons le conseil de Sam Altman qui a avoué : « Je ne sais pas prédire l’avenir exact de l’IA, mais je sais que la curiosité et l’adaptabilité seront cruciales »
En ce moment même, les employeurs privilégient déjà les profils capables de s’adapter rapidement et de relever de nouveaux défis dans un monde en constante évolution. Ça s’appelle : l’ingénierie rapide.
Ainsi, apprenez à demander à l’IA ce dont vous avez besoin.
Alors, avez-vous déjà constaté l’impact de l’IA sur votre secteur ? L’utilisez-vous comme un allié ou la voyez-vous comme une menace ?
La fête est finie entre les deux entreprises IA de références. Microsoft ne suivra plus le même chemin qu'OpenAI. La situation est assez tendue, car les autres investisseurs sont réticents pour une collaboration avec la créatrice de ChatGPT. Affaire à suivre.
Plus de 13 milliards de dollars ont été injectés dans les projets de Sam Altam. Oui, les équipes de Bill Gates ont vraiment été un atout pour l'entreprise mère de ChatGPT. Cependant, cette collaboration d'environ huit mois pourrait touch
La fête est finie entre les deux entreprises IA de références. Microsoft ne suivra plus le même chemin qu'OpenAI. La situation est assez tendue, car les autres investisseurs sont réticents pour une collaboration avec la créatrice de ChatGPT. Affaire à suivre.
Plus de 13 milliards de dollars ont été injectés dans les projets de Sam Altam. Oui, les équipes de Bill Gates ont vraiment été un atout pour l'entreprise mère de ChatGPT. Cependant, cette collaboration d'environ huit mois pourrait toucher à sa fin. Microsoft a abandonné sa place au sein du conseil d'administration d'OpenAI. Une bombe qui chamboule le monde du high-tech actuellement.
Microsoft x OpenAI, plus qu'un souvenir
Tout a commencé en 2019. Bill Gates, à travers Microsoft a investi plus de 13 milliards de dollars dans les caisses d'OpenAI. L'objectif était d'accélérer le développement de technologies IA, telles que ChatGPT. Les équipes de Sam Altman ont alors conquis le marché, et continuent leur lancée.
Mais la vie n'a pas toujours été rose pour l'entreprise. Le 17 novembre 2023, le grand patron, Sam Altman a été renvoyé d'OpenAI. Il a ensuite repris son siège quelques jours après, grâce au soutien de Microsoft.
C'est à partir de ce moment que Microsoft a obtenu une place au conseil d'administration d'OpenAI. Toutefois, l'entreprise n'avait pas encore un droit de vote. Bill Gates et ses associés tenaient simplement le rôle d'observateur.
Microsoft a alors adressé une lettre à OpenAI pour annoncer son retrait. Elle a aussi affirmé que sa décision a un effet immédiat.
« Ces huit derniers mois, nous avons assisté aux progrès importants du nouveau conseil d'administration et nous avons confiance en la trajectoire de l'entreprise. Nous ne pensons pas que notre rôle limité d'observateur soit encore nécessaire » explique Microsoft.
Quelles seraient les causes de cette rupture ?
Les spécialistes se sont immédiatement penchés sur ce revirement entre ces entreprises IA. Selon eux, régulateurs des marchés et de la concurrence avaient un rôle à jouer dans cette histoire. La FTC (Federal Trade Commission), la Competition and Markets Authority, et la Commission Européenne ont commencé à analyser les investissements colossaux d'OpenAI.
Ces fonds pourraient désavantager la concurrence. Ainsi, le marché de l'IA sera dans les mains de quelques entreprises. La situation ne vise pas seulement Microsoft, mais aussi les autres mastodontes comme Google, et Amazon.
La Commission Européenne a fourni quelques explications concernant le sujet. Cette institution voulait comprendre si « certaines clauses d'exclusivité pourraient avoir un impact négatif sur la concurrence ».
Le retrait de Microsoft d'OpenAI a un effet domino sur plusieurs entreprises IA. Apple a renoncé à sa place dans le conseil d'administration des rangs d'OpenAI.
De leur côté, les équipes de Sam Altman. Ils vont instaurer une stratégie plus efficace pour les prochains investisseurs.
« À l'avenir, nous organiserons des réunions régulières avec les parties prenantes pour partager les progrès réalisés dans le cadre de notre maison et garantir une collaboration plus étroite en matière de sécurité et de sûreté. Nous sommes impatients de continuer à recevoir les commentaires et les conseils de ces principales parties prenantes », explique le porte-parole d'OpenAI.
Selon vous, quelles sont les mesures les plus efficaces pour analyser les investissements dans le domaine de l'IA ?
Ce sont 67 milliards de dollars que ces cinq actions IA ont mobilisés cette semaine. Les milliardaires s'intéressent aux entreprises du secteur et à leurs revenus record.
L'industrie de l'intelligence artificielle continue de très bien se porter. Ces acteurs majeurs enregistrent des revenus colossaux en dépassant tous les records. Les milliardaires veulent également leurs parts du gâteau. Ils n'hésitent pas à solliciter leurs fonds de placement pour acquérir les cinq actions IA avec le potent
Ce sont 67 milliards de dollars que ces cinq actions IA ont mobilisés cette semaine. Les milliardaires s'intéressent aux entreprises du secteur et à leurs revenus record.
L'industrie de l'intelligence artificielle continue de très bien se porter. Ces acteurs majeurs enregistrent des revenus colossaux en dépassant tous les records. Les milliardaires veulent également leurs parts du gâteau. Ils n'hésitent pas à solliciter leurs fonds de placement pour acquérir les cinq actions IA avec le potentiel de croissance le plus élevé.
L'intelligence artificielle est en train de révolutionner nos vies. L'apparition de produits faisant sensation comme ChatGPT n'est que le début de cette révolution.
Il nous reste encore à découvrir le véritable impact de la technologie. Cette promesse de plus de nouveautés stimule remarquablement la croissance des entreprises impliquées.
Top 5 des actions IA qui affolent les milliardaires
Si les gestionnaires de portefeuilles déboursent des dizaines de milliards de dollars pour ces actions IA, c'est parce qu'il s'agit des entreprises du milieu les plus en vues actuellement. Soulignons que c'est parce que ces actions rapportent beaucoup qu'elles sont vendues.
Le mastodonte américain du commerce en ligne possède la plus grande structure de cloud au monde. Amazon Web Service (AWS) domine plus de 30 % du marché du cloud.
Il faut savoir qu'Amazon se fournit en puces chez Nvidia pour équiper ses centres de données. Celles-ci répondent bien aux besoins de puissance.
Le numéro un mondial des logiciels s'impose aujourd'hui comme un acteur majeur de l'industrie de l'intelligence artificielle. Il est également un solide soutien d'OpenAI, la start-up californienne à laquelle nous devons ChatGPT.
D'autre part, Microsoft fait figure de numéro deux sur le marché du cloud. La compagnie fondée par Bill Gates continue de grignoter des parts de marché à AWS.
La marque à la pomme se lance enfin dans la course à l'intelligence artificielle avec Apple Intelligence. Cette suite de fonctionnalités dopées à l'IA sera disponible avec iOS 18 et macOS Sequoia — sauf pour les utilisateurs en Europe.
Néanmoins, cette nouveauté devrait dynamiser les ventes des prochains iPhone. Il faut effectivement des appareils puissants pour supporter l'intelligence artificielle.
5. Broadcom
La moins connue des cinq compagnies, mais qui a sa place dans l'industrie. Broadcom fournit du matériel pour l'IA en complétant d'une certaine manière Nvidia. Son expertise concerne la technologie pour la communication rapide entre puces dans les centres de données.
Ceux qui déboursent des fortunes pour ces actions IA
L'intelligence artificielle est le thème de l'année en matière d'investissements. Les gestionnaires d'actifs achètent à tour de bras des actions IA.
Ces fonds de premier plan s'arrachent les actions des compagnies les plus prometteuses. Le but est évidemment de profiter au mieux de la croissance explosive de la technologie.
BlackRock mise sur les géants de la tech
Le plus grand gestionnaire d'actifs au monde a sous sa tutelle plus de 7 000 milliards de dollars. Après avoir redéfini le paysage de l'investissement mondial, BlackRock investit massivement dans les actions IA aujourd'hui.
Au dernier trimestre, ce gestionnaire de fonds a mis 1,8 milliard de dollars sur Nvidia et 1,9 milliard sur Amazon. L'enveloppe pour les actions de Microsoft était plus conséquente. Celle-ci s'élevait à 2,8 milliards de dollars.
Vanguard fait une grosse enveloppe pour Nvidia
Cette autre compagnie américaine est également une grosse ponte sur le marché de la gestion d'actifs. Contrairement à son concurrent mentionné précédemment, Vanguard diversifie davantage ses placements en lien avec l'intelligence artificielle.
Ce sont 6,2 milliards de dollars que le fonds de placement a investis sur Nvidia au dernier trimestre. Son enveloppe pour les actions d'Amazon contenait 2,5 milliards de dollars.
Le fonds a aussi été le plus gros acheteur des actions de Broadcom. Il a déboursé 1,6 milliard de dollars pour le fournisseur de matériel.
Les autres acheteurs des cinq actions IA en question
Geode Capital Management a investi 1,3 milliard de dollars pour respectivement Microsoft et Apple. Le groupe Lazard, de son côté, a mobilisé 983,9 millions de dollars pour les actions de la marque à la pomme.
Jennison Associates a suivi Vanguard sur les actions de Broadcom. Son enveloppe comptait 1,5 milliards de dollars.
Pensez-vous également investir dans ces cinq actions IA ? Bien entendu, il ne s'agit pas de concurrencer ces fonds de placement. Il s'agit plutôt de tirer votre épingle du jeu.
Aux yeux du grand public, OpenAI a l'image positive d'une startup de la Silicon Valley œuvrant pour mettre l'IA au service du plus grand nombre. Toutefois, en réalité, son CEO Sam Altman cache une personnalité très sombre et des traits de caractère rappelant ceux d'un pervers narcissique… découvrez les révélations choquantes qui vont changer votre regard sur ChatGPT !
Fin 2023, tout semblait sourire à OpenAI. Vue de l'extérieur, la startup américaine prospérait sous un soleil radieux suite au
Aux yeux du grand public, OpenAI a l'image positive d'une startup de la Silicon Valley œuvrant pour mettre l'IA au service du plus grand nombre. Toutefois, en réalité, son CEO Sam Altman cache une personnalité très sombre et des traits de caractère rappelant ceux d'un pervers narcissique… découvrez les révélations choquantes qui vont changer votre regard sur ChatGPT !
Fin 2023, tout semblait sourire à OpenAI. Vue de l'extérieur, la startup américaine prospérait sous un soleil radieux suite au succès mondial de ChatGPT et rien ne pouvait se dresser en travers de son ascension…
Pourtant, le 17 novembre, l'entreprise a créé la stupéfactionen annonçant soudainement le renvoi de son propre co-fondateur et CEO Sam Altman !
Une décision totalement inattendue, traduisant une crise profonde et des querelles internes dissimulées aux yeux du grand public…
Quelques jours plus tard, Altman avait finalement repris son poste et c'est le conseil d'administration d'OpenAI qui avait été dissous.
Toutefois, jusqu'à aujourd'hui, plus de six mois après, on ignorait encore la véritable raison pour laquelle ce chef d'entreprise a été chassé de son propre trône…
Il aura fallu attendre la fin mai 2024 pour qu'une ancienne membre du conseil d'administration, Helen Toner, révèle enfin la vérité lors d'une interview accordée au podcast The Ted AI Show.
Le conseil ne savait même pas que ChatGPT existait
Selon elle, il y a une bonne raison pour laquelle le renvoi d'Altman a été annoncé si subitement. Pour réussir à l'expulser, le conseil n'avait d'autre choix que d'agir dans son dos.
Pour cause, « c'était clair pour chacun de nous que dès que Sam aurait la moindre idée que nous pourrions faire quelque chose qui allait à son encontre, il mettrait tout en œuvre et ferait tout ce qui était en son pouvoir pour saper le conseil d'administration ».
Elle estime qu'il aurait même fait en sorte de « nous empêcher de même être capable de le renvoyer ». En réalité, ce conseil d'administration n'avait pas vraiment de contrôle au sein de l'entreprise.
En guise d'exemple, Toner évoque le lancement de ChatGPT. Selon elle, « quand ChatGPT est sorti en novembre 2022, le conseil n'avait pas été informé à l'avance. Nous avons appris l'existence de ChatGPT sur Twitter »…
Autant dire que Toner dresse un portrait sombre d'Altman, machiavélique et calculateur, presque despotique, bien loin de l'image du startupper cool et sympa qu'il tente de véhiculer…
Manipulation, mensonges et ambiance toxique
Quoi qu'il en soit, venons-en au vif du sujet : pour quelle raison avoir voulu renvoyer le CEO de sa propre entreprise ? Là encore, Helen révèle des informations qui soulignent le côté obscur de Sam.
Toujours d'après ses dires, le conseil a commencé à cesser de lui faire confiance en découvrant qu'il détenait le fonds d'investissement OpenAI Startup Fund sans leur avoir indiqué.
Il avait aussi donné des informations mensongères sur les processus de sécurité de l'entreprise à de multiples reprises. De plus, Toner révèle avoir été personnellement prise pour cible après avoir publié un document de recherche qui lui avait déplu.
Holy smokes.
OpenAI board member Helen Toner published an article Altman took issue with.
She described it as “an academic paper that analyzed the challenges that the public faces when trying to understand the intentions of the countries and companies developing A.I.”
Dès lors, comme elle le raconte, « Sam a commencé à mentir aux autres membres du conseil pour tenter de me faire exclure ». Cependant, tout a réellement basculé quand deux cadres se sont directement adressés au conseil pour rapporter leurs expériences avec Altman.
Ils ont décrit l'atmosphère toxique qui régnait chez OpenAI, et ont accusé le CEO « d'abus psychologique ». Des preuves ont été fournies, démontrant qu'il pouvait se montrer « menteur et manipulateur » dans différentes situations. C'est alors que le conseil a décidé de le renvoyer.
Pourquoi Sam Altman a-t-il repris son poste ?
Que s'est-il passé chez OpenAI dans les jours qui ont suivi le renvoi de Sam Altman ? Le podcast ne donne pas réellement de détails à ce sujet.
On sait que plusieurs CEO en intérim se sont rapidement succédé, et que des employés (dont l'un des membres du conseil) ont réclamé son retour. Il a également reçu le soutien de Microsoft, principal investisseur d'OpenAI.
Cependant, Toner souligne trois raisons qu'elle estime crédibles pour expliquer pourquoi la pression pour faire revenir Altman était si forte.
Tout d'abord, elle affirme que seules deux options ont été présentées aux employés : dissoudre le conseil pour qu'Altman reprenne son poste, ou assister à la destruction de l'entreprise.
Sans surprise, ils ont donc préféré la dissolution du conseil. De plus, beaucoup d'entre eux craignaient de s'attirer les foudres de Sam après avoir vu la façon dont il pouvait s'attaquer à ses ennemis.
EXCLUSIVE: "We learned about ChatGPT on Twitter."
What REALLY happened at OpenAI? Former board member Helen Toner breaks her silence with shocking new details about Sam Altman's firing. Hear the exclusive, untold story on The TED AI Show.
Enfin, même avant de diriger OpenAI, Altman traînait déjà un lourd passif. Malgré un parcours triomphal en apparence, la réalité est plus sombre lorsqu'on y regarde de plus près.
Selon Toner, il a en fait été renvoyé de son précédent emploi au sein de l'incubateur Y Combinator. Ceci avait été passé sous silence à l'époque.
Par la suite, au sein de sa startup Loopt, l'équipe de management serait allée voir le conseil d'administration deux fois pour demander de le renvoyer à cause de son comportement « trompeur et chaotique ».
Autant dire que le fond du problème ne semble pas venir des membres du conseil d'OpenAI, contrairement à ce qu'il voudrait faire croire…
Un membre du nouveau conseil contredit Toner
Dans ce même podcast, un membre du conseil actuel d'OpenAI, Bret Taylor, a tenu à répondre aux propos d'Helen Toner.
Selon ses dires, elle « continue à revisiter ces problèmes ». Il précise qu'un comité indépendant a travaillé avec le cabinet d'avocats Wilmer Haler afin de passer en revue cette crise survenue en novembre dernier.
Or, leurs conclusions sont que la décision du renvoi d'Altman n'était pas basée sur des inquiétudes concernant les dangers des produits d'OpenAI, ses finances, ou ses déclarations aux consommateurs.
Par ailleurs, plus de 95% des employés ont demandé sa réintégration au poste de CEO et la dissolution du conseil. Il semble donc estimer que les accusations d'Helen sont mensongères.
D'après Taylor, OpenAI «reste focalisé pour aller de l'avant et poursuivre la mission d'OpenAI pour s'assurer que l'AGI soit bénéfique à toute l'humanité ».
La création de l'AGI dirigée par un psychopathe ?
Helen Toner (@hlntnr), former OpenAI board member, is finally going on record about firing Sam Altman:
“He gave us inaccurate information about the small number of formal safety processes that the company did have in place.”
Toutefois, on peut légitimement s'inquiéter de savoir que la création de l'AGI, à savoir une intelligence artificielle supérieure à l'intelligence humaine, est dirigée par une personne manifestement instable et dotée d'une personnalité trouble…
Le témoignage de Toner dresse un sinistre portrait de celui qui se compare lui-même à Oppenheimer, l'inventeur de la bombe nucléaire, et laisse penser que ses intentions ne sont pas si bienveillantes qu'il le prétend si souvent.
Tout comme Bill Gates, Mark Zuckerberg ou Jeff Bezos, Sam Altman semble avoir une personnalité torturée et un certain manque d'empathie. Un trait de caractère indispensable pour faire fortune dans la tech ?
Il y a quelques semaines, il annonçait fièrement aux startups de l'industrie de l'IA que « GPT-5 allait leur rouler dessus », sans avoir réellement l'air de se soucier de leur sort.
À plusieurs reprises, l'autre co-fondateur d'OpenAI, Elon Musk, a publiquement accusé Altman d'avoir trahi la vision initiale d'OpenAI et de délaisser l'ambition d'une IA ouverte et transparente pour l'argent.
Cette semaine, OpenAI a annoncé que l'entraînement de GPT-5 a commencé, et qu'un nouveau comité chargé de superviser la sécurité de cette nouvelle IA a été créé. Toutefois, ce comité est dirigé par Sam Altman lui-même…
On peut donc craindre qu'il ne s'agisse que d'une façade, et qu'Altman néglige la sécurité en se focalisant uniquement sur le profit. Dans le pire des scénarios, ce CEO pourrait être un véritable psychopathe cherchant à créer l'AGI dans le but de créer le chaos…
Et vous, qu'en pensez-vous ? Croyez-vous au témoignage d'Helen Toner, ou doutez-vous de ses accusations ? Quelle est la véritable intention de Sam Altman et que vous inspire ce personnage ? Partagez votre ressenti en commentaire !
La rivalité légendaire entre Microsoft et Apple connaît un nouveau souffle avec l'avènement de l'intelligence artificielle générative. Dans une course effrénée, les deux géants de la tech se livrent une bataille féroce, aux enjeux technologiques et financiers considérables.
La rivalité légendaire entre Microsoft et Apple, vieille de 40 ans et initiée par les fondateurs visionnaires Bill Gates et Steve Jobs, connaît un nouveau souffle avec l'émergence de l'intelligence artificielle générative.
La rivalité légendaire entre Microsoft et Apple connaît un nouveau souffle avec l'avènement de l'intelligence artificielle générative. Dans une course effrénée, les deux géants de la tech se livrent une bataille féroce, aux enjeux technologiques et financiers considérables.
La rivalité légendaire entre Microsoft et Apple, vieille de 40 ans et initiée par les fondateurs visionnaires Bill Gates et Steve Jobs, connaît un nouveau souffle avec l'émergence de l'intelligence artificielle générative. Après des décennies de batailles acharnées pour la domination du marché informatique, les deux géants technologiques se retrouvent une fois de plus sur un champ de bataille brûlant.
Dans cette course effrénée à l'IA générative, Microsoft semble temporairement prendre l'avantage. Lors du lancement de sa nouvelle gamme d'ordinateurs portables Surface, le PDG Satya Nadella a mis en avant les capacités décuplées par l'IA de ses machines. Ceci affirme une supériorité de 58% par rapport aux MacBook Air d'Apple en termes de performances.
Ce regain de forme est en grande partie dû au partenariat stratégique nouée par Microsoft avec OpenAI, la start-up pionnière dans le domaine de l'IA générative dirigée par Sam Altman. Grâce à ce partenariat, Microsoft a pu intégrer les modèles d'IA de pointe d'OpenAI au cœur de ses produits et services.
Cette décision stratégique s'explique par le succès fracassant d'OpenAI auprès de l'ensemble du secteur technologique. Grâce à des réalisations telles que les modèles de langage GPT-4 et GPT-4o, jugés remarquables par de nombreux experts, OpenAI est devenue une référence incontournable convoitée par les plus grandes entreprises technologiques.
Une bataille aux enjeux financiers considérables
Au-delà des aspects purement technologiques, cette nouvelle guerre de l'IA entre Microsoft et Apple revêt des enjeux financiers considérables. Grâce à son avance dans le domaine, Microsoft adépassé Apple en termes de valorisation boursière, atteignant les 3 160 milliards de dollars, contre 2 900 milliards pour son rival historique.
Ces chiffres astronomiques illustrent l'importance stratégique accordée à l'IA par les investisseurs et les analystes financiers. La capacité à développer et à intégrer avec succès des solutions d'IA de pointe est désormais perçue comme un facteur clé de compétitivité et de croissance future pour les entreprises technologiques.
Google lui faisait peur, alors Microsoft a vu OpenAI comme son sauveur. Finalement, tous ces milliards, déversés sur la start-up californienne, s'expliquent.
Tous les participants ne se trouvent pas au même niveau dans la course à l'intelligence artificielle. Si, en 2019, Microsoft a investi un milliard de dollars sur OpenAI, c'est à cause de Google. Les progrès du numéro un de la recherche en ligne en IA avaient trop impressionné le géant de l'informatique, à en croire ces mails internes.
Google lui faisait peur, alors Microsoft a vu OpenAI comme son sauveur. Finalement, tous ces milliards, déversés sur la start-up californienne, s'expliquent.
Tous les participants ne se trouvent pas au même niveau dans la course à l'intelligence artificielle. Si, en 2019, Microsoft a investi un milliard de dollars sur OpenAI, c'est à cause de Google. Les progrès du numéro un de la recherche en ligne en IA avaient trop impressionné le géant de l'informatique, à en croire ces mails internes.
La correspondance en question s'intitule Réflexions sur OpenAI. Elle implique les hauts responsables chez Microsoft :
Son président directeur général (PDG), Satya Nadella
Son directeur technique (DT), Kevin Scott
Sa directrice administrative et financière (DAF), Amy Hood
Précisons que la divulgation de ces mails internes — par Business Insider, mardi — intervient alors que a eu lieu dans le cadre du procès antitrust contre Google. Cette procédure fait suite à une instruction de trois ans du département américain de la Justice.
« Des années de retard », s'inquiétait Scott
Le choix de Microsoft de miser sur OpenAI pour faire avancer sa stratégie IA résulterait ainsi de la panique. Tout serait parti des inquiétudes de Kevin Scott.
Quand les projets IA de Google se résumaient à créer des entités virtuelles capables d'affronter des adversaires humains dans des jeux, le DT était loin d'être impressionné. C'était l'époque d'AlphaGo, programme conçu pour le jeu de go.
Il y a ensuite eu un tournant, le leader de la recherche en ligne s'est focalisé sur les grands modèles de langage (LLM). « Je me suis beaucoup inquiété », confie Scott dans un mail.
Il a évidemment évalué les écarts de capacités entre sa compagnie et Google pour entraîner les LLM. « Nous sommes plusieurs années en retard par rapport à la concurrence en termes d'apprentissage automatique », constate Scott dans un autre courriel du 12 juin 2019.
Le PDG fait pression sur sa directrice financière
En octobre 2018, Google avait BERT comme modèle de langage le plus avancé. Il avait fallu six mois aux ingénieurs de Microsoft pour arriver à un résultat de ce calibre.
Kevin Scott déplorait que leur « infrastructure n'était pas à la hauteur de la tâche ». Il saluait également dans la correspondance les efforts de la firme basée à Menlo Park.
Après lecture, Nadella a sans doute transmis les Réflexions sur OpenAI à sa DAF. Son mail comporte la mention « voilà pourquoi je veux faire ça ».
La réaction du PDG suggère que la DAF ne devait pas être emballée à l'idée de beaucoup investir dans l'intelligence artificielle. Convaincue par le constat de son DT, Hood a alors changé de position et sorti le chèque pour que Microsoft mise sur OpenAI.
L'homme de l'ombre du partenariat Microsoft et OpenAI
OpenAI s'impose aujourd'hui comme le numéro un de l'intelligence artificielle. La start-up californienne doit ce succès aux performances et à la popularité de ChatGPT. Les capacités de ce chatbot génératif reposent sur les puissants LLM de la start-up.
Le numéro un des logiciels a rattrapé son retard sur Google grâce à sa stratégie. Il peut également remercier son co-fondateur.
Rappelons que Bill Gates n'est plus à la tête de la compagnie depuis 2020. En revanche, il aurait toujours joué un grand rôle dans la relation avec OpenAI.
Le milliardaire philanthrope discuterait avec la start-up depuis 2016. Il aurait également aidé à conclure l'accord entre les deux entreprises.
Selon Bill Gates, l'intelligence artificielle va révolutionner notre rapport aux ordinateurs dans les cinq prochaines années.
Dans un récent billet sur son blog personnel, Bill Gates nous a livré sa vision de l'avenir des ordinateurs à l'ère de l'intelligence artificielle (IA). Et il semblerait que nous soyons à l'aube d'un changement radical dans notre façon d'interagir avec ces machines. Une révolution d'une ampleur telle que nous n'en avons pas connue depuis l'avènement des interfaces grap
Selon Bill Gates, l'intelligence artificielle va révolutionner notre rapport aux ordinateurs dans les cinq prochaines années.
Dans un récent billet sur son blog personnel, Bill Gates nous a livré sa vision de l'avenir des ordinateurs à l'ère de l'intelligence artificielle (IA). Et il semblerait que nous soyons à l'aube d'un changement radical dans notre façon d'interagir avec ces machines. Une révolution d'une ampleur telle que nous n'en avons pas connue depuis l'avènement des interfaces graphiques, selon le co-fondateur de Microsoft.
Un assistant personnel intelligent au cœur de l'expérience
Au cœur de cette mutation se trouve l'idée d'un « assistant personnel » basé sur l'IA. Cet agent intelligent deviendrait le point d'entrée unique pour toutes nos interactions avec l'ordinateur, remplaçant la myriade d'applications et de logiciels que nous utilisons actuellement. Plutôt que de passer d'un programme à l'autre pour accomplir différentes tâches, nous dialoguerions avec cet assistant pour tout, de la rédaction de documents à la planification d'un voyage en passant par l'analyse de données.
Mais ce qui distingue vraiment cet assistant, c'est sa capacité à apprendre et à s'adapter à chaque utilisateur. En observant nos activités, nos préférences et nos habitudes, il finirait par développer une compréhension approfondie de nos intentions et de nos schémas de comportement. Ainsi, non content de simplement répondre à nos requêtes, il pourrait anticiper nos besoins et nous proposer des suggestions pertinentes, même avant que nous ne les formulions.
Un avenir prometteur, mais des défis à relever
Bien que séduisante, cette vision soulève également des questions. Quel sera l'impact sur l'industrie du logiciel ? Jusqu'où devrons-nous aller dans le partage de nos données personnelles pour permettre à ces assistants de nous connaître aussi bien ? Et comment garantir la sécurité et la confidentialité de ces informations sensibles ?
Malgré ces interrogations, Bill Gates semble convaincu convaincu que nous entrons dans une nouvelle ère pour l'informatique. Une ère où l'IA ne sera plus seulement un outil, mais un véritable partenaire intelligent, capable de nous guider et de nous épauler dans nos tâches quotidiennes. Reste à voir si cette vision se concrétisera, et si nous serons prêts à embrasser ce changement de paradigme.
La France peut enfin affronter avec les grandes puissances de la haute technologie. Elle peut compter sur Mistral AI, le rival d'OpenAI. Cette intelligence artificielle propose des fonctionnalités clés, capable de propulser l'entreprise à la place du leader dans le secteur.
ChatGPT a dominé le secteur de l'IA depuis son lancement. Cet outil est doté de plusieurs fonctionnalités clés pour satisfaire les utilisateurs. Cependant, les rivales ne sont pas très loin. En effet, la France a Mistral A
La France peut enfin affronter avec les grandes puissances de la haute technologie. Elle peut compter sur Mistral AI, le rival d'OpenAI. Cette intelligence artificielle propose des fonctionnalités clés, capable de propulser l'entreprise à la place du leader dans le secteur.
ChatGPT a dominé le secteur de l'IA depuis son lancement. Cet outil est doté de plusieurs fonctionnalités clés pour satisfaire les utilisateurs. Cependant, les rivales ne sont pas très loin. En effet, la France a Mistral AI. Cette entreprise offre les mêmes options qu'OpenAI, mais à quelques exceptions près. Avec les investissements, Mistral AI peut se hisser parmi les références du secteur. Voici tout ce que vous devez savoir sur cette entreprise prometteuse de la high-tech.
Tout d'abord, voici la petite histoire de Mistral AI
La start-up française spécialisée en IA, Mistral AI, a été cofondée en avril 2023 par d'anciens spécialistes de l'intelligence artificielle. Arthur Mensch, l'ex-chercheur de DeepMind, et les deux employés de MetaThimothée Lacroix et Guillaume Lampe se sont associés pour lancer cette entreprise.
En décembre dernier, Mistral AI a levé plus de 390 millions d'euros auprès de LightSpeed Ventures et d'autres investisseurs. Plusieurs entreprises comme Nvidia, et Salesforce ont aussi contribué à l'avancée des projets de cette référence française.
L'investissement de Microsoft, ainsi que les autres opportunités, ont permis à Mistral AI de se rivaliser avec ChatGPT. Actuellement, la start-up dispose de trois abonnements payants, ainsi que d'une offre open source. Cette approche est devenue une habitude dans le monde de l'IA. Souvenez-vous, les entreprises comme OpenAI, Google, ou Anthropic ont suivi cette même démarche.
Quel modèle LLM utilise Mistral AI actuellement ?
Afin de concurrencer avec ChatGPT, Mistral AI devait innover le monde de l'IA. La start-up s'est alors focalisée sur le lancement et le perfectionnement de son modèle LLM.
« Nous sommes convaincus qu'en formant nos propres modèles, en les publiant ouvertement et en encourageant les contributions de la communauté, nous pouvons construire une alternative crédible à l'oligopole émergent de l'IA. »
Mistral AI a alors lancé Mixtral 8x7B. Ce modèle de langage dispose de 8 modèles experts ainsi que d'un modèle de routage. La majorité va se focaliser sur le traitement des prompts de l'utilisateur. En tout, cette technologie de Mistral AI est capable de traiter environ 45 milliards de paramètres. Cependant, un échantillon (12 milliards) va se concentrer sur un token du prompt. Cette approche permet à l'IA de rivaliser avec les modèles les plus performants.
En effet, Mixtral 8x7B affiche les mêmes puissances que GPT-3.5 et Llama2-70B. Toutefois, ce modèle LLM possède une vaste fenêtre contextuelle, à hauteur de 32 tokens. De plus, il prend en charge plus de 5 langues. Le français, bien sûr, l'anglais, l'italien, l'allemand et l'espagnol.
Les fonctionnalités de Mistral AI
Comme les entreprises d'intelligence artificielle de référence, Mistral AI propose plusieurs fonctionnalités. Toutefois, le rival français d'OpenAI a des fonctionnalités spécifiques.
Chatbot
Les utilisateurs peuvent manipuler la fonctionnalité chatbot de Mistral AI. Jusque-là, rien de trop spécifique. Il suffit alors de poser des questions à l'IA, et elle répond dans les secondes à venir.
Mais les spécialistes de Mistral AI ont perfectionné leur chatbot. Avec les dernières versions, l'IA peut réagir de manière plus humaine. C'est une aubaine pour les entreprises. En effet, cette intelligence artificielle peut assurer le service client. Mais il faut toujours un agent pour le superviser.
Création de contenu
Textes de publications, articles, ou autres. Mistral AI est devenu une référence pour la rédaction automatisée. Les utilisateurs peuvent l'exploiter afin de créer ces contenus. Cette fonctionnalitéallège alors les missions de certains salariés.
Prenons l'exemple des spécialistes du marketing. Ces derniers peuvent rédiger un texte publicitaire en quelques secondes avec l'IA. Mais il faut toujours vérifier la précision des phares.
Traduction
Oui, Mistral AI est capable de traduire des contenus textuels. Les entreprises multinationales peuvent alors échanger avec plusieurs pays avec cette fonctionnalité. C'est aussi une aubaine pour les start-ups. En effet, ces jeunes sociétés peuvent développer leurs relations à travers la planète.
Pour les développeurs
Certains programmeurs exploitent Mistral AI dans des tâches assez techniques. En effet, cette IA peut générer des lignes de code, résoudre des bugs, et même expliquer les problèmes complexes. En plus d'être un outil de référence pour les professionnels, Mistral AI est aussi une aubaine pour les débutants.
Analyse de données
L'IA peut se focaliser sur une base de données conséquente afin d'en tirer les informations les plus précieuses. Cette fonctionnalité est actuellement exploitée dans plusieurs secteurs, tels que la finance.
Quelles sont les propositions de Mistral AI ?
Le Chat, le chatbot gratuit de Mistral AI
Mistral AI se veut être accessible pour le grand public. Pour offrir son IA à tous les utilisateurs, l'entreprise a lancé « Le Chat ». Ce chatbot open source est capable d'interagir avec l'usager.
Avec une simple adresse mail, et un mot de passe, les intéressés peuvent manipuler ce chatbot. Il fonctionne comme un véritable moteur de recherche. Les prompts, ou les requêtes textuelles sont les points de départ. Si l'utilisateur maîtrise « Le Chat », ce dernier peut devenir un assistant virtuel gratuit. Mais les fonctionnalités spécifiques ne sont pas au rendez-vous.
Mistral Large, la version surpuissante de l'IA
Chaque entreprise IA a une offre payante pour satisfaire les utilisateurs. À son tour, Mistral AI a lancé Mistral Large. Les spécialistes du rival français d'OpenAI se sont focalisés sur le perfectionnement du temps de latence et de la précision des réponses. De plus, Mistral Large est personnalisable à volonté.
Les entreprises qui souhaitent exploiter cet outil peuvent l'installer sur leur site ou sur leur plateforme cloud. Comme quoi, Mistral AI veut devenir l'IA numéro un dans le domaine professionnel.
Mistral AI announces Mistral Large
top-tier reasoning capacities, is multi-lingual by design, has native function calling capacities and a 32k model.
Avec l'offre moins coûteuse, Mistral Small, les startups peuvent utiliser les performantes de Mistral AI. Seul le temps de latence diffère avec le modèle Large.
Quant à Mistral Embedded, ce modèle facilite les recherches sémantiques. Cependant, il ne prend en charge que la langue anglaise.
Mistral AI vs les autres IA de références
Certes, les entreprises IA proposent des fonctionnalités similaires. Toutefois, elles ont toutes leurs particularités. En effet, cette stratégie contribue au développement de ces sociétés.
Avec son approche multilingue et ses capacités sur la programmation, Mistral AI est destiné à tous les utilisateurs. De plus, son ascension ne va pas s'arrêter en si bon chemin. L'entreprise vient de décrocher des partenariats avec des géants de l'IA, comme Nvidia.
On va ensuite se focaliser sur OpenAI. Cette entreprise IA de référence a su consolider sa place de leader dans le domaine de l'IA. Effectivement, elle envisage de lancer GPT-5 d'ici peu. Mais en attendant cette innovation, OpenAI a annoncé une version surpuissante de GPT-4 Turbo.
Anthropic, avec son modèle Claude, est le dernier dans la liste. En plus de respecter les conditions de performance, cette entreprise se concentre aussi sur la sécurité et l'éthique. Cette stratégie lui vaut une place en or dans le secteur de la high-tech.
Concernant les abonnements
Mistral AI propose des forfaits adaptés à toutes les bourses. Pour commencer, les utilisateurs peuvent compter sur « Le Chat ». Ce chatbot est totalement gratuit. Mais il faut souscrire à un abonnement payant pour bénéficier de fonctionnalités spécifiques.
Mistral Large est à 7,52 euros pour 1 million de jetons d'entrée, et 22,56 euros pour 1 million de jetons de sortie. Concernant le modèle Small, ce dernier est à 1,88 euro (1 million de jetons d'entrée) et 5,64 euros pour 1 million de jetons de sortie. Pour la version Embedded, le forfait sera à 0,009 4 euro pour 1 million de jetons d'entrée.
L'avenir de Mistral AI
Même avec sa lancée actuelle, Mistral AI n'en est qu'à ses débuts. Cependant, l'entreprise dispose déjà d'un financement conséquent. De plus, elle est évaluée à plus de 2 milliards d'euros en bourse, selon le dernier rapport de Reuters. Mistral AI est dans la liste des meilleures entreprises IA françaises actuellement.
Le rival d'OpenAI ne compte pas s'arrêter en si bon chemin. Avec son approche innovante, ses LLM, et ses offres open source, l'entreprise pourra devenir une référence d'ici peu.
Dans le domaine de la santé, par exemple, les moteurs IA de Mistral sont les bases pour développer des outils de diagnostic. Cette stratégie contribue à l'amélioration de la prise en charge des patients.
Concernant l'éducation, les fonctionnalités de codage et de création de contenu aident à la conception de plateforme d'apprentissage personnalisé pour les élèves.
Quant à la finance, la capacité d'analyse et de prise de décision de l'IA est un atout pour évaluer les risques financiers. C'est aussi un moyen efficace pour détecter les fraudes.
Enfin, le domaine de l'industrie. L'IA de Mistral peut automatiser les différentes tâches. Cette opportunité accélère le processus de production.
Hume EVI est le premier chatbot d'intelligence artificielle capable de détecter vos émotions, et de réagir en changeant son ton et ses propos. Découvrez tout ce qu'il faut savoir sur cet outil qui marque un cap dans l'évolution de l'IA, quels sont les cas d'usage possibles, et comment la tester dès maintenant !
Nous vous en parlions récemment dans cet article : l'IA est maintenant capable de détecter nos émotions et de réagir. C'est le cas du nouveau chatbot EVI, que nous vous proposons de dé
Hume EVI est le premier chatbot d'intelligence artificielle capable de détecter vos émotions, et de réagir en changeant son ton et ses propos. Découvrez tout ce qu'il faut savoir sur cet outil qui marque un cap dans l'évolution de l'IA, quels sont les cas d'usage possibles, et comment la tester dès maintenant !
Nous vous en parlions récemment dans cet article : l'IA est maintenant capable de détecter nos émotions et de réagir. C'est le cas du nouveau chatbot EVI, que nous vous proposons de découvrir plus en détail dans ce dossier complet !
Développé par la startup Hume, fondée par l'ancien chercheur de Google DeepMind dénommé Alan Cowen, EVI est un assistant vocal basé sur un LLM (large modèle de langage) similaire à OpenAIGPT.
Toutefois, l'objectif que s'est fixé Hume est d'apporter l'empathie et l'intelligence émotionnelle dans le domaine des chatbots IA.
Ainsi, après une levée de fonds de 50 millions de dollars auprès de Comcast Ventures ou encore LG, l'entreprise basée à New York vient de dévoiler son produit phare : EVI (Empathic Voice Interface) : le premier bot type ChatGPT capable de surveiller, prédire et s'adapter à votre humeur.
Qu'est-ce que Hume EVI ?
L'Interface Vocale Empathique (EVI) se distingue des autres chatbots puisque les interactions ne sont pas textuelles comme avec ChatGPT.
À la place, vous pouvez utiliser votre voix pour lui parler. Elle répondra en retour avec sa propre voix synthétique.
Tout comme OpenAI avec ChatGPT-Voice et le robot Figure 01, Hume a fait en sorte que son robot parle de façon plus naturelle et émotive grâce à des mots de pause et des intonations.
Ce n'est pas tout : la startup a fait en sorte que le robot s'exprime de façon à répondre, refléter ou contrer le ton émotionnel de son interlocuteur humain.
Cette IA d'un genre nouveau est donc capable d'adopter un ton similaire à celui des humains en se basant sur vos expressions, et de réagir avec un langage répondant à vos besoins pour maximiser votre satisfaction.
Elle décide aussi quand parler en fonction du ton de votre voix. Ainsi, les conversations sont beaucoup plus naturelles qu'avec les autres chatbots existants.
Contrairement aux assistants vocaux traditionnels, son intelligence émotionnelle lui permet de discerner les nuances du discours humain et d'adapter ses réponses en fonction.
Comment ça marche ? Quelles sont ses capacités ?
Entraînée sur des millions de conversations humaines, EVI comprend et génère un discours expressif. Plusieurs capacités la rendent empathique et la distinguent des autres IA.
Tout d'abord, elle peut employer un ton ressemblant à l'expression humaine pour étendre l'expérience conversationnelle. Elle adapte aussi son langage en fonction de l'utilisateur, pour répondre efficacement à ses besoins.
Selon le ton de l'utilisateur, elle détecte la tournure que prend la discussion pour des interactions très fluides. En cas d'interruption, elle s'arrête, mais peut ensuite reprendre où elle en était.
Mieux encore : EVI apprend des réactions de l'utilisateur pour s'améliorer continuellement et accroître la satisfaction de l'utilisateur au fil du temps.
Outre ces fonctionnalités empathiques, cette IA propose des capacités de traduction et de conversion text-to-speech fiables et rapides. Ceci la rend adaptable à diverses situations, d'autant qu'elle s'intègre avec n'importe quel LLM.
EVI has a number of unique empathic capabilities
1. Responds with human-like tones of voice based on your expressions 2. Reacts to your expressions with language that addresses your needs and maximizes satisfaction 3. EVI knows when to speak, because it uses your tone of voice…
Selon Alan Cowen, CEO de scientifique en chef de Hume, l'IA doit impérativement être empathique si nous voulons l'utiliser de manière à améliorer le bien-être de l'humain.
Il estime que la principale limite des systèmes actuels est qu'ils sont guidés par des instructions superficielles, propices aux erreurs et ne permettant pas d'exploiter pleinement leur vaste potentiel.
Son équipe a donc créé une IA qui apprend directement à partir des indicateurs du bonheur humain. Ces données ont été utilisées pour son entraînement, parallèlement aux datasets généralement utilisés pour les autres IA multimodales.
Ainsi, EVI est capable de reconstruire les préférences humaines et de mettre à jour ses connaissances pour chaque nouvelle personne avec laquelle elle parle et chaque application à laquelle elle est intégrée.
De son côté, Cowen est convaincu que les interfaces vocales seront très bientôt la façon dont nous interagissons par défaut avec l'IA. Pour cause, nous parlons quatre fois plus vite que nous tapons sur un clavier.
Cette approche permet aussi de libérer les yeux et les mains, et de véhiculer davantage d'informations via le ton, le rythme ou le timbre de la voix.
Quelles sont les applications possibles pour le futur ?
À l'avenir, une telle IA pourrait par exemple être utilisée par les Call Centers pour répondre à la colère des clients avec empathie et compréhension.
Elle pourrait également détecter les signes précoces de détresse émotionnelle ou de troubles mentaux chez les individus, et fournir des conseils, des ressources pour les aider ou même alerter les professionnels lorsque cela est nécessaire.
Dans le domaine de la formation ou du coaching professionnel, l'IA empathique pourrait analyser les réactions émotionnelles des apprenants ou des clients et ajuster son approche pour mieux répondre à leurs besoins. Cela favoriserait un apprentissage ou un développement plus efficace.
On peut également envisager la façon dont EVI peut aider les enseignants à comprendre les émotions des élèves dans les environnements éducatifs pour ajuster leurs méthodes d'enseignement afin de favoriser l'engagement et la performance académique.
La compréhension des émotions pourrait aussi être particulièrement utile pour améliorer l'interaction humain-robot dans les contextes de soins aux personnes âgées ou handicapées.
Un autre cas d'usage pourrait être le soutien émotionnel aux patients souffrant de maladies chroniques, de troubles de l'humeur ou de conditions de santé mentale.
De manière générale, une telle IA pourrait permettre d'humaniser davantage les robots afin de rendre les interactions plus saines et naturelles. Néanmoins, on peut aussi craindre qu'elle soit exploitée par les publicitaires ou les politiciens pour nous manipuler en jouant sur nos émotions…
Bientôt une IA similaire par OpenAI ?
Même si EVI propose une approche innovante, OpenAI a récemment dévoilé Voice Engine : une IA capable de reconnaître et d'imiter n'importe quelle voix, de traiter les commandes vocales et de convertir le texte en discours oral.
Elle peut générer de la voix et de l'audio à partir de prompts textuels, oraux ou visuels. Lors d'une récente interview avec Bill Gates, le CEO Sam Altman a souligné l'importance de la multimodalité pour l'IA.
D'ailleurs, GPT-5 sera également capable de générer de la vidéo ou de l'audio en plus du texte. Cette IA sera aussi axée sur la personnalisation et la connaissance de l'utilisateur.
Déjà l'an dernier, OpenAI a lancé un assistant vocal dans l'application ChatGPT pour Andorid et iOS afin de permettre aux utilisateurs de s'engager dans des conversations orales avec l'IA.
Récemment, la firme a noué un partenariat avec Figure AI pour incorporer ChatGPT aux robots humanoïdes 01. Dans la vidéo de démonstration, le robot parvient à prendre une voix naturelle grâce à ses intonations et ses interruptions volontaires…
Comment tester EVI dès maintenant ?
Vous pouvez commencer à tester EVI dès maintenant sur le site officielhume.ai en suivant ce lien. Autorisez le microphone si nécessaire, et commencez à parler.
L'IA va répondre, et l'écran montrera visuellement votre ton et votre état émotionnel. Dans la mesure du possible, évitez tout de même de dévoiler des informations sensibles…
Par ailleurs, EVI sera également mis à disposition d'autres entreprises pour l'utiliser dans leurs propres produits !
Outre l'interface publique, l'API permet d'intégrer cette IA à d'autres applications en toute simplicité. On peut donc s'attendre à ce que de nombreuses entreprises adoptent ce nouveau chatbot…
Un partenariat évalué à plus de 2 milliards de dollars (2 milliards d’euros) entre Microsoft et Mistral. Cet investissement va booster l’activité des deux entreprises. Comme quoi, l’empire de Bill Gates veut devenir un leader dans le secteur de l’IA. Souvenez-vous, cette multinationale a déjà investi plus de 10 milliards de dollars dans un récent partenariat avec OpenAI.
Microsoft X Mistral, cet accord sera bientôt en vigueur. Le géant américain vient même de le confirmer par l’intermédiaire
Un partenariat évalué à plus de 2 milliards de dollars (2 milliards d’euros) entre Microsoft et Mistral. Cet investissement va booster l’activité des deux entreprises. Comme quoi, l’empire de Bill Gates veut devenir un leader dans le secteur de l’IA. Souvenez-vous, cette multinationale a déjà investi plus de 10 milliards de dollars dans un récent partenariat avec OpenAI.
Microsoft X Mistral, cet accord sera bientôt en vigueur. Le géant américain vient même de le confirmer par l’intermédiaire d’une annonce officielle. Cette collaboration sera alors bénéfique pour les deux entreprises. Pour Microsoft, c’est une opportunité pour œuvrer avec une entreprise IA émergente en Europe. Concernant Mistral, cette entente sera une aubaine pour sa croissance. Souvenez-vous, cette start-up française n’en est qu’à ses débuts. On attend avec impatience la suite des évènements.
Les modèles de langage de Mistral sur Azure AI de Microsoft
Après OpenAI, c’est au tour de Mistral de s’illustrer sur la plateforme de Microsoft. Ses modèles LLM seront à la disposition des internautes sur Azure AI. Mais la collaboration ne s’arrête pas là. Microsoft va aussi contribuer à la croissance de Mistral sur le long terme. Les deux entreprises se concentreront sur le développement de grands modèles de langage innovants.
Microsoft has partnered with French AI startup Mistral. It involves Microsoft taking a minority stake in Mistral, with the startup's open and commercial AI models heading to Microsoft's Azure AI platform. Details below https://t.co/CuwnAsmLvh
La start-up française n’a pas attendu longtemps pour satisfaire les adeptes de l’intelligence artificielle. Elle vient d’annoncer aujourd’hui Mistral Large. Cette IA sera un concurrent de taille pour le modèle GPT-4 d’OpenAI. L’entreprise de Sam Altman aura un autre rival dans son secteur de prédilection.
« Mistral Large obtient d’excellents résultats sur les benchmarks couramment utilisés, ce qui en fait le deuxième modèle au monde généralement disponible via une AI ». Cette déclaration de l’équipe de Mistral affirme la performance de cet outil sur le marché.
Ce modèle est alors accessible sur la plateforme de la start-up française. Et avec la collaboration Microsoft X Mistral, l’IA sera à la disposition des utilisateurs sur Azure AI Studio, ou Azure Machine Learning.
Par ailleurs, la référence française vient aussi d’annoncer Mistral Small. Cette IA a bénéficié d’une amélioration pour s’aligner avec la concurrence.
Et ce n’est pas tout. Mistral Large dispose d’un chabot, comme les autres IA. Le Chat offre plusieurs possibilités de conversation pour l’utilisateur. Il se base sur les modèles de langage de Mistral AI.
Une opportunité de commercialisation à l’échelle mondiale
Actuellement, les modèles de langage de Mistral sont en Open Source. L’objectif est de fournir les outils nécessaires pour développer les compétences des spécialistes du milieu. Toutefois, Mistral peut explorer d’autres stratégies avec Microsoft. Désormais, les utilisateurs peuvent acheter cette IA et ses fonctionnalités sur les plateformes du géant américain.
Joueurs PC, voilà Auto Super Resolution ! Cette nouvelle fonctionnalité de Windows améliore les graphismes de vos jeux à l’aide de l’intelligence artificielle.
La prochaine mise à jour Windows 11 24H2 va intégrer une nouvelle fonctionnalité appelée Auto Super Resolution. Cette option s’appuie sur l’intelligence artificielle pour optimiser la qualité graphique des applications et des jeux sur l’ordinateur portable ou de bureau. Mais cette nouveauté n’arrivera pas avant le prochain semestre.
Joueurs PC, voilà Auto Super Resolution ! Cette nouvelle fonctionnalité de Windows améliore les graphismes de vos jeux à l’aide de l’intelligence artificielle.
La prochaine mise à jour Windows 11 24H2 va intégrer une nouvelle fonctionnalité appelée Auto Super Resolution. Cette option s’appuie sur l’intelligence artificielle pour optimiser la qualité graphique des applications et des jeux sur l’ordinateur portable ou de bureau. Mais cette nouveauté n’arrivera pas avant le prochain semestre.
Microsoft poursuit le déploiement de l’intelligence artificielle dans l’ensemble de ses produits. Son moteur de recherche Bing et son navigateur Edge intègrent déjà son chatbot génératif Copilot. Le mastodonte américain de l’informatique souhaite désormais davantage d’IA pour son système d’exploitation pour ordinateur.
Une refonte de Windows 11 ?
Microsoft développe actuellement la prochaine grosse mise à jour de Windows 11. Celle-ci devrait être disponible plus tard cette année. Cette version 24H2 se baserait sur une nouvelle plateforme du système d’exploitation. Elle apporterait des améliorations en matière de performance et de sécurité, ainsi que des nouvelles fonctionnalités notables.
D’autre part, la version 24H2 devrait mettre l’accent sur les expériences d’IA de nouvelle génération. Rappelons que l’an dernier, Microsoft avait évoqué cet aspect à plusieurs reprises. Des rumeurs suggèrent une nouvelle version de Copilot avec des performances renforcées significativement.
Par ailleurs, Microsoft viserait une sortie en septembre pour la version 24H2. La compagnie fondée par Bill Gates prévoit de finaliser la mise à jour pendant la saison estivale.
Version 24H2 will have an AI "Super Resolution" feature, as previous reports mentioned. Here are some settings for it in Graphics settings – a default toggle and per-app options. (26052) pic.twitter.com/fI9t4ksTWH
Plus beau et plus fluide avec Auto Super Resolution
Le grand public va ainsi devoir patienter plusieurs mois avant le déploiement de l’Auto Super Resolution. En revanche, les membres du programme Windows Insiders peuvent déjà y accéder. En effet, Microsoft a introduit la fonctionnalité dans la Build 26052. À noter que l’activation de l’option s’effectue en suivant le chemin Paramètres > Système > Écran.
Par ailleurs, la nouvelle fonctionnalité se base sur l’intelligence artificielle pour « rendre les jeux supportés plus fluides avec des détails améliorés ». En effet, elle améliore les performances en modifiant la résolution de l’écran pour garantir une fluidité optimale dans les jeux.
Soulignons que les utilisateurs de cartes graphiques Nvidia ou AMD sont familiers de ce genre d’options. D’autre part, les prérequis matériel pour bénéficier de la fonctionnalité ne sont pas encore connus.
Performances de jeux améliorées, mais pas que
Si Auto Super Resolution tient toutes ses promesses, la fonctionnalité pourrait radicalement faciliter le quotidien des joueurs. Ces derniers n’auraient peut-être plus besoin de beaucoup dépenser en matériel graphique pour bénéficier de performances de jeux élevées.
Rappelons que l’utilisation de l’intelligence artificielle pour les traitements graphiques s’est considérablement améliorée au cours des deux dernières années.
Par ailleurs, la fonctionnalité pourra être utilisée dans des applications autres que les jeux. L’Auto Super Resolution va également assister les lecteurs multimédia, notamment pour la lecture des vidéos. De plus, les périphériques, tels que la webcam, vont en bénéficier. La fonctionnalité ajustera la résolution en fonction des ressources disponibles.
Pour revenir à la mise à jour 24H2, Microsoft prévoit des améliorations de la gestion de la batterie. Cela pour augmenter l’autonomie des ordinateurs portables.
Grâce aux générateurs de vidéos IA, n’importe qui peut désormais créer ses propres vidéos très facilement à partir d’un prompt. Que vous souhaitiez produire des vidéos de formation pour votre entreprise, agrémenter votre blog ou site web, ou encore devenir YouTuber, découvrez les meilleurs outils !
Le contenu vidéo est devenu omniprésent dans la sphère numérique, et incontournable pour les entreprises et les créateurs de contenu.
On estime que les vidéos représentent désormais plus de 80%
Grâce aux générateurs de vidéos IA, n’importe qui peut désormais créer ses propres vidéos très facilement à partir d’un prompt. Que vous souhaitiez produire des vidéos de formation pour votre entreprise, agrémenter votre blog ou site web, ou encore devenir YouTuber, découvrez les meilleurs outils !
Le contenu vidéo est devenu omniprésent dans la sphère numérique, et incontournable pour les entreprises et les créateurs de contenu.
On estime que les vidéos représentent désormais plus de 80% du trafic sur le web. De plus en plus d’internautes préfèrent ce format plutôt que les textes et les images. Elles offrent aussi une meilleure portée organique sur les réseaux sociaux.
Toutefois, la production et la diffusion de vidéo coûtent plus cher et prennent plus de temps. Du moins, c’était le cas jusqu’à présent.
Désormais, l’intelligence artificielle change la donne ! Jamais auparavant il n’avait été aussi simple de créer des vidéos grâce aux générateurs IA.
Et cette technologie est en plein essor : selon Gminsights, le marché du text-to-video devrait croître de 35% entre 2023 et 2032. Voici les meilleurs outils du marché !
En février 2024, OpenAI a surpris tout le monde en dévoilant Sora : un générateur de vidéos qui a une longueur d’avance incroyable sur tous les autres outils de ce dossier.
À partir d’un simple prompt, cette IA peut créer une vidéo d’une durée maximale de 60 secondes. Elle peut produire des vidéos photoréalistes, des dessins animés, des clips musicaux, des scènes de jeu vidéo ou même des environnements 3D.
Il est possible de décrire le contenu, le style ou même les mouvements de caméra dans le prompt. L’intelligence artificielle se charge de générer une vidéo correspondant à la requête, avec une impressionnante fidélité.
Elle peut également animer des images fixes, ou encore modifier une vidéo existante sur demande. Vous pouvez par exemple changer le décor, les personnages ou n’importe quel autre élément.
Le fonctionnement de Sora repose à la fois sur le modèle de diffusion du générateur d’images DALL-E 3 et sur le Transformer de ChatGPT.
Malheureusement, Sora n’est pas encore disponible pour le grand public. Avant de lancer cet outil, OpenAI veut le faire tester par des experts en sécurité pour anticiper toutes les dérives possibles et mettre en place des garde-fous…
Luma AI Dream Machine
La startup américaine Luma AI a lancé sa Dream Machine en juin 2024, permettant enfin à n’importe qui de créer des vidéos avec l’IA.
Vous pouvez non seulement générer des vidéos à partir de prompts, mais aussi uploader une image pour l’animer.
Ceci permet de donner vie aux images que vous avez créées avec des outils comme DALL-E ou MidJourney. Certains s’amusent aussi à laisser l’IA imaginer la suite de memes bien connus ou d’œuvres d’art célèbres…
Selon les testeurs beta, l’outil peut reproduire fidèlement des objets, des personnages, des actions ou des environnements spécifiques tout en maintenant un mouvement et une narration fluides et cohérents.
A terme, l’objectif de Luma est de créer un « moteur d’imagination universel » capable de « rêver » n’importe quel concept en vidéo. Ses cas d’usage pourraient être le storyboarding ou la création de personnages, de clips vidéo, voire même de films complets…
Pour tester dès à présent la Dream Machine, il vous suffit de vous rendre sur le site web officiel de Luma Labs. Inscrivez-vous avec votre compte Google, et commencez à créer vos vidéos ! Consultez notre tutoriel complet en suivant ce lien !
Runway Gen-3
Pionnier des IA de génération de vidéo, Runway a dévoilé son modèle Gen-3 en juin 2024. Cette nouvelle version apporte d’importantes améliorations en termes de fidélité, de cohérence et de mouvement.
Pour rappel, Runway Gen-2 était le tout premier modèle IA text-to-video disponible dans le commerce, avec un lancement en juin 2023.
Depuis lors, de nombreux concurrents ont fait leur apparition et Runway s’est fait dépassé. Avec Gen-3, la firme américaine compte bien faire son grand retour sur le devant de la scène.
Ce modèle se base sur une toute nouvelle infrastructure conçue pour l’entraînement multimodal à grande échelle, et a été entraîné simultanément sur des images et des vidéos pour un réalisme accru.
Il permet aux utilisateurs de mieux contrôler le mouvement dans les vidéos, et peut comprendre les lois de la physique. Alors que la Gen-2 permettait de créer des vidéos de 4 secondes, la durée maximale a été étendue à 10 secondes.
La version Alpha sera ouverte aux abonnés dans le courant juin 2024, puis ultérieurement pour les utilisateurs de la version gratuite. Par la suite, d’autres modèles encore plus puissants basés sur la même infrastructure seront lancés…
Introducing Gen-3 Alpha: Runway’s new base model for video generation.
Gen-3 Alpha can create highly detailed videos with complex scene changes, a wide range of cinematic choices, and detailed art directions.https://t.co/YQNE3eqoWf
La startup chinoise Kuaishou Technology a dévoilé son générateur de vidéo Kling début juin 2024. Rapidement, cet outil a rencontré un succès viral sur les réseaux sociaux.
Les vidéos qu’il génère à partir de simples prompts sont très réalistes, et rivalisent même avec celles créées par OpenAI Sora.
Si Kling est très rapidement populaire, c’est aussi parce que Kuaishou est déjà connu en Chine pour son application de création de vidéos qui compte 400 millions d’utilisateurs quotidiens.
Cette appli se hisse en deuxième position du marché chinois, juste derrière Douyin (la version chinoise de TikTok) et ses 600 millions d’utilisateurs.
Encore en phase de test, Kling peut transformer des textes en clips vidéo d’une durée maximale de 2 minutes en définition 1080p.
Sora by OpenAI is insane.
But KWAI just dropped a Sora-like model called KLING, and people are going crazy over it.
Il peut prendre en charge plusieurs ratios d’aspect, interpréter les prompts pour créer des vidéos imitant le monde physique et faire preuve d’imagination, selon ses créateurs.
Sa technologie repose sur un encodeur automatique variationnel 3D (VAE) pour la reconstruction faciale et corporelle, permettant de représenter des expressions détaillées et des mouvements de membres à partir d’une seule photo de corps.
Par ailleurs, un mécanisme d’attention conjointe spatio-temporelle 3D permet au modèle de prendre en charge des scènes et des mouvements complexes et assure que le contenu généré adhère aux lois de la physique.
En Chine, il est d’ores et déjà possible d’utiliser Kling gratuitement via les applications Kuaishou, Kwai et KwaiCut. Malheureusement, un numéro de téléphone chinois est indispensable et vous ne pouvez donc pas le tester en France.
Vidu
Le paysage de l’intelligence artificielle voit l’émergence d’un nouvel acteur prometteur avec l’arrivée de Vidu, un générateur texte-vidéo développé par la société chinoise Shengshu. Présenté comme un outil hautement cohérent, dynamique et compétent, Vidu vise à révolutionner la création de contenu visuel à partir de simples textes.
Grâce à son modèle de diffusion basé sur U-ViT, il peut produire des vidéos en 1080p jusqu’à 16 secondes en une seule génération. Cette capacité à gérer des vidéos de longue durée avec efficacité en fait un outil précieux pour les créateurs de contenu et les professionnels de l’audiovisuel.
Ce qui distingue Vidu, c’est sa capacité à maintenir une cohérence narrative tout en offrant un dynamisme visuel captivant. Grâce à des algorithmes sophistiqués, il est capable de générer des scènes réalistes et imaginatives, rivalisant ainsi avec les meilleurs générateurs de vidéos disponibles sur le marché.
La polyvalence de Vidu se manifeste également dans sa compréhension des techniques de photographie professionnelle, lui permettant de créer des vidéos esthétiquement riches et engageantes. De plus, ses fonctionnalités avancées ouvrent la voie à des expériences de génération vidéo contrôlables, telles que la génération astucieuse en vidéo, la prédiction vidéo et la génération axée sur le sujet, avec des résultats prometteurs.
Pika
Créée en juin 2023, l’entreprise Pika AI a lancé son logiciel Pika 1.0 six mois plus tard. Son but ? Permettre à n’importe qui de créer des vidéos de qualité professionnelle sans le moindre effort pour donner vie à ses idées.
Il permet de créer des vidéos dans différents styles comme l’animation 3D, l’animation japonaise, les cartoons ou encore les séquences cinématiques. Par la suite, l’utilisateur peut éditer ou modifier ses vidéos de différentes façons.
Il est par exemple possible d’altérer les dimensions ou la longueur de la vidéo, et de modifier des éléments tels que les décors ou les personnes et leurs vêtements.
En parallèle, Pika propose aussi des fonctionnalités de conversion Text-to-Video, Image-to-Video, ou encore Video-to-Video. L’interface est très intuitive, afin d’être accessible au plus grand nombre.
Cet outil est disponible directement via le site web officiel, et rassemble déjà une communauté vibrante de plus de 500 000 utilisateurs produisant chaque semaine des millions de vidéos.
Avec la plateforme HeyGen, vous pouvez créer des vidéos d’entreprise en toute simplicité à l’aide de l’IA générative pour une large variété de cas d’usage.
Les utilisateurs peuvent convertir leur texte en vidéo professionnelle en quelques minutes, directement depuis un navigateur web.
Enregistrez votre voix pour créer un avatar personnalisé reprenant le discours dans la langue de votre choix, ou tapez le texte. Vous pouvez choisir parmi plus de 300 voix d’avatars !
De nombreuses options de personnalisations sont disponibles, et vous pourrez notamment combiner plusieurs scènes en une seule vidéo. Il est également possible d’ajouter de la musique.
Modelscope
"Will Smith eating spaghetti" generated by Modelscope text2video
Développé par la communauté de développeurs de Hugging Face, ModelScope Text To Video Synthesis est un outil permettant de créer des vidéos à partir d’un input textuel grâce à un modèle de Deep Learning.
Cette application est conçue pour être facile d’usage, et ne requiert aucune connaissance ou expérience en Machine Learning. Elle est accessible directement depuis la plateforme Hugging Face Space, où les utilisateurs peuvent découvrir de nombreux outils, modèles, datasets et documents de ML.
Ce générateur utilise différents modèles et fichiers pour générer des vidéos de haute qualité. Il peut être particulièrement utile pour les individus ou entreprises cherchant à automatiser la création de vidéo pour le marketing ou la publicité.
Vous pouvez créer des vidéos de format court, du texte animé, ou différents autres types de contenus. Il s’agit toutefois d’une solution limitée, dont le principal point fort est l’intégration avec les autres applications Hugging Face Space !
zeroscope_v2_576w, A watermark-free Modelscope-based video model optimized for producing high-quality 16:9 compositions and a smooth video output. This model was… pic.twitter.com/2w6eYBtUUD
Lancé en novembre 2023, Stable Video Diffusion est un générateur de vidéos créé par Stability AI a qui l’ont doit déjà le générateur d’images Stable Diffusion.
Il permet de transformer n’importe quelle image en courte vidéo. Plutôt qu’un véritable outil, ce projet expérimental repose sur deux modèles IA utilisant une technique appelée image-to-video.
Le premier modèle dénommé SVP produit une synthèse image-to-video d’une longueur de 14 images, et le second SVD-XT génère 25 images.
Ils peuvent fonctionner à une vitesse variée allant de 3 à 30 images par seconde, et produisent des vidéos de 2 à 4 secondes au format MP4 d’une définition de 576×1024.
Today, we are releasing Stable Video Diffusion, our first foundation model for generative AI video based on the image model, @StableDiffusion. As part of this research preview, the code, weights, and research paper are now available.
Les animations générées gardent une partie de l’image statique, et ajoutent des effets de panning,de zoom ou de mouvement.
Vous pouvez l’exécuter localement sur un ordinateur doté d’un GPU Nvidia. Comptez environ 30 minutes pour générer une vidéo de 14 images avec une carte RTX 3060.
Les services cloud comme Hugging Face ou Replicate permettent toutefois d’aller beaucoup plus rapidement. Stability insiste sur le fait qu’il s’agit d’un modèle de recherche qui n’en est encore qu’à ses débuts.
On ne sait pas exactement sur quelles vidéos l’IA a été entraînée, mais le document officiel précise que plus de 600 millions d’échantillons ont été agrégés sur le Large Video Dataset (LVD) constitué de 580 millions de clips annotés pour une durée totale de 212 ans.
Today, we are adding Stable Video Diffusion, our foundation model for generative video to the Stability AI Developer Platform API.
The model can generate 2 seconds of video, comprising of 25 generated frames and 24 frames of FILM interpolation, within an average time of 41… pic.twitter.com/CSUh3BoZ1a
Une option permet de contrôler la quantité de mouvement, mais c’est le seul contrôle proposé pour le moment. Toutefois, l’interprétation de l’image et la qualité de l’animation sont bluffantes.
Le modèle Stable Video Diffusion est ici combiné à la fonctionnalité Realtime Gen basée sur SDXL Turbo pour générer en même temps que vous tapez le prompt, afin de tester des idées sans avoir besoin d’attendre l’image complète.
Il est possible de rendre une vidéo privée ou de la rendre disponible sur un flux public pour que les autres utilisateurs puissent la trouver. Les vidéos sont au format MP4, et chaque génération coûte 25 crédits.
En décembre, la startup Leonardo avait levé 31 millions de dollars pour développer ses services. C’est ce qui lui a permis de s’aventurer dans le domaine de la génération de vidéos !
Développé par des chercheurs de l’Université de Stanford, WALT est un modèle IA capable de créer une vidéo photoréaliste à partir d’un prompt textuel ou d’une image.
Par rapport aux autres outils existants, l’une des prouesses de l’équipe est d’être parvenue à créer du mouvement 3D fluide et cohérent sur un objet.
Pour atteindre ce niveau de qualité, l’IA a été entraînée à la fois à partir de photos et de vidéos. Ceci a permis de donner au modèle une compréhension approfondie du mouvement dès le départ.
La qualité d’image est nettement inférieure à celle d’outils comme Runway ou Pika, mais il s’agit seulement d’un modèle de recherche.
Le modèle produit d’abord des clips 128×128, qui sont ensuite upsamplés pour atteindre une définition de 512×896 à 8 images par seconde. À titre comparatif, la version payante de Runway Gen-2 peut créer des clips jusqu’à 1536×896.
L’objectif de ces chercheurs est de créer un framework unifié de génération de vidéo et d’images afin de refermer le fossé qui sépare ces deux technologies en termes de progrès effectués.
En guise de démonstration, Stanford a partagé des clips de dragons crachant du feu, d’astéroïdes frappant la Terre et de chevaux courant sur une plage.
Google VideoPoet
Développé par Google, VideoPoet est un outil de génération de vidéo basé sur MAGVIT 2 : un puissant encodeur transformant les prompts en vidéos.
Son architecture de transformer « decoder-only » offre des capacités zero-shot et permet de créer du contenu pour lequel il n’a pas été entraîné spécifiquement.
Il permet donc de créer des vidéos de durée variable, avec beaucoup de mouvement fluide et captivant. Les contenus présentent une haute cohérence.
Son modèle de langage autorégressif entraîné sur de la vidéo, du texte, de l’image et de l’audio peut s’adapter à toutes les tâches de génération de contenu.
Il suit un processus d’entraînement en deux étapes, à la manière des autres LLM : un pré-entraînement, et une adaptation à des tâches spécifiques. C’est ce qui le rend adaptable et efficace.
En tant qu’IA multimodale, VideoPoet accepte divers inputstels que texte, des images, des vidéos ou de l’audio. Il est possible d’utiliser tous ces types de contenus en guise de prompt, et de générer un nouveau contenu. C’est donc un générateur « any-to-any ».
On retrouve également des fonctionnalités de stylisation, d’inpainting ou d’outpainting. Les possibilités de personnalisation sont nombreuses, avec notamment l’option de contrôler le mouvement de la caméra.
Dévoilé en septembre 2022 par Meta, Make-A-Video est un générateur de vidéo propulsé par l’IA. Il permet de créer du contenu vidéo à partir de prompts textuels ou d’images.
Cet outil peut aussi produire des variantes de vidéos existantes. Toutefois, il n’est pas encore disponible pour le grand public.
Plusieurs démonstrations ont été publiées par la firme en guise d’exemples. On peut notamment découvrir un jeune couple marchant sous la pluie, et un ours en peluche peignant un portrait.
La page de présentation met aussi en lumière la capacité de Make-A-Video à animer une image source statique. Par exemple, une tortue de mer sur une photo semble nage après avoir été traitée par l’IA.
La technologie derrière Make-A-Video est basée sur les outils existants dans le domaine du text-to-image tels que DALL-E. En juillet 2022, Meta avait annoncé son propre générateur d’images dénommé Make-A-Scene.
Au lieu d’entraîner son modèle sur des données de vidéo étiquetées, avec des légendes décrivant les actions présentées, la firme a pris les données de synthèse d’image et a appliqué des données d’entraînement vidéo pour que le modèle comprenne où un prompt de texte ou d’image peut exister dans le temps et l’espace.
Ainsi, l’IA peut maintenant prédire ce qui survient après l’image et afficher la scène en mouvement pendant une courte période. Les couches spatiales ont donc été étendues pour inclure les informations temporelles.
De nouveaux modules d’attention ont appris les dynamiques du monde temporel à partir d’une collection de vidéos. C’est ce qui a permis de créer cet outil dès 2022.
Le chercheur Simon Willison a néanmoins découvert que le dataset utilisé pour entraîner l’IA contient 10 millions de vidéos récupérés sur Shutterstock sans permission. De son côté, Andy Baio a remarqué 3,3 millions de vidéos additionnels provenant de YouTube…
Toutefois, pour l’heure, Meta n’a pas encore annoncé quand cette IA serait disponible pour le public ou qui y aurait accès. Un formulaire est disponible pour s’inscrire à la liste d’attente.
Cependant, la firme de Mark Zuckerberg anticipe déjà les risques liés à un tel logiciel. Sur la page officielle, elle explique qu’une watermark va permettre de s’assurer que les spectateurs sachent que la vidéo est générée par IA…
Le futur : ChatGPT et MidJourney pourront bientôt créer des vidéos
Après la génération d’images, MidJourney a annoncé le lancement prochain d’un générateur de vidéos. Selon le CEO David Holz, l’entraînement de ce nouveau modèle a commencé en janvier 2024.
L’outil sera lancé dans quelques mois, et pourrait bien s’imposer comme la nouvelle référence du marché s’il est aussi performant que pour les images.
En parallèle, lors d’une interview avec Bill Gates, le CEO d’OpenAI, Sam Altman, a lui aussi annoncé que le futur GPT-5 serait capable de générer des vidéos.
Cela confirme que la création de vidéos est la prochaine étape de l’IA générative, et que les meilleurs outils restent à venir avec l’irruption des plus grands géants de l’industrie sur ce secteur !
Autrefois à la tête de Microsoft, Bill Gates reste un acteur clé dans le monde de l’innovation technologique. La réalisation de ses prédictions sur l’IA est attendue avec impatience et celles-ci ont bien l’air de déjà se concrétiser.
Gates avait prédit que l’IA jouerait un rôle crucial dans les années à venir, et il avait raison. Mais son génie réside dans les détails. Il avait spécifiquement mentionné que l’intégration de l’IA dans la téléphonie mobile démocratiserait ses avantages pour le g
Autrefois à la tête de Microsoft, Bill Gates reste un acteur clé dans le monde de l’innovation technologique. La réalisation de ses prédictions sur l’IA est attendue avec impatience et celles-ci ont bien l’air de déjà se concrétiser.
Gates avait prédit que l’IA jouerait un rôle crucial dans les années à venir, et il avait raison. Mais son génie réside dans les détails. Il avait spécifiquement mentionné que l’intégration de l’IA dans la téléphonie mobile démocratiserait ses avantages pour le grand public. Et voilà que Samsung et Google viennent de prouver qu’il avait vu juste, en intégrant l’IA dans leurs systèmes d’exploitation.
Une prédiction réalisée ?
Mais Gates ne s’est pas arrêté là. Il avait également prédit que l’IA serait un moteur clé dans le développement de nouveaux médicaments et vaccins. Déjà, en ce début d’année 2024, nous assistons à des progrès dans la découverte de vaccins innovants pour des maladies comme l’alopécie et le mélanome, grâce à des modèles d’IA générative plus performants. Ces avancées laissent entrevoir un avenir prometteur pour le diagnostic et le traitement de maladies plus complexes.
L’IA, pilier de l’industrie technologique en 2024, selon Bill Gates. Qu’en est-il ?
Bill Gates avait également prédit l’omniprésence de l’IA dans l’industrie technologique. Cette prédiction se confirme avec l’ascension fulgurante de NVIDIA, dont le succès repose sur ses puces d’IA révolutionnaires. Ce développement a secoué l’industrie des puces, poussant des géants comme Intel et AMD à se réorienter vers le développement de puces optimisées pour l’IA.
Apparemment, les prédictions de Bill Gates pour 2024 ne sont pas de simples conjectures, mais une réalité en train de se dérouler sous nos yeux. L’intelligence artificielle n’est plus un concept lointain, mais une force motrice qui façonne activement notre présent et notre avenir. Restez à l’écoute pour plus de développements dans ce domaine fascinant, car si l’on en croit Gates, nous n’avons encore rien vu.