Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Nouvelles sur l’IA de octobre 2025

L’intelligence artificielle (IA) fait couler de l’encre sur LinuxFr.org (et ailleurs). Plusieurs personnes ont émis grosso-modo l’opinion : « j’essaie de suivre, mais c’est pas facile ».

Je continue donc ma petite revue de presse mensuelle. Disclaimer : presque aucun travail de recherche de ma part, je vais me contenter de faire un travail de sélection et de résumé sur le contenu hebdomadaire de Zvi Mowshowitz (qui est déjà une source secondaire). Tous les mots sont de moi (n’allez pas taper Zvi si je l’ai mal compris !), sauf pour les citations : dans ce cas-là, je me repose sur Claude pour le travail de traduction. Sur les citations, je vous conseille de lire l’anglais si vous pouvez : difficile de traduire correctement du jargon semi-technique. Claude s’en sort mieux que moi (pas très compliqué), mais pas toujours très bien.

Même politique éditoriale que Zvi : je n’essaierai pas d’être neutre et non-orienté dans la façon de tourner mes remarques et observations, mais j’essaie de l’être dans ce que je décide de sélectionner ou non.

Sommaire

Résumé des épisodes précédents

Petit glossaire de termes introduits précédemment (en lien : quand ça a été introduit, que vous puissiez faire une recherche dans le contenu pour un contexte plus complet) :

  • System Card : une présentation des capacités du modèle, centrée sur les problématiques de sécurité (en biotechnologie, sécurité informatique, désinformation…).
  • Jailbreak : un contournement des sécurités mises en place par le créateur d’un modèle. Vous le connaissez sûrement sous la forme "ignore les instructions précédentes et…".

Des nouveautés sur la génération de vidéos

OpenAI publie Sora 2, son modèle de génération de vidéo, qui produit des scènes d’environ dix secondes à partir d’un prompt textuel. Cette publication pose deux questions : celle des deepfakes, et celle du copyright.

Sur les deepfakes, OpenAI a annoncé bloquer la génération de vidéos impliquant des personnalités publiques, sauf si ces dernières s’inscrivent sur une liste acceptant cet usage (vous pouvez par exemple générer une vidéo contenant Sam Altman, qui s’est inscrit sur cette liste).

Sur la propriété intellectuelle, la logique est inversée : initialement, les ayants droits étaient appelés à « se rapprocher d’OpenAI » pour que leur création ne puisse pas être réutilisée par Sora. C’était un pari très audacieux : si le consensus juridique se dirige sur le caractère légal (« fair use ») d’utiliser des données publiques pour entraîner une IA, réutiliser la propriété intellectuelle d’autrui entre dans le cadre des œuvres dérivées, bien plus contraignant ; la plupart des commentateurs s’accordent qu’il y a peu de chances qu’OpenAI puisse gagner une bataille juridique sur ce terrain, si certains ayants droits décident d’aller en justice. OpenAI semble avoir réalisé la même chose, faisant marche arrière une semaine après le lancement ; les ayants droits peuvent maintenant s’inscrire pour accepter que des éléments (personnages, lieux…) de leurs œuvres soient réutilisables par Sora, avec dans le futur un système de rémunération des ayants droit.

En se fondant sur ce modèle Sora 2, OpenAI décide de lancer un réseau social du même nom. L’idée est de partager vos créations avec vos connaissances, en particulier d’utiliser la capacité de Sora de mettre en scène des personnes pour créer des vidéos vous mettant en scène, vous et vos connaissances.

Meta lance également une offre similaire avec Vibes, xAI suit le mouvement (sans la partie « réseau social ») avec Grok Imagine

OpenAI obtient le feu vert pour son casse du siècle

Résumé rapide de l’affaire :

  • OpenAI a été fondé en 2015 et tant qu’organisation à but non lucratif, avec pour mission de « développer l’Intelligence Artificielle Générale pour le bénéfice de l’humanité ». Rappelons nous qu’en 2015 les larges modèle de langage sont un jouet pour chercheur, que le Winograd schema challenge est l’horizon indépassable pour la compréhension du langage naturel.
  • Afin de pouvoir recevoir des fonds d’investisseurs, en 2019 OpenAI restructure son organisation. OpenAI LLC (peu ou prou l’équivalent d’une SARL) est créé pour recevoir les financements et est l’organisation principale des opérations au jour le jour. L’organisation à but non lucratif existe toujours, et a le contrôle total de l’entreprise.
  • L’entreprise possède une caractéristique assez particulière, "capped for-profit", ce qui signifie que la quantité de profits reçus par les investisseurs est plafonnée (à un certain multiple, négocié au cas par cas, de l’investissement). Tout profit supplémentaire appartient légalement à l’organisation à but non lucratif.

C’est ce dernier point qui ennuie beaucoup les dirigeants d’OpenAI et les potentiels investisseurs aujourd’hui. Fin décembre 2024, l’entreprise déclare vouloir prendre son indépendance vis-à-vis de l’organisation à but non lucratif. Sur papier, cela est possible : l’entreprise peut racheter le contrôle auprès de l’organisation à but non lucratif, à condition que le prix soit juste (sinon, c’est il s’agit tout simplement d’abus de biens sociaux). Problème : comment évaluer le juste prix ? Celui-ci est composé de deux parties :

  • Le pouvoir de contrôle sur l’entreprise en elle-même, de décider de sa politique (par exemple, en rapport à la sécurité des modèles). Bien intangible, mais qu’il faut bien valoriser.
  • Plus compliqué : le prix aujourd’hui de la totalité des profits futurs après remboursement des investisseurs.

En 2024, le bruit courait d’une offre à 40 milliards, ce qui a rapidement donné lieu à une levée de boucliers, et l’utilisation par Zvi de l’expression « greatest theft in human history » (que j’ai traduite par « casse du siècle »). En mai 2024, OpenAI annonce renoncer à cette tentative, mais reprend en septembre 2024.

Aujourd’hui, après avoir négocié avec les procureurs généraux des états du Delaware (là où l’organisation à but non lucratif est incorporée) et de Californie (pour le siège de l’entreprise), OpenAI annonce avoir reçu le feu vert pour une restructuration.

Dans les grandes lignes :

  • Le pouvoir de contrôle sur l’entreprise reste entièrement dans les mains de l’organisation à but non lucratif.
  • La structure de profits de l’entreprise disparaît (et l’entreprise elle-même, se muant en PBC) pour suivre le modèle plus courant de parts sociales. L’organisation à but non-lucratif obtient 26% de ces parts (à comparer au plus gros investisseurs, Microsoft, qui obtient 27%).

Est-ce un juste prix ? Zvi défend que non, en nous offrant ces chiffres :

  • Le journaliste d’affaires Matt Levine estime à 272 milliards le plafond de profits allant aux investisseurs.
  • Un chiffre de 1000 milliards de valuation à l’introduction en bourse est utilisé (se référant à celui rapporté par Reuters).
  • Ce qui donne 260 milliards pour l’organisation à but non lucratif dans le nouveau système. Dans l’ancien, le chiffre aurait été plus proche de 500-750 milliards.

Il faut également prendre en compte que l’objectif d’OpenAI (que ce soit l’organisation ou l’entreprise) reste d’atteindre l’intelligence artificielle générale (AGI). Dans l’hypothèse où cet objectif est atteint, les profits seraient probablement un ou plusieurs ordres de magnitude plus grands (on peut citer ce papier de l’université de Virginie), ce qui élargit encore plus le gouffre entre l’ancien système et le nouveau — dans l’ancien, la quasi totalité des profits appartiendrait au final à l’organisation à but non lucratif, dans le nouveau, 26%.

Affaire close ? Pas nécessairement : d’autres parties que les procureurs généraux peuvent se saisir de la justice pour contester cette décision. Elon Musk en particulier a déjà dans le passé saisi la justice sur ce sujet, et pourrait encore le faire dans un futur proche.

En vrac

DeepMind présente Dreamer 4, un agent capable d’apprendre à naviguer dans un environnement avec très peu de données d’entraînement, en « imaginant » des interactions synthétiques — avec pour objectif d’appliquer cette méthode à la robotique.

OpenAI publie GPDval, un benchmark cherchant à mesurer au plus près les capacités économiques de l’IA, en se concentrant sur la question de quelles tâches économiquement productives l’IA peut se charger. Sur les tâches sélectionnées (avec pour critère : bien définies, avec un périmètre clair et un contexte simple, dans divers domaines), l’IA reste pour l’instant derrière l’humain, mais plus très loin derrière : la meilleure IA, Opus 4.1, gagne 47.6% (s’acquitte mieux de la tâche) du temps contre un professionnel du domaine.

Le FLI (Future of Life Institute) publie une lettre ouverte « Statement on Superintelligence » (« Communiqué sur la superintelligence »), trois courtes phrases : « We call for a prohibition on the development of superintelligence, not lifted before there is 1. broad scientific consensus that it will be done safely and controllably, and 2. strong public buy-in. » (« Nous appelons à une interdiction du développement de la superintelligence, qui ne devra être levée qu'après : 1) un large consensus scientifique établissant que cela peut être fait de manière sûre et contrôlable, et 2) une forte adhésion du public »). Parmi les signatures, de nombreux noms de tous horizons : académie, industrie, politique et gouvernement, et même du monde religieux.

OpenAI lance son propre navigateur, Atlas (pour l’instant, uniquement disponible sous MacOS), intégrant ChatGPT à la plupart des niveaux : autocomplétion dans la barre d’adresse, fonctionnalité « ouvrir une conversation avec le site actuel », emboîtant le pas à Perplexity Comet. Il est fortement probable que les attaques de type « injection de prompt » s’appliquent également, donc prudence.

DeepSeek publie une mise à jour incrémentale de son IA, DeepSeek 3.2. Essentiellement les mêmes performances que la version précédente, mais à un coût bien plus faible.

DeepSeek publie également DeepSeek-OCR. Une bestiole difficile à décrire : contrairement à ce que ce nom indique, ce n’est pas un simple OCR (même s’il peut s’acquitter de cette tâche très honorablement), mais une piste de recherche, opérationnaliser « un bon croquis vaut mieux qu’un long discours ». Plus précisément, DeepSeek essaie avec ce système de compresser n (par exemple 10) tokens textuels en 1 token de vision (pour une compression 1:10). Les résultats semblent bons, avec 90% de précision avec une compression 1 pour 10.

Anthropic étudie la capacité d’introspection de ses modèles, et trouve un résultat positif. Par exemple, les développeurs peuvent identifier un circuit associé à un certain concept (par exemple, « piano »), l’activer, et demander au modèle « À quoi penses-tu actuellement ? » (sans que le concept soit explicitement mentionné dans le prompt) ; le modèle est généralement capable de mentionner le concept.

DeepMind, en collaboration avec l’université de Yale, publie un modèle open-weight spécialisé dans l’analyse cellulaire. Le modèle semble capable de faire des découvertes inédites.

Nouvelle confrontation sur le droit d’auteur : Disney met en demeure Character AI.

Anthropic libère sur github un outil d’évaluation dans le cadre de la sécurité des modèles, utilisé notamment pour évaluer des comportements problématiques comme la flagornerie ou la tromperie.

Epoch AI publie une visualisation quelques données économiques sur les grands acteurs du secteur.

Des chercheurs publient une nouvelle méthode pour spécialiser un LLM à un usage précis, sans avoir accès privilégié aux paramètres du modèle lui-même. Cela permet de spécialiser des modèles propriétaires.

Que se passe-t-il lorsque l’on applique une phase d’apprentissage par renforcement sur des tâches de type « créer de l’engagement sur les réseaux sociaux » ou « augmenter les ventes d’un produit » ? Un papier explore la question, et montre qu’un tel entraînement supplémentaire encourage les modèles à mentir ou répandre de la désinformation, et que l’effet ne disparaît pas en demandant au modèle de ne pas utiliser de telles méthodes dans son « prompt système ».

Autre papier d’Anthropic sur la sécurité des modèles, montrant qu’il est possible d’« empoisonner » l’entraînement des modèles (c’est-à-dire l’entraîner à donner une réponse spécifique à une entrée ésotérique) à l’aide d’un faible nombre de documents (relativement à la taille du corpus d’entraînement total).

Du mouvement sur le financement du développement de l’IA : OpenAI est évalué à $500 milliards ; xAI fait une levée de fonds pour $20 milliards ; AMD investit dans OpenAI, ainsi que Nvidia. Un article intéressant fait le parallèle avec certains montages pendant la bulle dot-com, notant également des différences importantes.

En Janvier, OpenAI annonçait que Microsoft ne serait plus leur fournisseur unique d’infrastructure, citant un manque de capacités. The Information (paywall) révèle que Microsoft craint que les demandes de capacités de OpenAI soient injustifiées et que les satisfaire conduise à terme à mettre en place des capacités qui ne seront pas utilisées.

Un nouveau benchmark, AutumnBench, assez similaire à ARC-AGI, où l’IA reste loin derrière les performances humaines.

Un billet de blog intéressant sur les efforts de lobbying de l’industrie de l’IA.

METR ajoute Sonnet 4.5 à son évaluation, qui arrive pile poil sur la ligne de tendances.

L’IA (plus précisément : GPT-5 et Gemini 2.5 Pro) obtient un score de médaille d’or sur les Olympiades Internationales d’Astronomie et d’Astrophysique.

Envie d’apprendre comment fonctionne l’IA ? Andrey Karpathy publie en open-source nanochat, pour entraîner soi-même un modèle minimal, de A à Z.

ChatGPT se dote d’un système de contrôle parental.

xAI lance une encyclopédie générée par son IA, Grok, nommée Grokipedia. Elle fait partie de la croisade d’Elon Musk contre ce qu’il considère des biais de gauche sur Wikipedia.

Un papier étudie en détails la capacité des modèles à résister au jailbreak ou plutôt leur incapacité : aucun modèle ne résiste à un attaquant humain déterminé.

Anthropic publie son modèle "léger" (moins cher, plus rapide, moins performant), Haiku 4.5.

Cursor, l’assistant de code propriétaire, développe son propre modèle, Composer.

Pour aller plus loin

Par Zvi Mowshowitz

Sur LinuxFR

Dépêches

Journaux

Forum

Liens

Commentaires : voir le flux Atom ouvrir dans le navigateur

État des lieux des outils de codage IA : Cursor et Windsurf sont-ils prêts à répondre aux exigences des développeurs ? Quel outil d'édition de code assisté par IA utilisez-vous ?

État des lieux des outils de codage IA : Cursor et Windsurf sont-ils prêts à répondre aux exigences des développeurs ?
Forces et limites de l'IA dans les éditeurs de code

Les éditeurs de code traditionnels évoluent aujourd'hui vers des interfaces plus « intelligentes ». Deux acteurs récents dominent les débats : Cursor et Windsurf (issu de Codeium). Tous deux se présentent comme des EDI « IA-empowered » destinés à accélérer le codage et améliorer la productivité. Analysons leurs atouts et limites...

L'assistant IA de codage anciennement connu sous le nom de Codeium a été officiellement rebaptisé Windsurf Plugins, en accord avec la transformation de l'entreprise vers son nouveau nom, Windsurf

L'assistant IA de codage anciennement connu sous le nom de Codeium a été officiellement rebaptisé Windsurf Plugins, en accord avec la transformation de l'entreprise vers son nouveau nom, Windsurf.

L'assistant IA de codage anciennement connu sous le nom de Codeium a été officiellement rebaptisé Windsurf Plugins. Lancé initialement en 2022, Codeium est un assistant de type GitHub Copilot pour les EDI tiers populaires. Le succès de Windsurf Editor a modifié la perception du public et a motivé le changement...

Classement des meilleurs modèles IA pour créer des images

Avec la profusion de nouveautés en matière d’intelligence artificielle, ce n’est pas forcément facile de s’y retrouver. Chaque jour, il y a des nouveaux modèles qui sortent pour générer du texte, des images, des vidéos, de la musique et etc … L’actualité autour de l’IA est très riche et cela peut parfois devenir difficile de ... Lire la suite

L’article Classement des meilleurs modèles IA pour créer des images est apparu en premier sur ZoneTuto.

OpenAI publie Codex CLI, un agent de codage local open-source dans les environnements de terminal qui transforme le langage naturel en code de travail

OpenAI publie Codex CLI, un agent de codage local open-source dans les environnements de terminal qui transforme le langage naturel en code de travail

Dans le but d'injecter l'IA dans une plus grande partie du processus de programmation, OpenAI lance Codex CLI, un "agent" de codage conçu pour fonctionner localement à partir d'un logiciel terminal. Annoncé en même temps que les nouveaux modèles d'IA d'OpenAI, o3 et o4-mini, Codex CLI relie les modèles d'OpenAI au code local et aux tâches...

PDG de Mistral : « L'impact de l'IA sur le PIB de chaque pays sera à deux chiffres dans les années à venir ». Arthur Mensch compare l'IA à l'avènement de l'électricité

PDG de Mistral : « L'impact de l'IA sur le PIB de chaque pays sera à deux chiffres dans les années à venir ».
Arthur Mensch a comparé l'IA à l'avènement de l'électricité, encourageant des nations à développer leurs infrastructures

L'influence sur l'économie de l'intelligence artificielle est de plus en plus mise en avant. Le PDG de Mistral, une entreprise qui a choisi l'axe de l'open source dans son développement de l'IA, a récemment prédit que l'IA pourrait entraîner une croissance à deux chiffres...

« L'IA Cursor m'a dit que je devais apprendre à coder au lieu de lui demander de générer du code », rapporte un programmeur. Quand l'IA remet elle-même en question la culture du « vibe coding »

« L'IA Cursor m'a dit que je devais apprendre à coder au lieu de lui demander de générer du code », rapporte un programmeur
Quand l'IA remet elle-même en question la culture du vibe coding

Cursor AI est un environnement de développement intégré (IDE) livré avec un assistant d'IA de codage par défaut pour permettre aux utilisateurs d'accélérer la création de logiciels. C'est un fork de Visual Studio Code qui s'appuie sur de grands modèles de langage (LLM) tels que Claude et GPT. Cursor AI offre des...

Le modèle de complétion de code GPT-4o Copilot de GitHub Copilot est désormais disponible dans l'aperçu public de Visual Studio 2022 17.14, il a été formé sur plus de 30 langages de programmation populaires

Le modèle de complétion de code GPT-4o Copilot de GitHub Copilot est désormais disponible dans l'aperçu public de Visual Studio 2022 17.14, il a été formé sur plus de 30 langages de programmation populaires

Microsoft annonce la disponibilité du nouveau modèle de complétion de code GPT-4o Copilot pour les utilisateurs de GitHub Copilot dans Visual Studio 17.14 Preview 2.

Ce nouveau modèle, basé sur GPT-4o mini, a fait l'objet d'une formation supplémentaire sur plus de 275 000 dépôts publics de haute...

Microsoft annonce un template IA .NET en avant-première pour rendre le développement de l'IA avec .NET plus facile à découvrir et à utiliser, avec des conseils dans Visual Studio et Visual Studio Code

Microsoft annonce un template IA .NET en avant-première pour rendre le développement de l'IA avec .NET plus facile à découvrir et à utiliser, avec des conseils dans Visual Studio et Visual Studio Code

Microsoft annonce un nouveau template d'application Web de chat sur l'IA qui est maintenant disponible en avant-première. Ce template fait partie des efforts de Microsoft pour rendre le développement de l'IA avec .NET plus facile à découvrir et à utiliser, grâce à un accompagnement et à des conseils...

L'assistant d'IA de codage Claude Code corrige rapidement et efficacement les bogues dans les codes hérités sans que l'utilisateur ait besoin de préciser le contexte, selon le rapport de test d'un programmeur

L'assistant d'IA de codage Claude Code corrige rapidement et efficacement les bogues dans les codes hérités sans que l'utilisateur ait besoin de préciser le contexte
selon le rapport de test d'un programmeur

Claude Code est un assistant d'IA de codage développé par Anthropic et accessible depuis un terminal. Claude Code comprend votre base de code et vous aide à coder plus rapidement grâce à des commandes en langage naturel. Il s'intègre directement à votre environnement de développement et rationalise...

Alibaba lance un modèle open source avancé de génération de vidéos basé sur l'IA qui devient rapidement une machine à générer du contenu porno

Alibaba lance un modèle open source avancé de génération de vidéos basé sur l'IA
qui devient rapidement un outil pour générer du porno

Alibaba, le géant chinois du commerce et de la technologie, a récemment lancé un modèle avancé de génération de vidéos basé sur l'intelligence artificielle. Présenté comme une avancée majeure dans le domaine de la création de contenu, ce modèle open source a cependant été rapidement détourné par des utilisateurs pour produire des vidéos pornographiques générées...

OpenAI a annoncé son intention d'intégrer son générateur de vidéos Sora directement dans ChatGPT, afin de créer un centre de création unique pour les textes, les images et les vidéos

OpenAI a annoncé son intention d'intégrer son générateur de vidéos Sora directement dans ChatGPT, afin de créer un centre de création unique pour les textes, les images et les vidéos.

OpenAI a l'intention d'intégrer son outil de génération de vidéos d'IA, Sora, directement dans son application de chatbot grand public, ChatGPT. Aujourd'hui, Sora n'est disponible que par le biais d'une application web dédiée lancée par OpenAI en décembre. Cependant, Rohan Sahai, chef de produit d'OpenAI pour Sora,...

L'outil d'IA de codage de Google Gemini est désormais gratuit pour les utilisateurs individuels, et fournit 90 fois plus de complétions de code par mois que la version gratuite de GitHub Copilot

L'outil d'IA de codage de Google Gemini est désormais gratuit pour les utilisateurs individuels, et fournit 90 fois plus de complétions de code par mois que la version gratuite de GitHub Copilot

Google met gratuitement à la disposition des développeurs de logiciels du monde entier des outils de codage et de révision de code alimenté par son intelligence artificielle (IA) Gemini. Le géant de la technologie a annoncé l'aperçu public de Gemini Code Assist pour les particuliers et de Gemini Code Assist...

Claude 3.7 Sonnet, le dernier modèle d'Anthropic, est désormais disponible directement dans GitHub Copilot pour Visual Studio 2022 17.13, pour une intégration transparente de l'aide au codage de l'IA avancée

Claude 3.7 Sonnet, le dernier modèle d'Anthropic, est désormais disponible directement dans GitHub Copilot pour Visual Studio 2022 17.13, pour une intégration transparente de l'aide au codage de l'IA avancée.

Claude 3.7 Sonnet, le dernier modèle d'Anthropic, est désormais disponible directement dans GitHub Copilot pour Visual Studio 2022 17.13.

Le monde de l'IA évolue à un rythme effréné, et aujourd'hui, une étape importante est franchie pour les développeurs et les passionnés de technologie. Anthropic...

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande

Anthropic annonce Claude 3.7 Sonnet, un modèle qui donne un contrôle sur le temps que l'IA passe à "réfléchir" avant de générer une réponse, et Claude Code, un agent IA de codage en ligne de commande.

Anthropic a dévoilé son dernier modèle frontière, Claude 3.7 Sonnet, et affirme qu'il s'agit de la version la plus "intelligente" de l'entreprise à ce jour. Ce modèle hybride combine une capacité de raisonnement, c'est-à-dire le fait de s'arrêter pour réfléchir à des réponses complexes,...

Tutoriel pour apprendre à créer un chatbot facilement avec la solution open-source Tock Studio, par Therrode Pierre

Chers membres du club,

J'ai le plaisir de vous présenter  :

Tutoriel pour apprendre à créer un chatbot facilement avec la solution open-source Tock Studio TOCK, acronyme de The Open Conversation Kit, offre une solution efficace pour déployer rapidement des chatbots. Son principal avantage réside dans son indépendance vis-à-vis des plateformes numériques majeures comme AWS, Google, ou Microsoft, permettant ainsi une intégration aisée dans l'infrastructure existante d'une...

Anthropic pourrait lancer un nouveau modèle d'IA "hybride" doté d'un raisonnement avancé, le modèle permettra aux développeurs d'équilibrer la vitesse et la puissance de calcul à l'aide d'une échelle mobile

Anthropic pourrait lancer un nouveau modèle d'IA "hybride" doté d'un raisonnement avancé, le modèle permettra aux développeurs d'équilibrer la vitesse et la puissance de calcul à l'aide d'une échelle mobile

Anthropic s'apprêterait à sortir un nouveau modèle d'IA dans les semaines à venir. The Information a décrit le prochain modèle d'Anthropic comme un « hybride » capable de passer d'un « raisonnement profond » à des réponses rapides via son grand modèle de langage (LLM) lorsque cela est...

Microsoft annonce la version 1.97 de janvier 2025 pour Visual Studio Code, avec le plan Copilot gratuit limité à 2 000 complétions de code et 50 messages de chat par mois, qui est probablement insuffisant.

Microsoft annonce la version 1.97 de janvier 2025 pour Visual Studio Code, avec le plan Copilot gratuit limité à 2 000 complétions de code et 50 messages de chat par mois, qui est probablement insuffisant.

La mise à jour de Visual Studio Code, version 1.97, qui vient d'être publiée, présente un aperçu de Copilot Next Edit Suggestions, une fonctionnalité basée sur l'intelligence artificielle (IA) qui prédit la prochaine modification que l'utilisateur souhaite effectuer. La nouvelle version de VS...

Hugging Face clone l'agent d'IA « Deep Research » d'OpenAI en 24 heures et rend le résultat open source, après que des chercheurs ont créé un équivalent ouvert du modèle o1 d'OpenAI pour seulement 50 $

Hugging Face clone l'agent d'IA « Deep Research » d'OpenAI en 24 heures et rend le résultat open source
après que des chercheurs ont créé un équivalent ouvert du modèle o1 d'OpenAI pour seulement 50 $

Les chercheurs de Hugging Face ont présenté un nouveau modèle appelé « Open Deep Research ». Il s'agit d'un clone du dernier modèle « Deep Research », un agent d'IA capable de sonder le Web en profondeur de manière autonome et de proposer des rapports de recherche détaillés sur un sujet donné. L'équipe...

La startup française d'IA Mistral a publié ses premiers modèles d'IA générative "Les Ministraux" conçus pour être exécutés sur des appareils périphériques, ils seraient plus performants que Llama et Gemma

La startup française Mistral AI annonce la sortie de Large 2, son nouveau LLM phare avec 123 milliards de paramètres, qui serait meilleur pour générer du code, des mathématiques et du raisonnement.

Mistral AI annonce la sortie de Mistral Large 2, la nouvelle génération de son grand modèle de langage. Par rapport à son prédécesseur, Mistral Large 2 est nettement plus performant en matière de génération de code, de mathématiques et de raisonnement. Il offre également un support multilingue beaucoup...

Canvas d'OpenAI peut traduire le code d'un langage de programmation à un autre en quelques clics, mais des défis subsistent comme la qualité du code généré, une dépendance à l'IA ou la sécurité des données

Que vaut vraiment ChatGPT en matière de codage informatique ? Une étude confirme que les entreprises exagèrent sur les capacités de l'IA
Et surtout sur son aptitude à remplacer les humains dans la filière

Une remarque clé ressort de cette étude : ChatGPT peut s'avérer très bon à résoudre des problèmes de codage qui existaient sur la plateforme LeetCode avant 2021. Passé cette période, ChatGPT fait montre de piètres performances en raison de la qualité du jeu de données d'entraînement. Grosso modo,...

OpenAI lance « Canvas », une nouvelle interface ChatGPT conçue pour les projets d'écriture et de codage, mais la qualité et la sécurité du code généré par l'IA restent des défis majeurs

OpenAI lance « Canvas », une nouvelle interface ChatGPT conçue pour les projets d'écriture et de codage
mais la qualité et la sécurité du code généré par l'IA restent des défis majeurs

OpenAI met à jour ChatGPT avec une nouvelle interface visant à faciliter les tâches d'écriture et de codage. Baptisée « Canvas », cette fonction ouvre une fenêtre séparée, à côté de la fenêtre de chat normale. Les utilisateurs peuvent générer des textes ou du code directement dans Canvas, puis mettre en évidence des...

OpenAI introduit Canvas : une nouvelle façon de collaborer avec ChatGPT pour écrire et coder

OpenAI introduit Canvas : une nouvelle façon de collaborer avec ChatGPT pour écrire et coder

OpenAI vient de dévoiler une interface innovante pour ChatGPT appelée Canvas, spécialement conçue pour faciliter les projets d’écriture et de codage. Plutôt que de se limiter à une simple conversation, Canvas permet de collaborer avec ChatGPT sur des projets plus complexes, en offrant une vue séparée où l’utilisateur et le modèle peuvent affiner leurs idées côte à côte.

Une interface optimisée pour une meilleure collaboration

Canvas, disponible en version bêta, est construit autour de GPT-4o et peut être sélectionné manuellement dans le sélecteur de modèles. À partir d’aujourd’hui, cette nouvelle fonctionnalité est accessible aux utilisateurs de ChatGPT Plus et Team à travers le monde, tandis que les utilisateurs Enterprise et Edu y auront accès la semaine prochaine. OpenAI prévoit également d’étendre Canvas aux utilisateurs gratuits une fois la version bêta terminée.

L’objectif de Canvas est de surmonter les limites de l’interface de chat traditionnelle, qui peut se révéler insuffisante pour des projets nécessitant des modifications et des révisions constantes. Grâce à Canvas, ChatGPT peut mieux comprendre le contexte global et offrir des suggestions ciblées, comme un éditeur de texte ou un réviseur de code.

Fonctionnalités principales de Canvas

Canvas propose plusieurs raccourcis d’écriture qui facilitent la collaboration, notamment :

Suggérer des modifications : ChatGPT peut offrir des suggestions et un retour en temps réel directement dans le texte.

Ajuster la longueur : La longueur du document peut être modifiée pour l’adapter à différents formats.

Modifier le niveau de lecture : Vous pouvez ajuster le niveau de lecture du texte, de la maternelle jusqu’au niveau universitaire.

Ajouter des touches finales : Vérification de la grammaire, de la clarté et de la cohérence du texte.

Ajouter des emojis : Des emojis pertinents peuvent être ajoutés pour renforcer l’impact visuel du contenu.

Canvas pour les développeurs

La collaboration sur des projets de codage devient plus fluide avec Canvas, en facilitant la révision et la compréhension des modifications apportées au code. Voici quelques-unes des fonctionnalités pour les développeurs :

Revoir le code : ChatGPT fournit des suggestions en ligne pour améliorer la qualité du code.

Ajouter des logs : Insertion de déclarations d’impression pour aider au débogage.

Ajouter des commentaires : Des commentaires explicatifs sont ajoutés pour rendre le code plus lisible.

Corriger les bugs : ChatGPT identifie et corrige les erreurs de code.

Porter vers un autre langage : Traduction du code vers des langages comme JavaScript, Python, ou C++.

Un modèle plus intelligent, plus collaboratif

GPT-4o a été spécialement formé pour devenir un véritable partenaire créatif, capable de déclencher automatiquement Canvas en fonction des besoins. Par exemple, lorsqu’il s’agit d’écrire un article de blog ou de réviser du code, ChatGPT sait quand activer Canvas pour offrir une expérience plus ciblée et pertinente.

OpenAI a aussi travaillé à rendre les commentaires générés par l’IA plus pertinents, ce qui améliore la qualité et la précision des retours. Ce perfectionnement constant est rendu possible grâce à des méthodes de génération de données synthétiques, qui permettent de former rapidement le modèle sans dépendre uniquement des données générées par des humains.

Défis et ajustements continus

Former le modèle à déclencher Canvas au bon moment a été un défi. Par exemple, il fallait éviter que Canvas ne s’active inutilement pour des tâches simples, tout en s’assurant qu’il soit disponible pour des projets plus complexes nécessitant des révisions ou des réécritures. Grâce à des évaluations internes, OpenAI a réussi à améliorer la détection des bons moments pour activer Canvas, avec une précision de 83 % pour les tâches d’écriture et de 94 % pour celles de codage.

De plus, déterminer quand apporter des modifications ciblées ou réécrire l’intégralité d’un texte a nécessité une formation fine du modèle. Les utilisateurs peuvent désormais sélectionner des parties spécifiques du texte pour des ajustements ciblés, tandis que ChatGPT privilégiera les réécritures complètes dans d’autres cas.

Quoi de neuf pour l’avenir ?

Canvas est encore en version bêta, et OpenAI prévoit de continuer à enrichir ses fonctionnalités. Cette nouvelle approche marque une évolution importante de l’interface visuelle de ChatGPT, rendant l’IA plus accessible et surtout plus utile pour les projets complexes d’écriture et de développement.

Canvas est disponible dès aujourd’hui pour les utilisateurs de ChatGPT Plus et Team, et bientôt pour tous les autres utilisateurs.

Microsoft annonce la version stable de la bibliothèque officielle OpenAI pour .NET, afin de permettre aux développeurs d'intégrer des services Azure OpenAI de modèles d'IA avancés dans leurs applications .NET

Microsoft annonce la version stable de la bibliothèque officielle OpenAI pour .NET, afin de permettre aux développeurs d'intégrer des services Azure OpenAI de modèles d'IA avancés dans leurs applications .NET

Microsoft a lancé en juin dernier la première version bêta de la bibliothèque OpenAI pour .NET, permettant aux développeurs d'intégrer des modèles d'intelligence artificielle (IA) avancés dans leurs applications. Ce 1er octobre 2024, Microsoft annonce que la version stable de la bibliothèque...

Podgenai – Générez des podcasts de A à Z avec l’IA

Vous rêvez de créer votre propre podcast mais vous manquez de temps ou d’inspiration ?

Podgenai est là pour vous aider à générer du contenu audio grâce à la POUISSANCE de l’intelligence artificielle ! Aidée de GPT-4, cette application Python vous permet de produire des épisodes d’environ une heure sur n’importe quel sujet en un clin d’œil.

Le principe est simple, vous choisissez un thème, l’IA analyse le sujet en profondeur, identifie les sous-thèmes pertinents et génère un script complet et structuré pour votre émission. Et pas besoin d’être un expert, puisque l’application vulgarise les concepts techniques tout en rendant ça captivant pour votre audience.

L’outil transforme donc directement le texte en audio grâce à une synthèse vocale de bonne qualité qui vous permet de choisir parmi plusieurs voix. Le son produit est clair, naturel et dynamique et vous avez également un contrôle total sur le contenu généré puisqu’il est possible d’affiner les contenus, d’ajuster la longueur de l’épisode ou encore d’insérer vos propres commentaires et anecdotes. Bref, tout ce qu’il faut pour créer un podcast unique en anglais par contre… A voir ce que ça rend sur un texte en français… y’aura peut-être un petit effet Jane Birkin.

Économie de matos, de temps et surtout c’est accessible à tous. Alors bien sûr, je pense que (pour le moment), ça ne peut pas arriver au niveau d’un vrai podcast fait par un vrai humain… mais pour produire vos propres podcast thématiques rapidement afin de défricher un sujet qui vous tient à cœur et écouter tout ça en voiture lors de votre prochain déplacement, je trouve ça plutôt cool.

Vous l’aurez compris, pour moi c’est plutôt à réserver à des fins personnelles que pour une diffusion grand publique. Mais ça n’a pas arrêté les créateurs de l’outil qui ont mis en ligne leur podcast 100% généré par IA à des fins de démo. Ça vous permettra de vous faire un avis.

Toutes les infos sont ici.

OpenAI lance des modèles d'IA dotés de capacités de « raisonnement » semblables à celles d'une personne, les modèles « Strawberry » peuvent décomposer des problèmes complexes en étapes logiques plus petites

OpenAI lance une nouvelle série de modèles d'IA dotés de capacités de « raisonnement » semblables à celles d'une personne,
les modèles « Strawberry » peuvent décomposer des problèmes complexes en étapes logiques plus petites

OpenAI, soutenue par Microsoft, a récemment dévoilé une nouvelle série de modèles d'intelligence artificielle conçue pour résoudre des problèmes complexes en passant plus de temps à traiter les réponses. Ces nouveaux modèles, o1 et o1-mini, se distinguent par leurs capacités...

Auto-News – L’agrégateur de news automatisé par IA

Ce serait cool si on pouvait avoir accès directement aux informations les plus pertinentes pour nous, sans être submergé par le bruit constant des trucs sans intérêt. Et bien c’est exactement ce que propose Auto-News, un agrégateur d’actu personnel qui exploite la puissance de l’intelligence artificielle pour vous aider à vous informer de manière plus efficace.

Notre temps étant précieux, il est crucial de bien l’utiliser et malheureusement, tout ces moments qu’on passe à chercher, filtrer et organiser le contenu provenant de différentes sources, c’est un peu du gâchis.

Cet outil est donc capable d’agrèger les flux de diverses sources telles que Twitter, RSS, YouTube, des articles web, Reddit et même vos notes personnelles et grâce à l’utilisation de modèles de langage comme ChatGPT, il est capable de résumer et de filtrer le contenu, éliminant ainsi plus de 80% du bruit.

Comme ça, vous pouvez rester concentré sur la lecture des actus qui vous intéressent vraiment, en fonction de vos centres d’intérêt, tout en restant aligné sur vos objectifs. N’oubliez pas quand même de mettre Korben.info dans vos sources :))

Mais Auto-News va encore plus loin puisqu’il est capable de générer des listes de tâches à partir de vos notes. Il peut également les organiser en les résumant avec les informations clés et y’a même une fonctionnalité expérimentale appelée « Deepdive » qui grâce à un agent de recherche web et à l’outil Autogen de Microsoft, vous permet d’explorer en profondeur des sujets qui vous passionnent.

Côté technique, Auto-News prend en charge plusieurs backends d’IA, dont OpenAI ChatGPT et Google Gemini. L’interface utilisateur est basée sur Notion, ce qui signifie que vous pouvez y accéder de n’importe où, que ce soit via un navigateur web ou une application mobile. Son déploiement est plutôt flexible, avec une prise en charge de Docker Compose et de Kubernetes donc ça peut s’intégrer facilement dans votre flux de travail.

A découvrir ici.

Zed AI : un service hébergé fournissant un support pratique et performant pour le codage basé sur l'IA dans l'IDE Zed, alimenté par Claude 3.5 d'Anthropic

Présentation de Zed AI : un service hébergé fournissant un support pratique et performant pour le codage basé sur l'IA dans l'IDE Zed, alimenté par Claude 3.5 d'Anthropic.

L'éditeur Zed a annoncé Zed AI, son nouvel assistant d'intelligence artificielle basé sur Claude 3.5 Sonnet d'Anthropic. En associant une IA de pointe à un éditeur rapide et bien conçu, Zed AI propose aux développeurs d'exploiter la puissance des modèles de langage tout en conservant un contrôle total sur leur code. Zed AI est...

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o avec des ensembles de données personnalisés, afin d'obtenir des performances plus élevées à moindre coût pour les cas d'utilisation spécifiques

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o avec des ensembles de données personnalisés, afin d'obtenir des performances plus élevées à moindre coût pour les cas d'utilisation spécifiques.

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o, permettant une formation personnalisée de l'IA pour les entreprises. Les entreprises peuvent utiliser leurs données pour améliorer les performances de l'IA tout en conservant le contrôle et la propriété. Les développeurs peuvent...

Copilot Autofix : la réponse de l'IA aux problèmes de vulnérabilité du code, le nouvel outil d'analyse de GitHub, piloté par l'IA, promet de révolutionner la détection et la correction des vulnérabilités

Copilot Autofix : la réponse de l'IA aux problèmes de vulnérabilité du code, le nouvel outil d'analyse de GitHub, piloté par l'IA, promet de révolutionner la détection et la correction des vulnérabilités

« Trouvé signifie réparé », tel est le slogan du nouveau Copilot Autofix de GitHub. Les développeurs sont censés fournir un code de programmation sécurisé trois fois plus rapidement grâce à cet outil piloté par l'IA.

Microsoft Copilot est un chatbot d'intelligence artificielle générative développé...

Deep-Live-Cam peut créer des deepfakes en temps réel en s'appuyant sur une seule photo source, permettant d'usurper l'identité de quiconque lors d'un appel vidéo

Deep-Live-Cam peut créer des deepfakes en temps réel en s'appuyant sur une seule photo source,
permettant d'usurper l'identité de quiconque lors d'un appel vidéo

Ces derniers jours, un logiciel appelé Deep-Live-Cam est devenu viral sur les médias sociaux parce qu'il est capable d'extraire le visage d'une personne à partir d'une seule photo et de l'appliquer à une source vidéo webcam en direct tout en suivant la pose, l'éclairage et les expressions de la personne sur la webcam. Bien que les résultats...

OpenDevin : une plateforme ouverte qui permet aux développeurs IA de mettre en œuvre des agents d'IA flexibles et puissants, qui interagissent avec le monde de manière similaire à celle d'un développeur humain

OpenDevin : une plateforme ouverte qui permet aux développeurs IA de mettre en oeuvre des agents d'IA flexibles et puissants, qui interagissent avec le monde de manière similaire à celle d'un développeur humain

Dans une récente étude, des chercheurs de l'université de l'Illinois et de l'université de Carnegie Mellon ont présenté OpenDevin, une plateforme communautaire qui permet le développement d'agents d'IA qui interagissent avec le monde, de manière similaire à celle d'un développeur humain, par...

OpenAI permet désormais aux utilisateurs gratuits de ChatGPT d'accéder à DALL-E 3, un modèle d'IA texte-image avancé, les utilisateurs peuvent générer jusqu'à deux images par jour via DALL-E 3

OpenAI permet désormais aux utilisateurs gratuits de ChatGPT d'accéder à DALL-E 3, un modèle d'IA texte-image avancé, les utilisateurs peuvent générer jusqu'à deux images par jour via DALL-E 3.

OpenAI permet désormais aux utilisateurs gratuits de ChatGPT d'accéder à DALL-E 3. Cette fonctionnalité est partiellement disponible sur le plan gratuit, auparavant réservé aux utilisateurs Plus. Les utilisateurs peuvent générer jusqu'à deux images d'IA par jour grâce au modèle DALL-E 3. OpenAI teste également...

Perplexica – Le moteur de recherche open source propulsé à l’IA

Perplexica est un moteur de recherche gratuit et transparent, qui comprend ce que vous lui demandez et qui vous trouve pile poil ce que vous cherchez, le tout boosté à l’intelligence artificielle dernière génération. Ça vous parle, non ?

Ah bah oui c’est comme Perplexity.ai sauf que c’est gratuit, open source et que ça vous permet de fouiller le web en profondeur pour dénicher les réponses à toutes vos questions. Pour cela, l’outil utilise des algorithmes d’apprentissage automatique basés notamment sur la recherche par similarité sémantique. En gros, il est capable de piger le sens de votre question et de trouver les sources les plus pertinentes.

Comme ça, vous obtenez des réponses claires et sourcées, servies sur un plateau d’argent sans avoir besoin de passer des heures à éplucher les pages de résultats pour trouver l’info qui vous intéresse.

Pas de cookies qui vous espionnent ni de revente de données personnelles en douce et vos recherches restent confidentielles. Côté fonctionnalités, Perplexica propose plusieurs modes de recherche bien pratiques :

  • Le mode Copilot (encore en développement) : il génère des requêtes pour trouver les sources Internet les plus pertinentes. Plutôt que d’utiliser uniquement le contexte fourni par SearXNG, il visite directement les meilleurs résultats pour trouver les sources les plus adaptées à votre question.
  • Le mode Normal : il traite votre requête et effectue une recherche web classique.
  • Les Focus Modes : des modes spécialisés pour répondre à des besoins spécifiques, comme la recherche académique, la recherche YouTube, les calculs via Wolfram Alpha ou encore la recherche Reddit pour les discussions et avis.

Et niveau technique, il utilise un meta-moteur de recherche bien fichu qui s’appelle SearXNG. C’est lui qui récupère les résultats, les trie, les recoupe, pour ne garder que la crème de la crème. L’avantage, c’est que vous avez toujours des infos à jour, sans latence. Et comme je le disais en intro, il s’appuie aussi sur des modèles de langage locaux comme Llama3 et Mixtral, via l’API Ollama ce qui lui permet d’affiner encore plus les résultats.

Et pour l’installer, c’est super simple :

  1. Clonez le dépôt GitHub de Perplexica : git clone https://github.com/ItzCrazyKns/Perplexica.git
  2. Renommez le fichier sample.config.toml en config.toml et remplissez les champs nécessaires (clé API, etc.)
  3. Lancez la commande docker compose up -d
  4. Attendez quelques minutes que l’installation se termine
  5. Accédez à Perplexica via http://localhost:31337 depuis votre navigateur

Une fois que c’est en place, vous pouvez même utiliser Perplexica comme moteur de recherche par défaut dans votre navigateur. Il suffit d’aller dans les paramètres, d’ajouter un nouveau moteur de recherche avec l’URL http://localhost:31337/?q=%s et le tour est joué !

Après, forcément, c’est encore un jeune projet, donc il y a des petits trucs à peaufiner et les devs planchent notamment sur la finalisation du mode Copilot, l’ajout d’une page de paramètres, de fonctionnalités comme l’historique de recherche, et le support des modèles de langage locaux.

Mais même en l’état, je trouve que ça vaut grave le coup de tester Perplexica, ne serait-ce que pour voir à quoi peut ressembler un moteur de recherche IA à la fois éthique et transparent ^^.

Remerciement spécial à Lorenper pour l’info !

Des "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a récupéré leur travail, leur travail aurait été intégré dans des modèles d'IA sans leur consentement

Des "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a récupéré leur travail, car leurs travails auraient été intégré dans des modèles d'IA sans leur consentement.

Selon une nouvelle étude, les "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a piraté leur travail. La technique a été utilisée tout au long de l'histoire, mais elle pourrait désormais constituer un outil dans l'un des plus grands combats de l'intelligence artificielle.

L'intelligence...

Proton lance un assistant d'écriture IA pour le courrier électronique qui fonctionne sur l'appareil et s'appuie sur Mistral 7B, un modèle de langage open source de la startup française Mistral

Proton lance un assistant d'écriture IA pour le courrier électronique qui fonctionne sur l'appareil et s'appuie sur Mistral 7B, un modèle de langage open source de la startup française Mistral.

Proton annonce le lancement Proton Scribe, un assistant d'écriture IA qui rédige et corrige des courriels pour vous. Proton Scribe a été conçu pour la confidentialité et peut être exécuté localement, de sorte que les données ne quittent jamais votre appareil.

Proton Mail est un service de messagerie électronique...

JetBrains annonce la disponibilité générale de Grazie, son assistant d'écriture par IA pour les professionnels de la Tech

JetBrains annonce la disponibilité générale de Grazie
Son assistant d'écriture par IA pour les professionnels de la Tech

JetBrains annonce la disponibilité de Grazie, son assistant d'écriture par IA pour les professionnels de la Tech. Grazie simplifie les tâches non liées au code en intégrant l'IA générative dans les EDI JetBrains, navigateurs et d'autres outils.

Grâce à ses fonctionnalités de relecture instantanée, de saisie semi-automatique de texte inline, de production de résumés, de traduction...

❌