EuroLLM - Le LLM européen qui tourne sur votre laptop

Korben

Par : Korben

6 novembre 2025 à 10:00

Faire tourner un modèle de langage européen sur votre machine sans avoir besoin d’un serveur surpuissant branché sur une centrale nucléaire, c’est maintenant possible, les amis ! Hé oui, EuroLLM vient de prouver qu’on pouvait faire tourner un modèle à 9 milliards de paramètres dans un peu moins de 6 GB de RAM sur un simple laptop.

Une seule commande Ollama , et c’est parti mon kiki !!!

Bien sûr, il est encore loin des gros modèles proprio comme GPT-5 mais c’est le enfin le premier LLM européen que VOUS pouvez faire tourner en local. C’est respectueux de votre vie privée, des droits d’auteurs et c’est gratuit !

Un projet 100% européen

EuroLLM, c’est en réalité une coalition de labos européens : Instituto Superior Técnico (Lisbonne), University of Edinburgh , Université Paris-Saclay , Unbabel , et d’autres et c’est financé par Horizon Europe et l’ EuroHPC , et ce modèle supporte les 24 langues officielles de l’UE, plus 11 langues supplémentaires (arabe, chinois, hindi, japonais, coréen, russe, turc…).

EuroLLM-9B , le modèle de base, a été entraîné sur 4 trillions de tokens avec le supercalculateur MareNostrum 5 à Barcelone (400 GPUs Nvidia H100) et l’architecture utilise du Grouped Query Attention, RoPE, SwiGLU et RMSNorm, comme tout LLM moderne qui se respecte.

Mais il existe d’autres versions comme EuroLLM-1.7B pour smartphones et bientôt EuroLLM-22B pour plus de puissance, ainsi qu’une version vision-language (EuroVLM-9B) et un modèle Mixture-of-Experts (EuroMoE-2.6B).

Et surtout c’est sous licence Apache 2.0. Donc l’usage commercial est autorisé, vous pouvez le fine-tuner sur vos données, et les modifications sont libres, sans redevance à payer. Ce n’est pas la première fois qu’il y a des LLM européens mais ils étaient soit sous licence trop restrictives ou un peu trop lourd pour être utilisé localement par les gens normaux comme vous et moi.

Maintenant comment l’installer ?

La méthode la plus simple, c’est via Ollama :

ollama run hf.co/bartowski/EuroLLM-9B-Instruct-GGUF

Ollama télécharge le modèle en version GGUF (format optimisé CPU/GPU), et vous pouvez commencer à discuter. Il existe aussi une version pré-packagée alibayram/erurollm-9b-instruct (attention, erurollm avec un “u”), quantized en Q4_K_M pour réduire la taille à 5,6 GB.

Si vous préférez Python et Hugging Face Transformers :

from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "utter-project/EuroLLM-9B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

inputs = tokenizer("Explique-moi ce qu'est un LLM en français simple", return_tensors="pt")
outputs = model.generate(**inputs, max_length=200)
print(tokenizer.decode(outputs[0]))

Une fois téléchargé, le modèle reste en cache local. Vous pouvez alors l’utiliser offline, sans connexion internet. Et pour les machines avec moins de RAM, la version 1.7B tourne même sur des Raspberry Pi :

ollama run cas/eurollm-1.7b-instruct-q8

Alors pourquoi c’est important ?

EuroLLM ouvre l’IA européenne à des cas d’usage impossibles avec des API cloud. Par exemple une administration publique ne peut pas envoyer ses documents dans le cloud d’OpenAI… ce serait tout livrer aux américains. Elle peut donc fine-tuner EuroLLM localement. Un journaliste en zone sensible sans connexion fiable peut aussi embarquer le modèle sur son ordi portable. Même un chercheur qui manipule des données médicales confidentielles peut le faire en toute confiance avec EuroLLM puisque tout reste sur sa machine.

C’est cool quand même que l’Europe nous file un modèle gratuit qu’on peut installer chez soi et utiliser sans limite. Après c’est vrai que EuroLLM ne bat pas GPT-4 (pas encore) mais il est suffisamment bon pour 80% des cas d’utilisation réels tels que des résumés, de la traduction, des questions-réponses simples, de la génération de code basique.

La roadmap prévoit d’ajouter de la vision et de la voix aux modèles. D’ailleurs, comme je vous le disais, EuroVLM-9B est déjà en preview sur Hugging Face , ce qui ouvre la voie à de l’OCR multilingue, de l’analyse de documents visuels, ou encore à la création d’assistants vocaux dans n’importe quelle langue…

Voilà j’ai trouvé ça cool à tester et un grand merci à Letsar pour le partage !

OpenAI publie un guide pratique pour construire des Agents

Journal du hacker: intelligence artificielle

Par : dsampaolo

22 avril 2025 à 09:07

Comments

OpenAI publie Codex CLI, un agent de codage local open-source dans les environnements de terminal qui transforme le langage naturel en code de travail

Flux Intelligence artificielle Developpez

18 avril 2025 à 03:54

OpenAI publie Codex CLI, un agent de codage local open-source dans les environnements de terminal qui transforme le langage naturel en code de travail

Dans le but d'injecter l'IA dans une plus grande partie du processus de programmation, OpenAI lance Codex CLI, un "agent" de codage conçu pour fonctionner localement à partir d'un logiciel terminal. Annoncé en même temps que les nouveaux modèles d'IA d'OpenAI, o3 et o4-mini, Codex CLI relie les modèles d'OpenAI au code local et aux tâches...

OpenAI a lancé un nouvel ensemble d'API et d'outils conçus pour aider les développeurs et les entreprises à construire, déployer et mettre à l'échelle des agents d'intelligence artificielle (IA)

Flux Intelligence artificielle Developpez

12 mars 2025 à 17:58

OpenAI a lancé un nouvel ensemble d'API et d'outils conçus pour aider les développeurs et les entreprises à construire, déployer et mettre à l'échelle des agents d'intelligence artificielle (IA).

L'OpenAI a lancé de nouveaux outils pour les développeurs qui les aideront à créer des agents d'IA avancés, en utilisant quelques interfaces de programmation d'applications (API). Les agents d'IA sont conçus pour exécuter de manière autonome des tâches complexes dans le monde réel sans intervention humaine...

Faire tourner DeepSeek sur le Raspberry Pi 5 avec ollama

Journal du hacker: intelligence artificielle

Par : remi

18 février 2025 à 19:55

Comments

Anthropic pourrait lancer un nouveau modèle d'IA "hybride" doté d'un raisonnement avancé, le modèle permettra aux développeurs d'équilibrer la vitesse et la puissance de calcul à l'aide d'une échelle mobile

Flux Intelligence artificielle Developpez

17 février 2025 à 13:45

Anthropic pourrait lancer un nouveau modèle d'IA "hybride" doté d'un raisonnement avancé, le modèle permettra aux développeurs d'équilibrer la vitesse et la puissance de calcul à l'aide d'une échelle mobile

Anthropic s'apprêterait à sortir un nouveau modèle d'IA dans les semaines à venir. The Information a décrit le prochain modèle d'Anthropic comme un « hybride » capable de passer d'un « raisonnement profond » à des réponses rapides via son grand modèle de langage (LLM) lorsque cela est...

La startup française d'IA Mistral lance l'application mobile Le Chat pour iPhone et Android, et introduit également les niveaux de service Pro et Team, ainsi qu'un niveau Enterprise en avant-première privée

Flux Intelligence artificielle Developpez

10 février 2025 à 02:53

La startup française d'IA Mistral lance l'application mobile Le Chat pour iPhone et Android, et introduit également les niveaux de service Pro et Team, ainsi qu'un niveau Enterprise en avant-première privée.

Mistral AI, la startup française considérée comme étant à la pointe du développement de l'IA en Europe, a lancé une application de chatbot IA appelée Le Chat pour les appareils iOS et Android. L'application Le Chat est la version mobile de l'assistant d'IA de Mistral AI qui porte le même nom....

Microsoft annonce Copilot Edits, un agent SWE, et un nouveau Mode Agent de GitHub Copilot dans VS Code, capable d'itérer sur son propre code, de reconnaître les erreurs et de les corriger automatiquement

Flux Intelligence artificielle Developpez

7 février 2025 à 18:57

Microsoft annonce Copilot Edits, un agent SWE, et un nouveau Mode Agent de GitHub Copilot dans VS Code capable d'itérer sur son propre code, de reconnaître les erreurs et de les corriger automatiquement.

GitHub a annoncé une série d'améliorations de son IA Copilot dans l'éditeur Visual Studio Code, y compris un nouveau "mode agent" en avant-première qui permet aux développeurs d'utiliser la technologie de l'IA pour écrire du code plus rapidement et avec plus de précision. Ces améliorations...

Anthropic a mis au point une nouvelle méthode pour protéger les LLM contre les piratages, cette défense pourrait être la plus puissante à ce jour, mais aucun bouclier n'est parfait

Flux Intelligence artificielle Developpez

5 février 2025 à 03:32

Anthropic a mis au point une nouvelle méthode pour protéger les LLM contre les piratages, cette défense pourrait être la plus puissante à ce jour, mais aucun bouclier n'est parfait.

Anthropic, éditeur de la famille de grands modèles de langage (LLM) Claude, a publié un nouveau système qu'il appelle "classificateurs constitutionnels". Ce nouveau système de sécurité filtre la "majorité" des tentatives de jailbreak contre son modèle principal, Claude 3.5 Sonnet. Il y parvient en...

Le Texas interdit l'IA chinoise DeepSeek : "Le Texas ne permettra pas au Parti communiste chinois d'infiltrer l'infrastructure critique de notre État par le biais de l'IA et des applications de médias sociaux"

Flux Intelligence artificielle Developpez

4 février 2025 à 11:16

Le Texas interdit l'IA chinoise DeepSeek : "Le Texas ne permettra pas au Parti communiste chinois d'infiltrer l'infrastructure critique de notre État par le biais de l'IA et des applications de médias sociaux."

Le gouverneur du Texas, Greg Abbott, a annoncé qu'il interdisait aux fonctionnaires d'utiliser DeepSeek, Xiaohongshu (RedNote) et Lemon8 sur les appareils fournis par l'État. Les préoccupations en matière de confidentialité des données et de sécurité nationale ont déjà incité plusieurs...

La marine américaine interdit l'utilisation de l'IA DeepSeek pour des raisons de sécurité "à quelque titre que ce soit"

Flux Intelligence artificielle Developpez

4 février 2025 à 11:15

La marine américaine "interdit l'utilisation de l'IA DeepSeek pour des raisons de sécurité" tout en citant des risques : "il est impératif que les membres de l'équipe évitent d'utiliser l'IA de DeepSeek"

La marine américaine a lancé un avertissement à ses membres afin qu'ils évitent d'utiliser DeepSeek "à quelque titre que ce soit", en raison de "problèmes potentiels de sécurité et d'éthique". Le courriel demandait à tous les membres de l'équipe de ne pas utiliser...

Le ministère taïwanais du Numérique a déclaré que les départements gouvernementaux ne devraient pas utiliser le service d'IA de la startup chinoise DeepSeek, car il représente un risque pour la sécurité

Flux Intelligence artificielle Developpez

4 février 2025 à 11:05

Le ministère taïwanais du Numérique a déclaré que les départements gouvernementaux ne devraient pas utiliser le service d'IA de la startup chinoise DeepSeek, car il représente un risque pour la sécurité

Le ministère taïwanais du Numérique a déclaré que les départements gouvernementaux ne devraient pas utiliser le service d'intelligence artificielle (IA) de la startup chinoise DeepSeek, estimant que le produit, provenant de Chine, représente un problème de sécurité.

Ce récent développement intervient...

Un sénateur américain propose d'infliger une peine de 20 ans de prison pour l'utilisation de DeepSeek avec une amende d'un million de dollars pour les particuliers, et 100 millions pour les entreprises

Flux Intelligence artificielle Developpez

4 février 2025 à 10:18

Un sénateur américain propose d'infliger une peine de 20 ans de prison pour l'utilisation de DeepSeek avec une amende d'un million de dollars pour les particuliers
et 100 millions pour les entreprises

Le sénateur Josh Hawley (R-MO) attire l'attention avec un projet de loi qui propose des mesures à l'encontre des Américains utilisant les technologies d'IA chinoises. Il vise à interdire aux ressortissants des États-Unis de « développer des capacités d'IA en Chine, et à d'autres fins ». Il pourrait...

Faites tourner un LLM de type ChatGPT sur le Raspberry Pi 5

Journal du hacker: intelligence artificielle

Par : Cascador

26 janvier 2025 à 05:53

Comments

DeepSeek, cette start-up chinoise qui fait mieux qu'OpenAI pour 96% moins cher

Intelligence artificielle

Par : Célia Séramour

24 janvier 2025 à 12:00

"Nous vivons dans une époque où une entreprise non américaine porte le flambeau de la mission originale d'OpenAI - une recherche véritablement...

Apple suspend ses notifications générées par IA après la diffusion de faux titres. Les hallucinations liées à l'IA sont toujours aussi répandues deux ans après le lancement de ChatGPT

Flux Intelligence artificielle Developpez

17 janvier 2025 à 15:01

Apple suspend ses notifications générées par IA après la diffusion de faux titres.
Deux ans après le lancement de ChatGPT, les hallucinations liées à l'IA sont toujours aussi répandues

Apple a temporairement interrompu une fonction de résumé d'actualités d'Apple Intelligence, son service phare d'intelligence artificielle (IA), après plusieurs cas où des résumés d'actualités erronés ont été présentés aux utilisateurs. La décision d'Apple de suspendre le service a été prise à la suite d'une plainte...

Le nouveau jailbreak des LLM exploite leurs capacités d'évaluation pour les contourner, les chercheurs de Palo Alto exploitent l'échelle de Likert pour contourner les LLM

Flux Intelligence artificielle Developpez

15 janvier 2025 à 15:15

Le nouveau jailbreak des LLM exploite leurs capacités d'évaluation pour les contourner,
les chercheurs de Palo Alto exploitent l'échelle de Likert pour contourner les LLM

Le phénomène des jailbreaks des grands modèles de langage (LLM) illustre les défis croissants liés à la gestion des systèmes d'intelligence artificielle, en particulier lorsqu'ils sont confrontés à des tentatives d'exploitation. L'une des méthodes récentes, baptisée « Bad Likert Judge », a mis en lumière une approche sophistiquée...

Les logiciels pour utiliser l’intelligence artificielle en local

Intelligence artificielle

Par : MrTuto

4 janvier 2025 à 07:18

Que le temps passe vite, cela faisait bien longtemps que je ne vous avais pas écrit un petit article sur l’intelligence artificielle. Ce n’est pas par manque d’envie, mais malheureusement encore une fois par manque de moments disponible pour vous écrire ici. Rassurez-vous je ne suis jamais très loin et j’essaie de garder le rythme ... Lire la suite

L’article Les logiciels pour utiliser l’intelligence artificielle en local est apparu en premier sur ZoneTuto.

La version 1.96 de Visual Studio Code est disponible, apportant des améliorations à l'éditeur, aux traitements des langages, aux tests, ainsi qu'à l'assistant d'IA Github Copilot

Flux Intelligence artificielle Developpez

17 décembre 2024 à 12:34

La version 1.96 de Visual Studio Code est disponible, apportant des améliorations à l'éditeur, aux traitements des langages, aux tests, ainsi qu'à l'assistant d'IA Github Copilot.

Microsoft annonce la disponibilité de la version de novembre 2024 (1.96) de Visual Studio Code. Cette version apporte de nombreuses mises à jour, notamment à l'éditeur, aux traitements de langage, aux tests, ainsi qu'au plan de travail. Cette version comporte également des améliorations à l'assistant d'IA Github Copilot.

Parmi...

La version 2024.3 de l'AI Assistant de JetBrains disponible : une meilleure expérience avec l'IA grâce à la sélection de modèles, une saisie semi-automatique de code optimisée, et bien plus

Flux Intelligence artificielle Developpez

23 novembre 2024 à 07:49

La version 2024.3 de l'AI Assistant de JetBrains disponible :
Une meilleure expérience avec l'IA grâce à la sélection de modèles, une saisie semi-automatique de code optimisée, et bien plus

L'AI Assistant pour les versions 2024.3 des EDI de JetBrains est disponible. L'un des points clés de cette nouvelle version réside dans la possibilité de choisir votre modèle de chat. Vous pouvez maintenant opter pour Google Gemini, OpenAI ou des modèles locaux, afin d'adapter les interactions et de profiter...

Guide de l’étudiant pour ne pas écrire avec ChatGPT

Journal du hacker: intelligence artificielle

Par : bbbhltz

16 novembre 2024 à 09:58

Comments

Le personnel ne sait pas coder ? Pas de problème. Le LLM d'une superapplication de Singapour crée des applications pour eux, mais les développeurs sont sceptiques quant à la qualité et la sécurité du code

Flux Intelligence artificielle Developpez

6 novembre 2024 à 15:12

Le personnel ne sait pas coder ? Pas de problème. Le LLM d'une superapplication de Singapour crée des applications pour eux
mais les développeurs sont sceptiques quant à la qualité et la sécurité du code

Les outils no-code reviennent sur le devant de la scène avec l'avènement de l'IA générative. Grab, une superapplication qui s'apparente à Uber, affirme avoir mis au point un grand modèle de langage (LLM) qui permet à ses employés de créer des applications sans avoir à coder. Le logiciel est baptisé...

JetBrains lance Mellum, son nouveau grand modèle de langage (LLM) spécialement conçu pour les développeurs

Flux Intelligence artificielle Developpez

31 octobre 2024 à 12:50

JetBrains lance Mellum, son nouveau grand modèle de langage (LLM) spécialement conçu pour les développeurs

Avec le lancement de Mellum, son grand modèle de langage (LLM) propriétaire spécialement conçu pour les développeurs de logiciels, JetBrains franchit une étape majeure dans l'évolution de son offre d'outils assistés par IA. Actuellement disponible avec l'AI Assistant de JetBrains uniquement, Mellum fournit une saisie semi-automatique du code plus rapide, plus intelligente et plus sensible au...

La startup française d'IA Mistral a publié ses premiers modèles d'IA générative "Les Ministraux" conçus pour être exécutés sur des appareils périphériques, ils seraient plus performants que Llama et Gemma

Flux Intelligence artificielle Developpez

16 octobre 2024 à 21:39

La startup française Mistral AI annonce la sortie de Large 2, son nouveau LLM phare avec 123 milliards de paramètres, qui serait meilleur pour générer du code, des mathématiques et du raisonnement.

Mistral AI annonce la sortie de Mistral Large 2, la nouvelle génération de son grand modèle de langage. Par rapport à son prédécesseur, Mistral Large 2 est nettement plus performant en matière de génération de code, de mathématiques et de raisonnement. Il offre également un support multilingue beaucoup...

L'IA open-source AlphaCodium de Qodo est plus performant que o1 d'OpenAI en matière de génération de code, avec un flux en plusieurs étapes qui met l'accent sur l'amélioration continue par itération

Flux Intelligence artificielle Developpez

15 octobre 2024 à 20:40

ChatGPT peut maintenant « voir, entendre et parler », selon OpenAI,
mais les nouvelles fonctionnalités soulèvent des questions de confidentialité et de sécurité

OpenAI a déployé une nouvelle version de ChatGPT qui permet aux utilisateurs de solliciter l'intelligence artificielle non seulement en tapant des phrases dans une zone de texte, mais aussi en parlant à haute voix ou en téléchargeant une photo. Les nouvelles fonctionnalités permettront au chatbot viral d'avoir des conversations vocales...

Les LLM réduisent le partage des connaissances publiques sur les plateformes de questions-réponses en ligne : il y a moins de contenu valable pour former les IA, qui finissent donc par s'auto-empoisonner

Flux Intelligence artificielle Developpez

14 octobre 2024 à 17:10

Stack Overflow est la victime de ChatGPT avec baisse du trafic de 14 %,
alors que ChatGPT a attiré 1,6 milliard de visites en mars et 920,7 millions au cours de la première quinzaine d'avril

Dans un billet de blog publié le 19 avril, David F. Carr, Senior Manager au sein de l'équipe Similarweb, présente l'impact de ChatGPT, un chatbot basé sur l'intelligence artificielle, sur le trafic de Stack Overflow, un site web communautaire pour les développeurs. Pour étayer ses déclarations, explique que...

Cybersécurité : OpenAI a perturbé plus de 20 opérations malveillantes exploitant ChatGPT

Intelligence artificielle

Par : Yoann Bourgin

14 octobre 2024 à 12:12

OpenAI a publié la semaine dernière un rapport détaillant une vingtaine de cas dans lesquels des acteurs malveillants ont utilisé ChatGPT pour...

une IA locale avec Ollama

Journal du hacker: intelligence artificielle

Par : fredix

13 octobre 2024 à 19:41

Comments

Comment détecter un texte généré par IA ?

Journal du hacker: intelligence artificielle

Par : Cascador

12 octobre 2024 à 11:45

Comments

Plus un modèle de langage IA est étendu avec plus d'instructions et d'entraînements, plus il manque de fiabilité et produit des réponses avec confiance mais incorrectes

Flux Intelligence artificielle Developpez

2 octobre 2024 à 11:52

Plus le modèle de langage de l'IA est étendu avec plus d'instructions et d'entraînements à l'alignement, plus les modèles manquent de fiabilité et produisent des réponses avec confiance mais incorrectes.

Une étude confirme que plus un modèle de langage d'IA est mis à l'échelle avec plus d'instructions et de formations d'alignement, plus les modèles deviennent peu fiables, produisant des réponses avec confiance mais incorrectes. Ces résultats soulignent la nécessité d'un changement fondamental dans...

Un chercheur en sécurité démontre qu'il est possible d'exploiter la fonction Mémoire de ChatGPT pour implanter de faux souvenirs dans l'outil d'OpenAI et voler les données des utilisateurs à perpétuité

Flux Intelligence artificielle Developpez

25 septembre 2024 à 21:53

Un chercheur en sécurité démontre qu'il est possible d'exploiter la fonction Mémoire de ChatGPT
pour implanter de faux souvenirs dans l'outil d'OpenAI et voler les données des utilisateurs à perpétuité

Johann Rehberger, un chercheur en sécurité, a démontré qu'il était possible d'utiliser une technique appelée « injection de prompt indirect » pour implanter des souvenirs malveillants dans ChatGPT. Cette méthode consiste à insérer des instructions dans des contenus non fiables, tels que des emails...

Podgenai – Générez des podcasts de A à Z avec l’IA

Intelligence artificielle

Par : Korben

17 septembre 2024 à 09:00

Vous rêvez de créer votre propre podcast mais vous manquez de temps ou d’inspiration ?

Podgenai est là pour vous aider à générer du contenu audio grâce à la POUISSANCE de l’intelligence artificielle ! Aidée de GPT-4, cette application Python vous permet de produire des épisodes d’environ une heure sur n’importe quel sujet en un clin d’œil.

Le principe est simple, vous choisissez un thème, l’IA analyse le sujet en profondeur, identifie les sous-thèmes pertinents et génère un script complet et structuré pour votre émission. Et pas besoin d’être un expert, puisque l’application vulgarise les concepts techniques tout en rendant ça captivant pour votre audience.

L’outil transforme donc directement le texte en audio grâce à une synthèse vocale de bonne qualité qui vous permet de choisir parmi plusieurs voix. Le son produit est clair, naturel et dynamique et vous avez également un contrôle total sur le contenu généré puisqu’il est possible d’affiner les contenus, d’ajuster la longueur de l’épisode ou encore d’insérer vos propres commentaires et anecdotes. Bref, tout ce qu’il faut pour créer un podcast unique en anglais par contre… A voir ce que ça rend sur un texte en français… y’aura peut-être un petit effet Jane Birkin.

Économie de matos, de temps et surtout c’est accessible à tous. Alors bien sûr, je pense que (pour le moment), ça ne peut pas arriver au niveau d’un vrai podcast fait par un vrai humain… mais pour produire vos propres podcast thématiques rapidement afin de défricher un sujet qui vous tient à cœur et écouter tout ça en voiture lors de votre prochain déplacement, je trouve ça plutôt cool.

Vous l’aurez compris, pour moi c’est plutôt à réserver à des fins personnelles que pour une diffusion grand publique. Mais ça n’a pas arrêté les créateurs de l’outil qui ont mis en ligne leur podcast 100% généré par IA à des fins de démo. Ça vous permettra de vous faire un avis.

Toutes les infos sont ici.

Dot – L’app IA locale pour interagir avec vos documents (RAG)

Intelligence artificielle

Par : Korben

11 septembre 2024 à 09:00

Vous rêvez d’exploiter la puissance des grands modèles de langage pour interagir avec vos documents, mais vous ne voulez pas que vos données quittent votre ordinateur ? Et bien j’ai ce qu’il vous faut !

Admettons que vous avez une tonne de documents sur votre disque dur, des PDFs, des fichiers Word, des présentations PowerPoint, des feuilles de calcul Excel et même des fichiers Markdown… Vous aimeriez pouvoir obtenir des réponses à vos questions à partir de leur contenu, avoir des résumés, générer de nouvelles idées à partir de ces informations… Bref, avoir un genre d’assistant intelligent qui pourrait comprendre et manipuler toutes ces données. Et bien c’est exactement ce que propose Dot !

Au cœur de son fonctionnement, on trouve un modèle de langage pré-entraîné, en l’occurrence une version de Mistral 7B au moment où j’écris ces lignes, qui tourne en local et permet de faire ce qu’on appelle du « Retrieval Augmented Generation » ou RAG.

En gros, ça veut dire que l’IA ne se contente pas de générer du texte à partir de ce qu’elle a appris, mais qu’elle va aussi chercher des informations pertinentes dans une base de connaissances locale. Vous sélectionnez un dossier contenant les documents que vous voulez indexer, Dot va les analyser, les découper en morceaux, calculer des embeddings et construire un index permettant de retrouver rapidement les passages les plus pertinents pour une requête donnée.

Et ensuite, vous pouvez discuter avec Dot comme vous le feriez avec un assistant IA classique. Vous lui posez une question, et il utiliser ses connaissances générales pour formuler une réponse, mais aussi aller piocher dans votre base documentaire pour l’enrichir avec des informations spécifiques. Du coup, ça booste d’un cran la pertinence et la qualité des réponses obtenues !

Bien sûr, comme Dot tourne exclusivement en local, vous n’avez pas à vous inquiéter pour la confidentialité de vos données puisque rien ne quitte jamais votre machine. C’est un gros avantage par rapport aux solutions cloud qui vont envoyer vos documents sur des serveurs distants. Et si vous avez besoin d’un coup de main pour des tâches qui ne nécessitent pas forcément d’accéder à vos documents, Dot intègre un mode « Big Dot ». Vous basculez dessus en un clic, et vous vous retrouvez avec un assistant IA généraliste, capable de tenir des conversations sur n’importe quel sujet, d’aider à la rédaction, de faire du brainstorming, etc. C’est comme avoir un ChatGPT en local sous la main à tout moment.

Si ça vous dit de tester, c’est gratuit, open source, dispo sous macOS, Windows, Linux et disponible ici : https://dotapp.uk/

Auto-News – L’agrégateur de news automatisé par IA

Intelligence artificielle

Par : Korben

24 août 2024 à 09:00

Ce serait cool si on pouvait avoir accès directement aux informations les plus pertinentes pour nous, sans être submergé par le bruit constant des trucs sans intérêt. Et bien c’est exactement ce que propose Auto-News, un agrégateur d’actu personnel qui exploite la puissance de l’intelligence artificielle pour vous aider à vous informer de manière plus efficace.

Notre temps étant précieux, il est crucial de bien l’utiliser et malheureusement, tout ces moments qu’on passe à chercher, filtrer et organiser le contenu provenant de différentes sources, c’est un peu du gâchis.

Cet outil est donc capable d’agrèger les flux de diverses sources telles que Twitter, RSS, YouTube, des articles web, Reddit et même vos notes personnelles et grâce à l’utilisation de modèles de langage comme ChatGPT, il est capable de résumer et de filtrer le contenu, éliminant ainsi plus de 80% du bruit.

Comme ça, vous pouvez rester concentré sur la lecture des actus qui vous intéressent vraiment, en fonction de vos centres d’intérêt, tout en restant aligné sur vos objectifs. N’oubliez pas quand même de mettre Korben.info dans vos sources :))

Mais Auto-News va encore plus loin puisqu’il est capable de générer des listes de tâches à partir de vos notes. Il peut également les organiser en les résumant avec les informations clés et y’a même une fonctionnalité expérimentale appelée « Deepdive » qui grâce à un agent de recherche web et à l’outil Autogen de Microsoft, vous permet d’explorer en profondeur des sujets qui vous passionnent.

Côté technique, Auto-News prend en charge plusieurs backends d’IA, dont OpenAI ChatGPT et Google Gemini. L’interface utilisateur est basée sur Notion, ce qui signifie que vous pouvez y accéder de n’importe où, que ce soit via un navigateur web ou une application mobile. Son déploiement est plutôt flexible, avec une prise en charge de Docker Compose et de Kubernetes donc ça peut s’intégrer facilement dans votre flux de travail.

A découvrir ici.

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o avec des ensembles de données personnalisés, afin d'obtenir des performances plus élevées à moindre coût pour les cas d'utilisation spécifiques

Flux Intelligence artificielle Developpez

22 août 2024 à 14:10

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o avec des ensembles de données personnalisés, afin d'obtenir des performances plus élevées à moindre coût pour les cas d'utilisation spécifiques.

OpenAI publie un outil de réglage fin pour personnaliser GPT-4o, permettant une formation personnalisée de l'IA pour les entreprises. Les entreprises peuvent utiliser leurs données pour améliorer les performances de l'IA tout en conservant le contrôle et la propriété. Les développeurs peuvent...

Copilot Autofix : la réponse de l'IA aux problèmes de vulnérabilité du code, le nouvel outil d'analyse de GitHub, piloté par l'IA, promet de révolutionner la détection et la correction des vulnérabilités

Flux Intelligence artificielle Developpez

19 août 2024 à 17:39

Copilot Autofix : la réponse de l'IA aux problèmes de vulnérabilité du code, le nouvel outil d'analyse de GitHub, piloté par l'IA, promet de révolutionner la détection et la correction des vulnérabilités

« Trouvé signifie réparé », tel est le slogan du nouveau Copilot Autofix de GitHub. Les développeurs sont censés fournir un code de programmation sécurisé trois fois plus rapidement grâce à cet outil piloté par l'IA.

Microsoft Copilot est un chatbot d'intelligence artificielle générative développé...

Quand l'IA devient étrange : OpenAI constate que GPT-4o fait parfois des choses vraiment bizarres comme le clonage de la voix de son interlocuteur ou des effets sonores inappropriés

Flux Intelligence artificielle Developpez

11 août 2024 à 19:07

Quand l'IA devient étrange : OpenAI constate que GPT-4o fait parfois des choses vraiment bizarres
comme le clonage de la voix de son interlocuteur ou des effets sonores inappropriés

OpenAI a récemment lancé l'alpha de la fonctionnalité Advanced Voice Mode dans ChatGPT, alimentée par le modèle d'intelligence artificielle GPT-4o. Ce modèle est le premier à être formé à la fois sur la voix, le texte et les images, ce qui ouvre la voie à des expériences multimodales passionnantes. Cependant, cette...

Le modèle GPT-4o présente un risque "moyen", selon la dernière évaluation d'OpenAI, qui met en lumière ses efforts pour atténuer les risques potentiels liés à son dernier modèle d'IA multimodale

Flux Intelligence artificielle Developpez

9 août 2024 à 17:09

Le modèle GPT-4o présente un risque "moyen", selon la dernière évaluation d'OpenAI, qui met en lumière ses efforts pour atténuer les risques potentiels liés à son dernier modèle d'IA multimodale.

OpenAI vient de publier la fiche système de GPT-4o. Le document met en lumière les efforts d'OpenAI pour atténuer les risques potentiels associés à son dernier modèle d'IA multimodale. Selon cette évaluation, GPT-4o présente des risques "faibles" pour la cybersécurité, les menaces biologiques,...

Perplexica – Le moteur de recherche open source propulsé à l’IA

Intelligence artificielle

Par : Korben

1 août 2024 à 13:00

Perplexica est un moteur de recherche gratuit et transparent, qui comprend ce que vous lui demandez et qui vous trouve pile poil ce que vous cherchez, le tout boosté à l’intelligence artificielle dernière génération. Ça vous parle, non ?

Ah bah oui c’est comme Perplexity.ai sauf que c’est gratuit, open source et que ça vous permet de fouiller le web en profondeur pour dénicher les réponses à toutes vos questions. Pour cela, l’outil utilise des algorithmes d’apprentissage automatique basés notamment sur la recherche par similarité sémantique. En gros, il est capable de piger le sens de votre question et de trouver les sources les plus pertinentes.

Comme ça, vous obtenez des réponses claires et sourcées, servies sur un plateau d’argent sans avoir besoin de passer des heures à éplucher les pages de résultats pour trouver l’info qui vous intéresse.

Pas de cookies qui vous espionnent ni de revente de données personnelles en douce et vos recherches restent confidentielles. Côté fonctionnalités, Perplexica propose plusieurs modes de recherche bien pratiques :

Le mode Copilot (encore en développement) : il génère des requêtes pour trouver les sources Internet les plus pertinentes. Plutôt que d’utiliser uniquement le contexte fourni par SearXNG, il visite directement les meilleurs résultats pour trouver les sources les plus adaptées à votre question.
Le mode Normal : il traite votre requête et effectue une recherche web classique.
Les Focus Modes : des modes spécialisés pour répondre à des besoins spécifiques, comme la recherche académique, la recherche YouTube, les calculs via Wolfram Alpha ou encore la recherche Reddit pour les discussions et avis.

Et niveau technique, il utilise un meta-moteur de recherche bien fichu qui s’appelle SearXNG. C’est lui qui récupère les résultats, les trie, les recoupe, pour ne garder que la crème de la crème. L’avantage, c’est que vous avez toujours des infos à jour, sans latence. Et comme je le disais en intro, il s’appuie aussi sur des modèles de langage locaux comme Llama3 et Mixtral, via l’API Ollama ce qui lui permet d’affiner encore plus les résultats.

Et pour l’installer, c’est super simple :

Clonez le dépôt GitHub de Perplexica : git clone https://github.com/ItzCrazyKns/Perplexica.git
Renommez le fichier sample.config.toml en config.toml et remplissez les champs nécessaires (clé API, etc.)
Lancez la commande docker compose up -d
Attendez quelques minutes que l’installation se termine
Accédez à Perplexica via http://localhost:31337 depuis votre navigateur

Une fois que c’est en place, vous pouvez même utiliser Perplexica comme moteur de recherche par défaut dans votre navigateur. Il suffit d’aller dans les paramètres, d’ajouter un nouveau moteur de recherche avec l’URL http://localhost:31337/?q=%s et le tour est joué !

Après, forcément, c’est encore un jeune projet, donc il y a des petits trucs à peaufiner et les devs planchent notamment sur la finalisation du mode Copilot, l’ajout d’une page de paramètres, de fonctionnalités comme l’historique de recherche, et le support des modèles de langage locaux.

Mais même en l’état, je trouve que ça vaut grave le coup de tester Perplexica, ne serait-ce que pour voir à quoi peut ressembler un moteur de recherche IA à la fois éthique et transparent ^^.

Remerciement spécial à Lorenper pour l’info !

Le ministère américain du Commerce publie un outil de mesure des risques inhérents aux LLM

Intelligence artificielle

Par : Célia Séramour

29 juillet 2024 à 17:02

Le ministère américain du Commerce a annoncé il y a quelques jours la publication d'orientations et de logiciels destinés à améliorer la...

Des "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a récupéré leur travail, leur travail aurait été intégré dans des modèles d'IA sans leur consentement

Flux Intelligence artificielle Developpez

29 juillet 2024 à 13:22

Des "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a récupéré leur travail, car leurs travails auraient été intégré dans des modèles d'IA sans leur consentement.

Selon une nouvelle étude, les "pièges à droits d'auteur" pourraient indiquer aux écrivains si une IA a piraté leur travail. La technique a été utilisée tout au long de l'histoire, mais elle pourrait désormais constituer un outil dans l'un des plus grands combats de l'intelligence artificielle.

L'intelligence...

Badllama 3 : comment supprimer le réglage fin de sécurité du modèle d'IA Llama 3 en quelques minutes, le réglage de sécurité LLM peut être facilement détourné lorsqu'un attaquant a accès aux poids du modèle

Flux Intelligence artificielle Developpez

26 juillet 2024 à 05:08

Badllama 3 : comment supprimer le réglage fin de sécurité du modèle d'IA Llama 3 en quelques minutes, le réglage de sécurité du LLM peut être facilement détourné lorsqu'un attaquant a accès aux poids du modèle

Une étude de Palisade Research, une société de conseil analytique qui effectue des recherches sur les capacités dangereuses de l'IA, a montré que le réglage fin de sécurité d'un LLM étendu peut être facilement détourné lorsqu'un attaquant a accès aux poids des modèles. L'étude a évalué trois...

Un LLM sur un Raspberry Pi

Journal du hacker: intelligence artificielle

Par : mathdatech

23 juillet 2024 à 08:54

Comments

Proton lance un assistant d'écriture IA pour le courrier électronique qui fonctionne sur l'appareil et s'appuie sur Mistral 7B, un modèle de langage open source de la startup française Mistral

Flux Intelligence artificielle Developpez

19 juillet 2024 à 03:07

Proton lance un assistant d'écriture IA pour le courrier électronique qui fonctionne sur l'appareil et s'appuie sur Mistral 7B, un modèle de langage open source de la startup française Mistral.

Proton annonce le lancement Proton Scribe, un assistant d'écriture IA qui rédige et corrige des courriels pour vous. Proton Scribe a été conçu pour la confidentialité et peut être exécuté localement, de sorte que les données ne quittent jamais votre appareil.

Proton Mail est un service de messagerie électronique...

JetBrains annonce la disponibilité générale de Grazie, son assistant d'écriture par IA pour les professionnels de la Tech

Flux Intelligence artificielle Developpez

11 juillet 2024 à 11:06

JetBrains annonce la disponibilité générale de Grazie
Son assistant d'écriture par IA pour les professionnels de la Tech

JetBrains annonce la disponibilité de Grazie, son assistant d'écriture par IA pour les professionnels de la Tech. Grazie simplifie les tâches non liées au code en intégrant l'IA générative dans les EDI JetBrains, navigateurs et d'autres outils.

Grâce à ses fonctionnalités de relecture instantanée, de saisie semi-automatique de texte inline, de production de résumés, de traduction...

Le clone IA d'une influenceuse a commencé à proposer à ses fans des expériences sexuelles "stupéfiantes" à son insu, l'IA semblait se former sur ces sujets à partir des conversations avec les utilisateurs

Flux Intelligence artificielle Developpez

1 juillet 2024 à 22:01

Le clone IA d'une influenceuse a commencé à proposer à ses fans des expériences sexuelles "stupéfiantes" à son insu
l'IA semblait se former sur ces sujets à partir des conversations avec les utilisateurs

Caryn Marjorie, influenceuse sur Snapchat, a lancé l'année dernière une copie virtuelle d'elle-même pilotée par l'IA avec laquelle ses fans peuvent discuter pour un dollar la minute. Le projet lui a rapporté plus de 70 000 dollars la première semaine. Cependant, elle a confié le mois dernier...

Un jailbreak appelé "Skeleton Key" révèle le pire de l'IA : une simple invite permet de contourner les garde-fous de sécurité sur les principaux modèles comme GPT-4o et Gemini Pro, selon Microsoft

Flux Intelligence artificielle Developpez

28 juin 2024 à 15:52

Un jailbreak appelé "Skeleton Key" révèle le pire de l'IA : une simple invite permet de contourner les garde-fous de sécurité sur les principaux modèles comme GPT-4o et Gemini Pro
selon Microsoft

Microsoft a rendu public un jailbreak appelé "Skeleton Key" qui affecte de nombreux modèles d'IA. L'entreprise définit l'exploit comme une technique qui permet de contourner les garde-fous utilisés par les fabricants de modèles d'IA afin d'empêcher leurs chatbots de générer des contenus...

OpenAI dévoile CriticGPT, un nouveau modèle d'IA entraîné pour critiquer les réponses de GPT-4, le modèle détecte les bogues dans les codes générés par ChatGPT, améliorant ainsi la surveillance humaine de l'IA

Flux Intelligence artificielle Developpez

28 juin 2024 à 12:31

OpenAI dévoile CriticGPT, un nouveau modèle d'IA entraîné pour critiquer les réponses de GPT-4, le modèle détecte les bogues dans les codes générés par ChatGPT, améliorant ainsi la surveillance humaine de l'IA

Les chercheurs d'OpenAI viennent de dévoiler CriticGPT, un nouveau modèle d'IA conçu pour identifier les erreurs dans le code généré par GPT-4. Ce modèle vise à améliorer le processus permettant aux systèmes d'IA de se comporter de la manière souhaitée par les humains (appelé également "alignement")...

LibreChat, un clone libre et open source de ChatGPT, qui vous permet d'utiliser plusieurs services d'IA tels que GPT-4o et PaLM 2, il prend également en charge le traitement des images et des fichiers

Flux Intelligence artificielle Developpez

24 juin 2024 à 14:20

LibreChat, un clone libre et open source de ChatGPT, qui vous permet d'utiliser plusieurs services d'IA tels que GPT-4o et PaLM 2
il prend également en charge le traitement des images et des fichiers

Une équipe de développeurs dirigés par Danny Avila a lancé LibreChat comme une alternative libre et open source à ChatGPT avec de nombreuses améliorations. LibreChat permet à l'utilisateur de choisir le chatbot à utiliser lors les conversations ; il peut choisir des options gratuites parmi les modèles...

Les défis croissants du code généré par l'IA : le code généré par l'IA pourrait augmenter la charge de travail des développeurs et accroître les risques, selon Harness

Flux Intelligence artificielle Developpez

20 juin 2024 à 10:39

Les défis croissants du code généré par l'IA : le code généré par l'IA pourrait augmenter la charge de travail des développeurs et accroître les risques,
selon Harness

L'intelligence artificielle (IA) est censée faciliter le travail des développeurs, mais selon Harness, le code généré par l'IA pourrait en réalité tripler leur charge de travail dans l'année à venir. L'augmentation du volume de code livré accroît les risques de failles et de vulnérabilités si les tests et les mesures de sécurité...

Vue lecture

Un projet 100% européen

Maintenant comment l’installer ?

Alors pourquoi c’est important ?