Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierinformatique général
  • ✇Korben
  • WordPress Workspace - L'agent IA d'Automattic
    Si comme moi, vous bloguez encore à l'ancienne, c'est à dire depuis l'interface web de WordPress.com, sachez qu'Automattic vient de balancer une app pour Mac qui s'est donné pour mission de vraiment bousculer votre façon d'écrire. WordPress Workspace est donc un éditeur de site, un agent IA, un outil de prise de note... Bref, un outil fourre-tout qui est en réalité un agent IA branché sur votre contenu et capable aussi d'uploader des médias vers la médiathèque de votre site. Ça se présente donc

WordPress Workspace - L'agent IA d'Automattic

Par : Korben ✨
20 mai 2026 à 11:13

Si comme moi, vous bloguez encore à l'ancienne, c'est à dire depuis l'interface web de WordPress.com, sachez qu'Automattic vient de balancer une app pour Mac qui s'est donné pour mission de vraiment bousculer votre façon d'écrire.

WordPress Workspace est donc un éditeur de site, un agent IA, un outil de prise de note... Bref, un outil fourre-tout qui est en réalité un agent IA branché sur votre contenu et capable aussi d'uploader des médias vers la médiathèque de votre site. Ça se présente donc comme un chat auquel on peut demander tout et n'importe quoi, du style "Voici mon article [TEXTE]. Publie le" ou encore "J'ai la flemme, écris moi un article sur ça : [SUJET]".

Vous pouvez aussi l'utiliser pour interroger votre site web, corriger des trucs, mettre à jour des articles...etc.

Le DMG se télécharge en direct depuis le GitHub d'Automattic , et c'est entièrement gratuit avec n'importe quel plan WordPress.com durant la bêta. Et ça fonctionne aussi avec les sites auto-hébergés comme le mien, pour peu que vous l'ayez lié avec Jetpack.

Ce qui est cool avec cet outil c'est surtout que c'est un agent qui connaît déjà votre site WordPress, son contenu, ses médias, ses guidelines et les permissions liées à votre compte. Donc ça va vite...

Au menu des fonctionnalités, vous aurez de la dictée vocale qui s'alignera sur le ton du site, l'envoi de captures d'écran que vous balancez directement dans l'outil, et un raccourci clavier global qui invoque l'agent depuis n'importe quelle app Mac où vous écrivez, même hors WordPress.

Côté multi-sites, vous pouvez aussi naviguer entre plusieurs sites, où chacun devient son propre workspace avec ses propres réglages et ses propres "guidelines" comme on dit, déjà mémorisées.

Sur la roadmap, Automattic prépare une fonctionnalité Guidelines dans le cœur de WordPress, plus des Memories (apprentissage continu de l'agent), des Skills (capacités partageables en équipe) et des Artifacts (stockage de contenu en cours). L'objectif est donc plutôt clair : Ils veulent transformer WordPress en couche de contexte permanente pour les outils IA, et plus simplement en CMS où on dépose des articles.

Donc à tester si vous publiez régulièrement sur WordPress.

Source

  • ✇LinuxFr.org : les dépêches
  • Sortie de SongRec 0.6 : Shazam, ouvre-toi !
    La version 0.6 de SongRec, application de bureau permettant la reconnaissance de titres audio sur la base d’échantillons audio ou simplement du microphone, a eu l’honneur de venir au monde en ce début d’année, avec une toute nouvelle interface entérinant la migration de GTK+ 3 à 4. Elle est d’ores et déjà disponible sur Flathub et le Snap Store. Au menu : une intégration du langage d’interface Adwaita, une option pour minimiser l’application dans la barre de tâches via l’API DBus KSNI, une inte

Sortie de SongRec 0.6 : Shazam, ouvre-toi !

La version 0.6 de SongRec, application de bureau permettant la reconnaissance de titres audio sur la base d’échantillons audio ou simplement du microphone, a eu l’honneur de venir au monde en ce début d’année, avec une toute nouvelle interface entérinant la migration de GTK+ 3 à 4. Elle est d’ores et déjà disponible sur Flathub et le Snap Store.

Au menu : une intégration du langage d’interface Adwaita, une option pour minimiser l’application dans la barre de tâches via l’API DBus KSNI, une interface plus claire avec quelques paramètres, la mise à jour des dépendances avec notamment l’utilisation des bindings Rust de Libsoup3 pour le réseau afin de permettre une meilleure intégration au bureau, l’intégration de Weblate pour les traductions, et une candidature pour rejoindre Gnome Circle.

La migration de GTK-3 vers GTK-4

Dépoussiérée, l’interface de SongRec s’offre une cure de jouvence.

Avant la transition…
Avant la transition…

…et après la transition
Après

L’objectif a été de suivre les lignes directrices d’interface humaine de GNOME au mieux, notamment afin de s’aligner sur les critères d’inclusion GNOME Circle.

La nouvelle interface basée sur la plateforme Adwaita est donc mieux intégrée au bureau GNOME 3, et utilise des bibliothèques plus modernes et mises à jour.

L’interface a été refaite avec l’outil de conception d’interface (RAD) Cambalache, successeur du défunt Glade, qui vient tout juste de sortir en version 1.0.

Weblate, pour la traduction c’est + puissant

Une instance de la plateforme de traduction Weblate a été mise en ligne, afin de répondre au mieux aux besoins d’internationalisation plus simple sur le projet. SongRec est ainsi maintenant disponible en 16 langues, qui sont en partie à jour, et peut être traduit sans compte Github.

Auparavant, les fichiers .po étaient traduits manuellement en utilisant le système de pull requests Github. Désormais, une plateforme de traduction auto-hébergée est utilisée.

La simplicité d’installation de Weblate, application basée sur Django et compatible avec uWSGI, est appréciée.

Oh Snap !

SongRec est aussi maintenant disponible, en plus d’une distribution par PPA, dans les dépôts extra d’Arch Linux et sur Flathub, mais aussi désormais via le Snap Store.

L’intégration au Snap Store a été bien moins aisée que celle à Flathub, voire tellement frustrante que cinq ans et demi sont passés entre la première tentative d’intégrer la bibliothèque multi-plateforme Rust CPAL qui utilise pour seul backend sous Linux ALSA (plus précisément libasound et donc les couches de compatibilité associées avec PipeWire et Pulseaudio) et la production d’une solution fonctionnelle pour ce paquet.

Heureusement, CPAL 0.18 qui devrait intégrer la compatibilité native avec PulseAudio et PipeWire devrait sortir incessamment sous peu…

 La notification 🔔

Aussi, sur demande de la base utilisatrice, il est désormais possible de réduire SongRec dans la zone de notifications, en utilisant l’API DBus KSNI, un standard produit par KDE transcendant les environnements de bureau qui tend à remplacer libappindicator et son successeur libayatana-appindicator, portés par Canonical, qui dépendent de GTK-3 et ne sont plus intégrés à GTK-4.

L’autre alternative compatible avec GTK-4 qui permet de réduire les applications en fond, l’API DBus FreeDesktop background portal XDG, semble en effet comporter des bugs et n'être pas tout à fait mature.

La fenêtre de préférences de SongRec
La fenêtre de préférences de SongRec.

Un arrêt maladie bien occupé

La contribution de SongRec est ouverte à tout le monde et soumise au simple respect du code de conduite GNOME. Un canal Matrix, alternative non centralisée à Discord a de plus été mis en place pour permettre une collaboration plus aisée, en dehors des issues Git.

Fait main et artisanale, cette application produite sans IA générative aucune ne demande que vos petites mains pour continuer à fonctionner.

Elle utilise actuellement les services d’Apple, avec des API identifiées sur la base de l’analyse de l’application Android au titre de l’interopérabilité, tout comme les projets VLC ou FFMpeg, français, intègrent leurs propres implémentations des formats du consortium MPEG, sur la base des exceptions de droit d’auteur permises en droit français au titre d’interopérabilité et notamment l’avis du Conseil d’État du 16 juillet 2008, qui confirme la protection du développement de logiciels libres à cette fin.

Le brevet d’origine derrière l’algorithme de création d’empreinte de Shazam, qui en tant que brevet logiciel n’a jamais été valable dans l’UE, est expiré, et son fonctionnement est également documenté depuis un certain temps.

Son fonctionnement est, brièvement, de produire un spectrogramme audio (soit une grille présentant les fréquences sur un axe et le temps sur l’autre) à partir des dernières secondes d’audio captées par l’utilisateur ou l’utilisatrice, et l’amplitude aux intersections. Les pics d’amplitude audio importants sont ensuite identifiés et transmis aux serveurs d’Apple.

Un spectrogramme audio
Un spectrogramme audio - de Wikimedia Commons, par Aquegg, le 21 décembre 2008, domaine public

Ainsi, l’audio complet n’est en aucun cas communiqué aux serveurs distants, et votre vie privée est respectée.

La liste des contributeurs et contributrices est disponible ici.

N’hésitez donc pas si vous souhaitez participer à la maintenance et au développement de cette application sous licence GPL v3 !

Commentaires : voir le flux Atom ouvrir dans le navigateur

  • ✇Korben
  • VoxDrop - La dictée vocale ultra-rapide qui tourne en local sur Mac
    La dictée vocale, y'a plein d'outils pour ça. Sauf que la plupart envoient votre voix dans le cloud pour la transcrire, et surtout... c'est lent. Chez Google, chez OpenAI, chez Apple... entre le moment où vous parlez et celui où le texte s'affiche, y'a toujours cette latence qui casse tout. Et ça fait des mois que ça me gonflait, surtout en bossant sur mon Mac Studio M4 et mon MacBook Air M2 qui sont quand même censés être des bêtes de course. Du coup je me suis codé VoxDrop au départ rien que p

VoxDrop - La dictée vocale ultra-rapide qui tourne en local sur Mac

Par : Korben
9 février 2026 à 08:00

La dictée vocale, y'a plein d'outils pour ça. Sauf que la plupart envoient votre voix dans le cloud pour la transcrire, et surtout... c'est lent. Chez Google, chez OpenAI, chez Apple... entre le moment où vous parlez et celui où le texte s'affiche, y'a toujours cette latence qui casse tout. Et ça fait des mois que ça me gonflait, surtout en bossant sur mon Mac Studio M4 et mon MacBook Air M2 qui sont quand même censés être des bêtes de course.

Du coup je me suis codé VoxDrop au départ rien que pour moi. Une app macOS qui transforme votre voix en texte, et avec laquelle TOUT se passe en local sur votre machine. Zéro cloud, zéro donnée qui fuite, et surtout c'est rapide. Vous appuyez sur un raccourci (⌥ + Espace par défaut), vous parlez, vous relâchez, et hop, le texte apparaît directement là où se trouve votre curseur. Pas de fenêtre à ouvrir, pas de copier-coller. L'app est super légère et reste discrète en tâche de fond sans bouffer votre RAM.

L'interface de VoxDrop - sobre et efficace ( Source )

Côté moteurs de transcription, y'en a 7 au choix. J'ai voulu ratisser large en mettant des modèles américains, français et chinois. Parakeet de NVIDIA (600 Mo) est le modèle par défaut. Il est super rapide, c'est mon préféré. J'ai mis aussi Whisper avec ses variantes Small, Medium, Turbo et Large v3 qui couvre tous les cas. Y'a aussi Voxtral Mini de chez Mistral, made in France, et Qwen3-ASR le modèle chinois.

Les 7 moteurs de transcription au choix ( Source )

Alors pourquoi sur architecture Silicon ? Hé bien déjà parce que c'est ce que j'utilise au quotidien et aussi parce que les puces Apple Silicon (M1, M2, M3, M4) ont un avantage énorme pour l'IA locale : la mémoire unifiée. En gros, le CPU et le GPU partagent la même RAM. Un modèle chargé en mémoire est donc directement accessible au GPU Metal pour les calculs, sans copie de données. C'est pas magique non plus hein, si votre modèle fait 3 Go et que vous avez 8 Go de RAM, ça va ramer. Mais sur un MacBook Air M2, un modèle de 400 Mo tourne en temps réel sans broncher.

Et VoxDrop ne fait pas QUE de la transcription. Y'a aussi du post-traitement local avec une traduction dans 13 langues mais aussi une reformulation (mode pro, décontracté, concis, structuré...), le tout via le modèle de langage embarqué GemmaTranslate. Et vous avez 5 raccourcis clavier indépendants, chacun avec sa propre config. Un pour dicter, un pour traduire en direct, un pour reformuler ce que vous avez sélectionné...etc. Perso, au quotidien, ceux qui l'utilisent ne peuvent s'en passer. Et moi non plus ! Sauf si vous tapez plus vite que vous ne parlez, mais bon, ça m'étonnerait ^^.

Maintenant, pourquoi c'est pas sur l'App Store ?

Parce que VoxDrop est réservé à mes abonnés Patreon . Vous me soutenez pour la veille techno et la vulgarisation, et en retour j'ai envie de vous filer des outils concrets que j'utilise moi-même tous les jours. Pas de commission, pas d'intermédiaire. Juste un truc développé pour les gens qui me suivent.

J'espère d'ailleurs que ce sera la première d'une série d'apps comme ça. En tout cas, je ne crois pas avoir vu ce modèle de licence ailleurs. J'ai même développé un petit framework exprès pour ça, que je compte bien réutiliser.

Voilà, un GROS merci à tous ceux qui ont bêta-testé l'app pour moi, vos retours ont été très précieux !

Et si vous êtes déjà sur Patreon , VoxDrop est dispo ici !

❌
❌