Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Midjourney ouvre son site web à tous avec une offre d’essai gratuit

La semaine dernière, Midjourney, le laboratoire de recherche indépendant à l’origine du modèle text-to-image du même nom, a annoncé sur X et Discord le lancement officiel de son site web dédié, jusqu’ici accessible à un nombre limité d’utilisateurs, avec, en prime, un crédit de 25 images générées gratuitement. Cette offre d’essai gratuit est toutefois limitée dans le temps.

Midjourney a été créé en 2022 par David Holz qui en est le PDG. La 1ère version de son modèle d’IA générative d’images a été lancée en février de cette même année. La version V6.1, introduite le 30 juillet dernier, produit des images plus cohérentes avec des détails et des textures plus précis, présente des capacités avancées d’invite et de remixage d’images, et génère ces dernières plus rapidement.

Selon la page officielle de Midjourney sur Discord, le serveur compte plus de 20 880 000 membres. C’est d’ailleurs ce succès qui avait amené Midjourney à cesser de proposer de générer gratuitement des images à l’aide de son IA en mars 2023, David Holz déclarant :

En raison d’une demande extraordinaire et d’un abus des essais, nous désactivons temporairement les essais gratuits jusqu’à ce que nous ayons déployé les prochaines améliorations du système”.

Une expérience plus simple et accessible

Jusqu’à récemment, les utilisateurs devaient passer par Discord pour créer et retoucher leurs images, un processus parfois fastidieux nécessitant une certaine maîtrise des  “prompts” ou invites textuelles. Ce système a été jugé peu convivial par de nombreux utilisateurs, en particulier ceux qui débutent dans l’univers de l’IA.

Pour répondre à cette demande, Midjourney a lancé la version alpha de son site web dédié à la fin de l’année dernière, mais celui-ci était initialement réservé aux utilisateurs ayant généré au moins 1 000 images via Discord, ce qui en excluait beaucoup. Désormais, cette barrière a été levée, permettant à tous les utilisateurs de bénéficier d’une interface plus intuitive et plus fluide.

Inscription et utilisation

L’inscription au site web de Midjourney est simple et rapide. Les utilisateurs peuvent se connecter en utilisant un compte Google ou Discord. Ceux qui ont déjà utilisé Discord pour créer des images peuvent récupérer leur historique en fusionnant leur compte Discord avec leur compte Google.

Une fois connectés, les utilisateurs sont accueillis par une interface conviviale dotée d’une barre latérale à gauche, offrant des onglets pour différentes sections et tâches. La section “Explorer” permet de découvrir les créations des autres utilisateurs, tandis que la section “Créer” guide les nouveaux venus à travers une vidéo de démonstration.

Le processus de création est simple : il suffit de taper un prompt dans le champ prévu à cet effet, et Midjourney génère instantanément quatre images différentes. L’utilisateur peut alors sélectionner l’image qu’il préfère pour l’affiner, l’agrandir ou la modifier à l’aide d’outils spécifiques. L’éditeur d’images intégré permet des ajustements précis, tels que la modification du prompt, la retouche de zones spécifiques de l’image, ou encore l’ajout de nouveaux éléments.

Outre la création d’images, le site propose également via l’onglet “chat” des salons de discussion où les utilisateurs peuvent partager leurs créations, échanger des astuces et découvrir de nouvelles idées. Une fois le quota de 25 crédits gratuits atteint, les utilisateurs sont invités à souscrire à l’un des abonnements payants proposés par Midjourney. Les tarifs varient de 10 à 120 dollars par mois, selon le forfait choisi.

Midjourney ouvre son site web à tous avec une offre d'essai gratuit

Levée de fonds en seed de 1 million d’euros pour Seelab et son outil de création graphique

Seelab.ai, la plateforme d’IA générative “tout-en-un” dédiée aux équipes créatives, vient de lever 1 million d’euros lors d’un tour de table mené par SideAngels. Cette levée de fonds d’amorçage marque un pas décisif pour cette jeune startup française qui ambitionne de devenir le leader national de la génération d’images grâce à l’IA pour les entreprises.

Créée en 2023 à Lannion par Mathieu Grosselin, Julien Rebaud et Ronan Tessier, Seelab compte aujourd’hui une dizaine de collaborateurs. Avec cette injection de capital, Seelab est en mesure de poursuivre le développement de sa technologie de pointe lancée en mars dernier, Seelab.ai, qui combine des algorithmes de deep learning avec des techniques avancées de traitement d’image. Cette combinaison permet de créer des éléments graphiques personnalisés de manière simple tout en respectant la consistance et le branding des entreprises.

Une plateforme intuitive et sécurisée

L’outil de génération d’images de Seelab se distingue par sa simplicité d’utilisation qui ne requiert aucune expertise préalable en informatique, IA ou en invites (prompts). Il suffit aux entreprises d’importer une dizaine d’images respectant leur charte graphique ou d’utiliser l’une des dizaines de styles pré-configurés, seelab.ai se charge du reste. La plateforme, déjà adoptée par près de 10 000 utilisateurs, offre ainsi une solution complète qui élimine le besoin de recourir à d’autres outils de création graphique. Il est d’ailleurs possible de l’essayer gratuitement sur le site de la start-up.

En tant qu’initiative française, Seelab.ai assure également une sécurité maximale des données. Contrairement à de nombreuses solutions développées en dehors de l’UE, les données des utilisateurs de Seelab restent hébergées en Europe, garantissant ainsi leur confidentialité. Les visuels créés et stockés sur la plateforme sont privés et ne sont pas utilisés pour entraîner d’autres modèles publics.

Grâce à ce financement, l’entreprise prévoit de renforcer ses équipes techniques, notamment en Machine Learning et en Computer Vision. Cela permettra d’accélérer la mise sur le marché de nouveaux produits et fonctionnalités conçus pour simplifier la création et l’édition de visuels et de templates, allégeant ainsi la charge des équipes créatives.

Matthieu Grosselin, co-CEO et cofondateur de Seelab, assure :

“Cette nouvelle étape marque une validation significative de notre vision et de notre technologie. Avec ce financement, nous sommes déterminés à poursuivre notre mission de réinventer la création visuelle grâce à l’intelligence artificielle. Si Seelab suit les traces de solutions comme Midjourney et Dall E, notre technologie se distingue par sa simplicité d’utilisation ainsi que sa capacité à créer des images consistantes sans avoir recours à des logiciels de design graphiques complémentaires, redéfinissant ainsi les possibilités de la créativité”. 

Julien Rebaud, co-CEO et cofondateur, ajoute :

“Le tour de table que nous venons de clôturer nous permet de recruter des experts dans chacun des domaines et de commercialiser le produit au grand public afin de répondre précisément aux besoins croissants des équipes design et marketing. Seelab a été conçue pour offrir une solution qui réduit les coûts et les délais de production tout en augmentant leur créativité et leur efficacité ainsi qu’en garantissant la sécurité de leurs données”.

Levée de fonds en seed de 1 million d'euros pour Seelab et son outil de création graphique

Créez votre avatar IA en un clin d’oeil avec PuLID

Développé par une équipe de chez ByteDance (mais si, TikTok, votre réseau social préféré), ce modèle baptisé PuLID va vous permettre de créer des images sur-mesure à partir de photos existantes et tout ça en un clin d’œil.

Basé sur le principe d’alignement contrastif, PuLID vous offre une customisation d’identité ultra rapide et de haute qualité. Pour cela, il utilise une architecture qui apprend à la volée les caractéristiques clés d’une identité source (des photos de vous) pour les transposer efficacement sur de nouvelles images cibles (images générées par IA). On obtient alors des visuels uniques générés en quelques secondes à peine, tout en préservant la cohérence des photos d’origine.

Bon, ok, ça peut paraître un peu barbare dit comme ça mais c’est super simple à utiliser. Si vous êtes flemmard, vous pouvez aller directement sur Huggingface ou pour les plus courageux, l’installer sur votre machine. Tout ce dont vous avez besoin, c’est d’un bon vieux Pytorch (version 2.0 minimum svp) et de quelques lignes de code pour démarrer l’entraînement.

PuLID (Pure and Lightning ID Customization via Contrastive Alignment) fonctionne en utilisant des techniques de machine learning pour aligner des représentations latentes en comparant des paires d’images ou d’identités. L’objectif est de maximiser la similarité pour des identités similaires et de minimiser la similarité pour des identités différentes. En ajustant ces représentations grâce à l’alignement contrastif, PuLID permet de créer des images uniques avec une grande précision et rapidité.

Si vous bossez dans la comm et que ous avez déjà quelques concepts arts sympas d’un personnage, mais vous aimeriez voir à quoi il ressemblerait dans différents environnements ou avec des styles graphiques variés, pas de souci ! Vous balancez vos images dans PuLID avec les bonnes instructions et le tour est joué. Vous obtiendrez alors tout un tas de variations stylées de votre personnage, tout en gardant son visage reconnaissable.

L’équipe de ByteDance a pensé à tout : PuLID est 100% open-source et disponible sur GitHub. Vous pouvez donc bidouiller le code comme bon vous semble pour l’adapter à vos besoins. Y’a même des tutoriels et des exemples pour vous aider à prendre en main le bouzin rapidement.

Et pour les plus impatients d’entre vous, voici un petit tuto d’installation pour commencer à jouer avec PuLID :

Pré-requis :

Étapes d’installation :

  1. Cloner le dépôt PuLID :
git clone https://github.com/ToTheBeginning/PuLID.git
cd PuLID

Créer et activer l’environnement conda :

conda create --name pulid python=3.10
conda activate pulid

Installer les dépendances :

pip install -r requirements.txt

Installer PyTorch : Suivez les instructions sur le site de PyTorch pour installer la version compatible avec votre système. Par exemple, pour CUDA 11.7 :

conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch

Lancer l’application :

python app.py

Pour en savoir plus sur PuLID et récupérer le code source, rendez-vous sur le repo GitHub.

Allez, je vous laisse vous amuser avec votre nouveau jouet. Un grand merci à Lorenper pour l’info. Grâce à toi, on va pouvoir personnaliser nos avatars comme jamais.

Source

Geppetto – ChatGPT et Dall-e dans votre Slack

Aujourd’hui, je vais vous parler d’un projet innovant qui vaut le détour. Il s’agit de Geppetto, qui n’a rien à voir avec l’autre naze de Pinocchio, mais qui est un bot avancé utilisant la technologie d’OpenAI pour amener une touche d’intelligence dans votre Slack.

Geppetto intègre ChatGPT-4 et DALL-E-3, ce qui permet d’avoir de la production d’écrits, mais également de la génération d’images. Une fois déployé, Geppetto s’intègre à votre espace de travail Slack et améliore la communication au sein de vos équipes en ajoutant des salutations automatisées, des réponses cohérentes et, bien sûr, ces fameuses visualisations créatives. Comme ça, plus besoin de perdre du temps à chercher les mots justes ou les images parfaites, Geppetto s’en charge pour vous.

En gros, si vous avez un truc urgent à dire à votre équipe sur Slack, mais vous ne trouvez pas les mots pour la formuler de manière claire et concise, plutôt que de perdre du temps à chercher comment exprimer maladroitement votre pensée, vous pouvez simplement demander à Geppetto de vous aider à formuler par exemple une question ou à y répondre. Tout ça dans la limite des connaissances du bot évidemment.

La génération d’image peut également vous aider à illustrer un concept complexe ou simplement pour ajouter un peu de fun à la conversation.

Alors, elle n’est pas belle la vie avec un bot comme Geppetto ? C’est vachement plus pratique qu’un pantin en bois trop con.

Si ce projet vous intrigue et que vous souhaitez en savoir plus, je vous invite à consulter le dépôt GitHub à l’adresse suivante : https://github.com/Deeptechia/geppetto.

Merci à Lorenper

Comment la revue Science veut s’assurer de l’intégrité des images dans ses publications

La manipulation d’images dans les articles de recherche est devenue un sujet de préoccupation croissante pour la communauté scientifique. Qu’elles soient accidentelles ou intentionnelles, ces modifications remettent en cause la crédibilité de la recherche et des revues scientifiques. Pour y remédier et restaurer la confiance du public, Science a déclaré dans son éditorial de janvier qu’il utiliserait Proofig, un outil basé sur l’IA qui analyse les images, pour détecter les altérations dans ses six revues.

Il existe différents types de manipulation d’images, allant des erreurs involontaires aux fraudes délibérées. Par exemple, certains auteurs peuvent dupliquer, recadrer, faire pivoter, redimensionner ou fusionner des images provenant de techniques expérimentales telles que la microscopie, la cytométrie en flux ou les Western blots (transferts de protéines), des altérations qui peuvent fausser les résultats ou induire les lecteurs en erreur. Elles sont les principales causes de rétractations d’articles, des opérations très coûteuses pour les revues scientifiques mais également pour leur réputation.

Des chercheurs comme Elisabeth Bik, qui a révélé l’existence d’une “fabrique” d’articles falsifiés en Chine, ce qu’elle explique par le fait qu’un doctorant chinois doit avoir publié au moins un article pour obtenir son diplôme, travaillent à détecter ces altérations avec l’aide d’outils d’intégrité d’images comme Imagetwin ou Proofig. Elle collabore d’ailleurs avec le site PubPeer où il est possible de partager les failles détectées dans les articles scientifiques.

H.Holden Thorp rappelle dans son éditorial que “des incidents très médiatisés, comme celui impliquant le laboratoire de l’ancien président de l’Université Stanford, Marc Tessier-Lavigne, ont érodé la confiance du public dans la science et nui à la carrière des chercheurs qui ont manqué des images trafiquées provenant de leurs propres laboratoires”.

En juillet dernier, Marc Tessier-Lavigne a en effet été contraint de démissionner de son poste de président de l’Université Stanford après qu’Elisabeth Bik ait révélé en 2022 qu’il était soit auteur principal, soit coauteur de quatre articles contenant des résultats manipulés.

Vérification de l’intégrité des images avec Proofig

Pour éviter les rétractations d’articles, Science, qui dit utiliser le logiciel de détection de plagiat iThenticate depuis sept ans, renforce son processus de vérification avec Proofig, qui se concentre sur l’analyse d’images plutôt que sur le texte. Auparavant, ce sont des examinateurs humains qui étaient chargés d’une partie des vérifications d’images, l’outil d’IA sera étendu cette année à tous les articles présentant des images “pertinentes“, après des mois de tests concluants.

Proofig sera appliqué après la révision des articles par les auteurs. L’outil analyse les images, identifie les duplications et repère d’autres anomalies, telles que la rotation, la distorsion d’échelle et l’épissage. Les résultats sont ensuite examinés par le rédacteur en chef, qui détermine si les anomalies détectées par l’IA sont problématiques ou non. Il peut parfois s’agir de simples erreurs, H. Thorp explique également que “dans certains cas, les figures peuvent avoir des rotations ou des duplications intentionnelles qui sont expliquées dans l’article”, mais un auteur peut choisir de fusionner ou dupliquer des images pour falsifier les résultats, ce qui est nettement plus grave.

Les auteurs sont contactés pour des explications et des corrections. Lors de la phase pilote, la plupart des problèmes ont été résolus de manière satisfaisante.

L’outil a permis de détecter des articles qui ne devraient pas être publiés. H. Thorp affirme que “À l’avenir, si la réponse des auteurs n’est pas satisfaisante ou soulève des préoccupations supplémentaires, nous approfondirons l’enquête et prendrons des mesures qui pourraient inclure le rejet de l’article”. Il ajoute que “Si des problèmes d’intégrité d’image sont soulevés à propos d’un article déjà publié par une revue scientifique, nous utiliserons Proofig pour examiner attentivement les images suspectes, ce qui éclairera les actions ultérieures (par exemple, la correction ou la rétractation)”.

Comment la revue Science veut s'assurer de l'intégrité des images dans ses publications
❌