Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierFlux principal

Comment l’IA peut nous aider à dresser le portrait de la population parisienne d’il y a 100 ans

Au Réveil Matin, Maison Bénazet, café restaurant du 113 avenue Jean-Jaurès (XIX<sup>e</sup>), vers 1935. Bibliothèque historique de la Ville de Paris

L’exposition « Les gens de Paris, 1926-1936. Dans le miroir des recensements de population », qui se tient actuellement, et jusqu’au 8 février 2026, au musée Carnavalet-Histoire de Paris, s’appuie sur les recensements de la population parisienne de 1926, de 1931 et de 1936, et contribue à renouveler le regard sur le peuple de la capitale dans l’entre-deux-guerres.


En France, des opérations de recensement sont organisées dès 1801, mais ce n’est qu’à partir de 1836 que des instructions spécifiques sont fournies pour procéder de manière uniforme dans toutes les communes du pays. Le recensement de la population est alors organisé tous les cinq ans, les années se terminant en 1 et en 6, jusqu’en 1946, à l’exception de celui de 1871 qui est reporté à l’année suivante en raison de la guerre franco-prussienne, et de ceux de 1916 et de 1941 qui ne sont pas organisés à cause des deux guerres mondiales.

Des données précieuses sur la population parisienne

Le premier but des recensements de la population est de connaître la taille des populations des communes pour l’application d’un certain nombre de lois. Ils permettent également de recueillir des informations sur l’ensemble des individus résidant dans le pays à un instant t pour en connaître la structure. Ces statistiques sont dressées à partir des bulletins individuels et/ou (selon les années) des feuilles de ménage (les feuilles de ménages récapitulent les individus vivant dans le même ménage et leurs liens au chef de ménage) remplies par les individus et publiées dans des publications spécifiques intitulées « résultats statistiques du recensement de la population ».

Liste nominative du recensement de la population de 1936, population de résidence habituelle, quartier Saint-Gervais (IVᵉ arrondissement). Archives de Paris : Cote D2M8 553

En plus de ces statistiques, les maires doivent également dresser une liste nominative de la population de leur commune. Mais Paris avait obtenu le droit de ne pas dresser ces listes. C’est le chef du bureau de la statistique parisienne, M. Lambert, qui décide de revenir sur cette exception dès 1926. Les listes nominatives de 1926, de 1931 et de 1936 sont donc les seules, avec celle de 1946, à exister pour la population parisienne.

Si Paris avait obtenu le droit de ne pas dresser ces listes, c’est en raison du coût d’une telle opération pour une population si vaste. La population parisienne compte, en effet, déjà près de 1,7 million d’habitants en 1861, un million de plus en 1901 et atteint son pic en 1921 avec 2,9 millions d’individus. Les données contenues dans ces listes sont particulièrement intéressantes, car elles permettent d’affiner considérablement les statistiques dressées pendant l’entre-deux-guerres.

Une base de données conçue grâce à l’IA

Ces listes, conservées aux Archives de Paris et numérisées puis mises en ligne depuis une dizaine d’années, ont déjà intéressé des chercheurs qui se sont appuyés dessus, par exemple, pour comprendre l’évolution d’une rue ou d’un quartier, mais elles n’avaient jamais été utilisées dans leur ensemble en raison du volume qui rend impossible leur dépouillement pour un chercheur isolé. Voulant également travailler à partir de ces listes – au départ, pour travailler sur la structure des ménages et notamment sur les divorcés –, j’avais moi aussi débuté le dépouillement à la main de certains quartiers.

Registre d’une liste nominative de recensement conservée aux Archives de Paris et présentée dans l’exposition « Les gens de Paris, 1926-1936. Dans le miroir des recensements de population ». Musée Carnavalet/Paris Musées/Pierre Antoine

La rencontre avec les informaticiens du Laboratoire d’informatique, de traitement de l’information et des systèmes (LITIS), Thierry Paquet, Thomas Constum, Pierrick Tranouez et Nicolas Kempf, spécialistes de l’intelligence artificielle, a changé la donne puisque nous avons entrepris de créer une base de données à partir de l’ensemble des listes nominatives de la population parisienne de 1926, de 1931 et de 1936 dans le cadre du projet POPP. Les 50 000 images, qui avaient déjà été numérisées par les Archives de Paris, ont été traitées par les outils d’apprentissage profond et de reconnaissance optique des caractères développés au LITIS pour créer une première base de données.

Les erreurs de cette première base « brute » étaient déjà très faibles, mais nous avons ensuite, avec l’équipe de sciences humaines et sociales – composée de Victor Gay (École d’économie de Toulouse, Université Toulouse Capitole), Marion Leturcq (Ined), Yoann Doignon (CNRS, Idées), Baptiste Coulmont (ENS Paris-Saclay), Mariia Buidze (CNRS, Progedo), Jean-Luc Pinol (ENS Lyon, Larhra) –, tout de même essayé de corriger au maximum les erreurs de lecture de la machine ou les décalages de colonnes. Ces corrections ont été effectuées de manière automatique, c’est-à-dire qu’elles ont été écrites dans un script informatique permettant leur reproductibilité. Ainsi, nous avons par exemple modifié les professions apparaissant comme « benne » en « bonne » ou bien les « fnène » en « frère ».

Adapter la base à l’analyse statistique

Il a ensuite fallu adapter la base à l’analyse statistique. Les listes nominatives n’avaient, en effet, pas pour vocation d’être utilisées pour des traitements statistiques puisque ces derniers avaient été établis directement à partir des bulletins individuels et des feuilles de ménage. Or, l’analyse statistique requiert que les mots signalant la même entité soient inscrits de la même façon. Cette difficulté est exacerbée dans le cas des listes nominatives : les agents avaient peu de place pour écrire, car les colonnes sont étroites. Ils utilisaient donc des abréviations, notamment pour les mots les plus longs comme les départements de naissance ou les professions.

Nous avons dû par conséquent uniformiser la manière d’écrire l’ensemble des professions, des départements ou des pays de naissance, des situations dans le ménage et des prénoms. Pour ce faire, nous nous sommes appuyés sur différents dictionnaires, c’est-à-dire des listes de mots correspondant à la variable traitée provenant de recherches antérieures ou d’autres bases de données. Ainsi, pour corriger les prénoms, Baptiste Coulmont, qui a travaillé sur cette partie de la base a utilisé les bases Insee des prénoms et des personnes décédées. Marion Leturcq et Victor Gay ont, par ailleurs, utilisé les listes des départements français, des colonies et des pays étrangers, tels qu’ils étaient appelés pendant l’entre-deux-guerres, ou encore la nomenclature des professions utilisées par la Statistique générale de la France (SGF).

Enfin, nous avons créé des variables qui manquaient pour l’analyse statistique que nous souhaitions mener, comme la variable « sexe » qui n’existe pas dans les listes nominatives (alors que le renseignement apparaît dans les fiches individuelles), ou encore délimiter les ménages afin d’en comprendre la composition. Ce travail de correction et d’adaptation de la base est encore en cours, car nous travaillons actuellement à l’ajout d’une nomenclature des professions – afin de permettre une analyse par groupes professionnels  –, ou encore à la création du système d’information géographique (SIG) de la base pour réaliser la géolocalisation de chaque immeuble dans la ville.

Retrouver des ancêtres

La base POPP ainsi créée a déjà été utilisée à différentes fins. Une partie de la base (comprenant les noms de famille – qui, eux, n’ont pas été corrigés –, les prénoms et les adresses) a été reversée aux Archives de Paris pour permettre la recherche nominative dans les images numérisées des listes nominatives. Ce nouvel outil mis en place au début du mois d’octobre 2025 – et également proposé en consultation au sein de l’exposition « Les gens de Paris, 1926-1936. Dans le miroir des recensements de population » – a déjà permis à de nombreuses personnes de retrouver leurs ancêtres.

Il nous a également été possible de fournir les premiers résultats tirés de la base POPP (confrontés aux résultats statistiques des recensements publiés) pour dresser des données de cadrage apparaissant sous forme d’infographies dans l’exposition (créées par Clara Dealberto et Jules Grandin). Ces résultats apparaissent également avec une perspective plus comparative dans une publication intitulée « Paris il y a 100 ans : une population plus nombreuse qu’aujourd’hui et déjà originaire d’ailleurs » (Ined, septembre 2025).

L’heure est maintenant à l’exploitation scientifique de la base POPP par l’équipe du projet dont le but est de dresser le portrait de la population parisienne à partir des données disponibles dans les listes nominatives des recensements de la population, en explorant les structures par sexe et âge, profession, état matrimonial, origine, ou encore la composition des ménages des différents quartiers de la ville.


L’autrice remercie les deux autres commissaires de l’exposition « Les gens de Paris, 1926-1936. Dans le miroir des recensements de population » Valérie Guillaume, directrice du musée Carnavalet – Histoire de Paris, et Hélène Ducaté, chargée de mission scientifique au musée Carnavalet – Histoire de Paris et les Archives de Paris.

The Conversation

Sandra Brée a reçu des financements du CollEx-Persée, de Progedo, de l'humathèque du Campus-Condorcet et du CNRS.

Prix Nobel de chimie 2024 : design des protéines et prédiction de leurs structures, deux facettes d’une même médaille

Portraits de David Baker, Demis Hassabis et John Jumper, qui partagent le prix Nobel de chimie 2024 pour leur travaux sur la conception de nouvelles protéines et la prédiction de la structure des protéines. Niklas Elmehed © Nobel Prize Outreach

Le prix Nobel de chimie 2024 récompense les travaux de David Baker, professeur à l’Université de Washinghton à Seattle, et ceux de Demis Hassabis et John Jumper, de DeepMind – une entité de Google connue du grand public pour le développement des logiciels d’intelligence artificielle AlphaGo (qui a battu le champion du monde de go en 2017) puis AlphaFold.

En travaillant sur les protéines grâce à des outils informatiques, ces trois chercheurs ont permis de mieux comprendre ces molécules indispensables à la vie.


Le prix Nobel de chimie 2024 est la reconnaissance de deux avancées spectaculaires en sciences des protéines – des molécules qui jouent un rôle crucial dans les processus cellulaires. Ainsi, comprendre comment les protéines interagissent est essentiel pour dévoiler les mécanismes qui gouvernent la vie, et permettre d’éclairer à l’avenir la susceptibilité aux maladies et leur gravité, tout en facilitant le déchiffrement des liens entre gènes, maladies et médicaments.

Les protéines sont des chaînes d’acides aminés qui se replient sur elles-mêmes. Ce qui est remarquable, c’est que la forme tridimensionnelle est codée dans la séquence des acides aminés. Cela signifie que nous devrions être capables de prédire cette structure tridimensionnelle à partir de la seule séquence des acides aminés. C’est là tout l’enjeu de la prédiction de la structure des protéines.

D’un autre côté, une fois la structure connue, on peut se demander si l’on peut trouver une séquence qui la produit : c’est ce qu’on appelle la conception ou design de protéines, c’est-à-dire la création de protéines totalement nouvelles et jamais vues dans la nature.

Ce prix Nobel met en lumière la puissance de la biologie computationnelle et les immenses possibilités qu’elle ouvre pour les sciences du vivant dans les années à venir.

La contribution de David Baker : concevoir des protéines jamais vues dans la nature

Le problème du design des protéines a été résolu par David Baker en 2003, avec la création de protéines jamais observées auparavant. Son logiciel, Rosetta, permet de concevoir une séquence qui correspond à une structure donnée.

Depuis, David Baker a ouvert un nouveau monde de structures protéiques inédites. Pour lui, l’objectif était de comprendre comment « maîtriser » les structures protéiques à travers la conception de protéines nouvelles et complexes, afin d’exploiter la nature à nos propres fins.

Exemples de nanoparticules faites de protéines nouvelles, conçues par David Baker et ses collègues. E.C. Yang et coll., Nature Structural & Molecular Biology, 31, 1404–1412 (2024)., CC BY

En combinant optimisation combinatoire, chimie et physique, Rosetta permet aujourd’hui aux scientifiques de concevoir des protéines aux formes et fonctions spectaculaires, jusque-là inconnues.

La contribution de Demis Hassabis et John Jumper : prédire la structure de protéines à partir de la séquence d’acides aminés

Demis Hassabis et John Jumper cherchaient, eux, à résoudre une question en suspens depuis des décennies : reconstruire une structure protéique à partir de sa séquence d’acides aminés. Ils ont réussi à décrypter le code des protéines, rendant possible la prédiction de la structure de presque toutes les protéines naturelles non désordonnées.

En 2020, ils ont présenté AlphaFold2, qui a atteint une précision d’environ 90 % par rapport aux structures cristallographiques connues, en accord avec les erreurs expérimentales lors de la détermination des structures.


À lire aussi : L’intelligence artificielle au défi du design de protéines : des prouesses et limites d’AlphaFold


Cette avancée spectaculaire a bouleversé le monde de la biologie : du jour au lendemain, la « bibliothèque de protéines » accessibles aux chercheurs est passée des 200 000 structures cristallographiques à 200 millions de modèles AlphaFold2, quasiment identiques aux structures des cristaux !

Désormais, un biologiste, virologue ou médecin peut soumettre une séquence d’acides aminés à AlphaFold2, et obtenir instantanément sa structure tridimensionnelle. Cette visualisation précise de la position des atomes permet d’analyser les points vulnérables d’une protéine lors de ses interactions, qui peuvent être exploités pour concevoir des médicaments bloquant ces interactions. Elle permet également d’identifier les résidus sensibles aux mutations futures, ainsi que ceux impliqués dans les interactions avec des partenaires moléculaires potentiels.

Ainsi, cela ouvre la voie à la découverte de nouvelles facettes, souvent inattendues, de la biologie d’un organisme, ainsi que des interactions entre différents organismes.

Un Nobel de chimie à la croisée de la biologie et de l’informatique

Ces deux avancées fondamentales pour la chimie et la biologie n’auraient pas été possibles sans la combinaison indispensable de plusieurs éléments : d’un côté l’abondance des séquences protéiques disponibles dans nos bases de données et le vaste nombre de structures cristallisées grâce au travail des biologistes expérimentateurs, et de l’autre grâce aux progrès de l’intelligence artificielle qui permet d’explorer d’immenses volumes de données et d’en déduire des informations complexes, de haute précision en se basant sur l’apprentissage profond et la technologie des GPU.

La moitié des protéines humaines sont désordonnées : elles se replient moins bien que les protéines structurées, mais restent très importantes pour les interactions au sein des cellules. Ici, le code couleur représente l’incertitude de prédiction de structure par AlphaFold2. Protéine ARX, base de données d’AlphaFold. Des mutations de cette protéine entraînent une déficience cognitive et de l’épilepsie, Fourni par l'auteur

Les prochaines étapes dans ce domaine complexe de la science des protéines consistent à décrypter leur fonction (c’est-à-dire comprendre ce qu’elles font lorsqu’elles interagissent), à explorer leur dynamique (c’est-à-dire la manière dont elles changent de forme pendant ces interactions), à étudier comment les protéines non structurées – pour lesquelles AlphaFold2 ne peut pas prédire de structure et qui représentent environ la moitié des protéines humaines – interagissent avec d’autres protéines ; et enfin, à concevoir des protéines dotées de nouvelles fonctions, en lien avec les avancées que la biologie synthétique nous apportera dans les années à venir.

Ces quatre grands défis sont au cœur des recherches actuelles, et leur résolution conduira à des percées majeures en biologie.

À l’avenir, les deux avancées reconnues par le prix Nobel de chimie 2024 s’articuleront avec ces nouvelles questions, permettant ainsi la reconstruction d’interactomes (des réseaux d’interaction entre des milliers de molécules – dont les protéines – dans une cellule ou un tissu biologique) à grande échelle, qu’ils soient entièrement nouveaux ou naturels, pour toute espèce, individu ou groupe d’organismes.

The Conversation

Alessandra Carbone ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

  • ✇LEBIGDATA.FR
  • On sait enfin pourquoi Apple Intelligence ne sera pas sur votre vieil iPhone
    Lors de la WWDC 2024, l'Apple Intelligence a reçu un accueil chaleureux et enthousiaste de la part du public. Toutefois, les utilisateurs d'iPhone sont assez mitigés. Il s'avère que l'iPhone 15 Pro et l'iPhone 15 Pro Max seront les seuls smartphones Apple capables de l'utiliser lors de son lancement. Voici pourquoi les iPhones les plus récents sont les seuls à pouvoir utiliser l'Apple Intelligence Lors d'un entretien avec John Giannandrea, Craig Federighi et Greg Joswiak les infor

On sait enfin pourquoi Apple Intelligence ne sera pas sur votre vieil iPhone

Par : Sandra
21 juin 2024 à 14:52

Lors de la WWDC 2024, l' Intelligence a reçu un accueil chaleureux et enthousiaste de la part du public. Toutefois, les utilisateurs d'iPhone sont assez mitigés.

Il s'avère que l'iPhone 15 Pro et l'iPhone 15 Pro Max seront les seuls smartphones Apple capables de l'utiliser lors de son lancement.

Voici pourquoi les iPhones les plus récents sont les seuls à pouvoir utiliser l'Apple Intelligence

Lors d'un entretien avec John Giannandrea, Craig Federighi et Greg Joswiak les informations reçues concernant l'usage d'Apple Intelligence sont assez floues. Selon M. Giannandrea, vice-président senior d'Apple chargé de l'apprentissage automatique et de la stratégie en matière d'IA, cette nouveauté pourra fonctionner sur les anciens iPhones. Sauf que l'IA ne sera pas assez rapide.

Puis, sans véritablement le nier, c'est également un moyen de promouvoir la vente des nouveaux iPhones qui sont sortis récemment. C'est M. Joswiak (vice-président directeur du marketing mondial d'Apple) qui le dit. Étant donné que tout iPad ou Mac est doté d'une puce de série M. La compatibilité avec l'Apple Intelligence est basée sur le matériel. Ce n'est pas simplement un stratagème pour encourager les mises à niveau.

Puis, Federighi (SVP of software engineering) a ajouté que l'iPhone 15 Pro et l'iPhone 15 Pro Max sont suffisamment puissants pour faire tourner Apple Intelligence. Autant les posséder.

Plus de RAM et un gros NPU

L'importance de la capacité de mémoire vive pour l'exécution de l'intelligence d'Apple a déjà été suggérée par l'analyste Ming-Chi Kuo. 8 Go de mémoire vive semble être le minimum. Mais les seuls modèles d'iPhone offrant autant de RAM sont l'iPhone 15 Pro et l'iPhone 15 Pro Max. Par conséquent, les anciens modèles sont forcément hors course.

Giannandrea a également indiqué que le moteur neuronal, le NPU interne d'Apple, était important. « L'A17 Pro (la puce à l'intérieur de l'iPhone 15 Pro) n'est pas la première puce A dotée d'un moteur neuronal. Mais elle est plus puissante que ces prédécesseurs. Elle est notamment capable d'effectuer 35 (tera/trillion d'opérations par seconde). Or, la puce A16 Bionic utilisée dans l'iPhone 15 de base et l'iPhone 14 Pro ne peut en faire que 17 TOPS.

Voici ce peuvent faire les propriétaires d'anciens iPhones

Si Apple Intelligence ne peut pas être installé sur les iPhones inférieurs au modèle 15 Pro, ils peuvent avoir accès à d'autres nouvelles fonctionnalités. Elles ont été annoncées dans le cadre d'iOS 18.

Elles fonctionnent sur les iPhones XS et les iPhones XR de 2018. Les propriétaires pourront mieux personnaliser leur écran d'accueil et de verrouillage. Ils auront des capacités de masquage et de verrouillage des apps. Puis, ils auront accès à une plus grande gamme de formatage de texte pour Messages et un nouveau design pour l'app Photos.

Par contre, pour mettre à jour votre iPhone et tirer le meilleur parti de l'Apple Intelligence, vous devrez peut-être opter pour l'iPhone 16 Pro ou l'iPhone 16 Pro Max. Cela garantira une compatibilité totale avec l'IA. Son lancement est déjà confirmé pour l'automne.

Cet article On sait enfin pourquoi Apple Intelligence ne sera pas sur votre vieil iPhone a été publié sur LEBIGDATA.FR.

  • ✇LEBIGDATA.FR
  • Booking donne l’alerte rouge : des milliers de faux hôtels créés par ChatGPT
    A l'aube des vacances d'été, la plateforme de réservation d'hôtels Booking met en garde contre l'apparition de faux hôtels créés par ChatGPT. Actuellement, de nombreux escrocs arnaquent les clients ainsi que les hôteliers. C'est une information que la cheffe de la sécurité internet de la plateforme néerlandaise de réservation d'hôtels Booking a noté. Mais voici ce qu'il en est réellement. Le secteur de l'hôtellerie et de la restauration, dans le viseur des arnaqueurs Chez Booking, M

Booking donne l’alerte rouge : des milliers de faux hôtels créés par ChatGPT

Par : Sandra
21 juin 2024 à 13:24

A l'aube des vacances d'été, la plateforme de réservation d'hôtels Booking met en garde contre l'apparition de faux hôtels créés par . Actuellement, de nombreux escrocs arnaquent les clients ainsi que les hôteliers.

C'est une information que la cheffe de la sécurité internet de la plateforme néerlandaise de réservation d'hôtels Booking a noté. Mais voici ce qu'il en est réellement.

Le secteur de l'hôtellerie et de la restauration, dans le viseur des arnaqueurs

Chez Booking, Marnie Wilking, responsable de la sécurité de l'information, a rapporté que l'IA générative a provoqué une explosion des escroqueries. La stratégie des hackers est simple. C'est via le « phishing » (« hameçonnage » en anglais) que les escrocs procèdent.

Cette procédure consiste en un vol d'identité ou d'informations confidentielles par subterfuge. Le malfaiteur envoie un mail ou un sms à la victime. Le pirate informe la cible qu'elle fait actuellement face à un problème. Puis, il mentionne qu'il peut être résolu en cliquant sur un lien spécifique ou en envoyant ses codes d'accès ou ses coordonnées bancaires au pirate.

C'est une technique souvent employée partout dans le monde. Et alors que les beaux jours se profilent à l'horizon, le secteur de l'hôtellerie et de la restauration, longtemps épargné, est maintenant visé par ces malfaiteurs.

ChatGPT, prise à partie pour promouvoir de faux hôtels sur Booking

En ce moment, ce sont les sites web de voyage qui sont une mine d'or pour les escrocs qui pratiquent le hameçonnage. Les voyageurs doivent toujours y communiquer les détails de leur carte de crédit ou télécharger une pièce d'identité. Et comme Booking est très populaire, il est normal que les arnaqueurs y créent de faux hôtels.  

Si le hameçonnage existait déjà à travers la messagerie électronique, cette pratique s'est intensifiée après le lancement de ChatGPT fin 2022. L'IA est capable de générer des contenus divers en émettant une simple requête en langage courant.

En effet, l'intelligence artificielle imite bien mieux les courriels officiels. C'est pourquoi, les escrocs profitent de cela à leur avantage. Ils peuvent travailler dans plusieurs langues et avec une meilleure construction grammaticale qu'avant, selon Marnie Wilking.

Les hôteliers sur Booking, également arnaqués

De même, sur Booking, les escrocs à l'origine des faux hôtels ne s'attaquent plus seulement aux personnes qui partent en voyage.

Pour rendre service à un soi-disant client, un hôtelier ouvrira sans doute une pièce jointe envoyée par celui-ci. Or, en réalité, il peut s'agir d'un logiciel malveillant. Comme dans le secteur, les professionnels prennent tous les mails en considération, il est difficile d'y échapper.

Pour plus de sécurité, il faudrait maintenant que les voyageurs et les professionnels de l'hôtellerie et de la restauration renforcent leur vigilance. Mais ils devraient également faire usage d'un procédé d'authentification à deux facteurs. Cela exige que les utilisateurs vérifient leur identité par le biais d'un facteur supplémentaire.

En plus de fournir un nom d'utilisateur et un mot de passe standard, il faudrait leur attribuer un code à usage unique envoyé à leur appareil mobile ou généré par une application d'authentification.Mais pour être véritablement sûre que vous avez à faire à un vrai client et à un vrai hôtel répertorié sur Booking, rien ne vaut le fait d'appeler les hôtels et le service clientèle en personne.

Cet article Booking donne l’alerte rouge : des milliers de faux hôtels créés par ChatGPT a été publié sur LEBIGDATA.FR.

❌
❌