Il y a quelques jours se déroulait la conférence « Sommet pour l’action sur l’intelligence artificielle » dont les participants ont (ré)affirmé leurs priorités en matière d’IA. Parmi ces priorités, on retrouve leur engagement pour une IA ouverte à tous, « inclusive, transparente,… Lire plus
Recherche par Smals
La gestion de la qualité de données (Data Quality), régulièrement abordée dans ce blog, consiste souvent à traiter (comparer, simplifier, transformer, “phonétiser”…) des chaînes de caractères : des noms de personnes, d’entreprises, de villes, de rues, numéros de téléphones, adresses email…Dans cet… Lire plus
L’ingestion de données est le processus de collecte et d’importation de données provenant de différentes sources vers un système de stockage centralisé (data warehouse, data lake, vector store, etc.) en vue de les exploiter pour des usages spécifiques. Les données peuvent provenir de sources… Lire plus
La cryptographie est la science qui applique des principes mathématiques en vue de sécuriser les données. Elle est indispensable dans notre société actuelle. Il suffit de penser aux communications sécurisées et à la signature électronique de toutes sortes de documents. Les algorithmes… Lire plus
Avec la popularité des applications d’IA dotées d’une interface conversationnelle, un “vieux casse-tête” refait surface : comment protéger les données personnelles communiquées, souvent sans méfiance, à un système automatisé de conversation ? Par extension, cette question se pose pour… Lire plus
Dans le monde en perpétuelle évolution du développement logiciel, le code hérité est un sujet souvent abordé, mais finalement très peu compris. Le code hérité peut être défini de différentes manières, mais pour cette discussion, nous considérons qu’il s’agit de tout code qui est encore utilisé par… Lire plus
Les titres physiques, tels que les permis de conduire, les diplômes universitaires, la carte européenne d’assurance maladie (CEAM), ou encore l’attestation européenne A1 permettant de travailler à l’étranger (PD A1), et plus généralement les documents « papier » importants,… Lire plus
Le nouveau service de pseudonymisation d’eHealth offre des garanties de sécurité élevées. Il est actuellement utilisé pour protéger la vie privée des citoyens, notamment lors du stockage et du traitement des ordonnances électroniques. Ce service se prête en outre particulièrement bien au croisement… Lire plus
On pense souvent que pour localiser un bâtiment (en Belgique, mais la situation de nos voisins est très similaire), nous avons besoin d’une adresse, composée d’un nom de rue (qui commence en français par “Rue …”, “Avenue …”, “Chaussée …”, ou qui termine en néerlandais par “…straat”, “… laan”, “…… Lire plus
Note : il s’agit d’un article de vulgarisation consacré à une réglementation future, basé sur la publication officielle du 12/07/2024. Adressez-vous toujours à un·e juriste pour obtenir un avis juridique professionnel.L’AI Act européen (en français le règlement sur l’intelligence artificielle… Lire plus
Dans le monde de l’IA, les bases de données vectorielles sont devenues un outil important. Elles nous permettent de stocker et de fouiller efficacement de grandes quantités de données non structurées, fonction essentielle pour de nombreuses applications.Embeddings vectorielsLes bases de… Lire plus
Advanced cryptography in practiceBon nombre de systèmes du secteur public traitent des données à caractère personnel. Aussi devons-nous éviter qu’un assaillant interne ou externe puisse indument relier ces données à des personnes physiques. Une mesure précieuse dans ce contexte consiste à ne plus… Lire plus
Dans un premier article, nous avons brièvement expliqué ce qui se cache derrière le terme « d’intelligence artificielle (IA) » en décrivant quelques techniques de base utilisées en cybersécurité. Dans un deuxième article, nous avons traité de l’utilisation de l’IA pour faciliter les… Lire plus
Le géocodage est l’opération qui permet de transformer une adresse postale textuelle (“av. Fonsny 20, 1060 Bruxelles”) en une version décomposée et standardisée, associée à une localisation géographique1 :{"street": "Avenue Fonsny", "number": 20, "zipcode": 1060, "city": "Saint-Gilles… Lire plus
Dans un précédent article de blog, nous avons décrit quelques techniques permettant d’améliorer la qualité des réponses dans un système génératif de questions-réponses.Pour rappel, RAG (Retrieval Augmented Generation) est l’architecture appropriée pour éviter les hallucinations en fournissant aux… Lire plus