Dans le secteur public, les administrations font face à un nombre considérable de documents à gérer. Ces documents doivent être indexés et organisés tel qu’il soit possible de retrouver facilement de l’information. Dans ce contexte le NER ou Named Entity Recognition, une technique basée sur le… Lees meer
Research door Smals
In een vorige blogpost bespraken we eerder theoretisch de mogelijkheden van API's voor computervertaling. De huidige blogpost is een neerslag van onze praktische ervaringen met dergelijke API's. Achtereenvolgens bespreken we enkele testen met taaldetectie, vertaling en een meertalige chatbot als… Lees meer
Ce blog introduit les modèles de langue statistiques qui sont nécessaires à la résolution de nombreux problèmes liés au traitement automatique du langage naturel ou NLP (Natural Language Processing). Parmi ces problèmes, on peut citer la traduction automatique, la reconnaissance vocale, les… Lees meer
E-discovery is een algemene term voor technieken en software waarmee men informatie wil ontdekken in grote hoeveelheden heterogene documenten. “Document” mag daarbij breed geïnterpreteerd worden als eender welk bestand met machineleesbare informatie (e-mails, spreadsheets, presentaties, foto’s… Lees meer
De nieuwe Databases als kruising van NOSQL en SQL... NewSQL (uitspraak: “new sequel”) is een recente, moderne klasse van DataBase Management Systemen (DBMS), of, kortweg, databases. Deze klasse positioneert zich tegenover de reeds bestaande klasses van Relationele DBMS (RDBMS) en de zogenaamde… Lees meer
In een steeds meer geconnecteerde wereld worden nieuwe diensten gecreëerd door functies die aangeboden worden door zeer diverse spelers met elkaar te verbinden. Deze nieuwe diensten kunnen zeer krachtig zijn omdat deze de complexiteit van een volledig proces kunnen verbergen voor de gebruiker van… Lees meer
De bescherming van persoonsgegevens is cruciaal voor overheidsinstellingen. Toch blijkt het vaak moeilijk om een evenwicht te vinden tussen veiligheid, kost, functionele vereisten en gebruiksgemak. Daar waar traditionele benaderingen geen bevredigende oplossingen bieden, kunnen geavanceerde… Lees meer
Dans notre article précédent, nous présentons une méthode permettant de mesurer et visualiser l'importance des valeurs rares dans une liste de données où l'on s'attend à une grande redondance, souvent signes d'un problème de qualité. La méthode en question se basait uniquement sur un comptage des… Lees meer
Eén van de facetten van artificiële intelligentie is het uitvoeren van vertalingen. Taal is inherent heel complex, het is bijgevolg geen evidentie voor een computersysteem om volautomatisch tekst te vertalen. Zo kan een woord meer dan één betekenis hebben en moet de gepaste vertaling gekozen worden… Lees meer
Geregeld is onderzoek nodig naar verdachte personen. Dit neemt niet weg dat de privacy van deze en andere personen gerespecteerd moet worden. Ook de confidentilaiteit van het onderzoek moet gegarandeerd blijven. Dit artikel reikt een waardevolle technologie aan om aan deze vereisten tegemoet te… Lees meer
Spraakassistenten worden meer en meer naar voor geschoven als nieuwe vorm van interactie met computersystemen. Siri, Alexa en Google Assistant strijden om de plaats van geprefereerde virtuele assistent. Ze duiken op in allerlei toestellen: in smartphones, smart speakers, tot zelfs in de auto. Naast… Lees meer
Er worden steeds meer persoonsgegevens verwerkt, die dan ook op een afdoende manier beschermd moeten worden. Vaak volstaan de genomen veiligheidsmaatregelen niet en lezen we in de pers over opnieuw een data breach of over het niet respecteren van de privacy. Cryptografische pseudonimisatie is een… Lees meer
Hergebruik: het gebruiken van een bestaand stuk software voor een nieuwe toepassing. Het lijkt een eenvoudig principe, maar er komt meer bij kijken dan je zou denken. Vooral wanneer je effectief een software artefact probeert te hergebruiken, creëer je al snel problemen. In deze blog gaan we wat… Lees meer
Joachim Ganseman, IT-consultant bij Smals Research, werd gevraagd als lid van het expertenpanel bij de opstelling van een analyse van de dienst Veille, analyse et prospective du marché de l’emploi van FOREM, de Waalse dienst voor arbeidsbemiddeling. Het resulterende rapport analyseert de… Lees meer
Veel aspecten van Natural Language Processing (NLP) steunen op een of andere vorm van classificatie. Als we een tekst automatisch willen analyseren of begrijpen, zal het immers snel nodig zijn om labels aan (groepen van) woorden of zinnen toe te kennen. Op basis van zulke labels kan de analyse… Lees meer