Que signifient les données non structurées ?
Les données non structurées sont des informations numériques qui ne peuvent pas être stockées efficacement dans une base de données relationnelle (SGBDR) parce qu’elles n’utilisent pas de modèles de données ou de schémas prédéfinis.
Les données non structurées, qui peuvent être brutes, sont souvent stockées dans un lac de données. Les sources de données non structurées comprennent les capteurs et les actionneurs, les courriels et les messages textuels, les documents Word, les présentations PowerPoint, les dossiers médicaux électroniques (DME), les images numériques, les fichiers audio et les vidéos.
Dans les entreprises centrées sur le client, les données non structurées peuvent être analysées pour améliorer le marketing relationnel et la gestion de la relation client (CRM).
Techopedia explique les données non structurées
Les données non structurées sont des données qui suivent une forme moins ordonnée que des éléments tels que des pages de tableur, des tableaux de base de données ou d’autres ensembles de données linéaires ou ordonnées. En fait, le terme “ensemble de données” est utile parce qu’il est associé à des données qui se présentent sous forme de tableaux nets et accessibles, sans contenu supplémentaire, et qui sont liées ou étiquetées dans une structure spécifique.
Parmi les autres exemples de données textuelles non structurées, on peut citer les documents Word, les présentations PowerPoint, les messages instantanés, les logiciels de collaboration, les documents, les livres, les messages sur les médias sociaux et les dossiers médicaux. Les données non textuelles non structurées sont généralement créées dans des médias, tels que les fichiers audio MP3, les images JPEG et les fichiers vidéo Flash, etc.
Les données non structurées n’ont généralement pas de modèle de données prédéfini et peuvent ne pas correspondre aux tables relationnelles. Les données non structurées sont généralement constituées de texte. Cependant, elles peuvent contenir des chiffres et des dates, ainsi que des faits. Il en résulte des ambigu?tés difficiles à identifier à l’aide de logiciels conventionnels.
Le stockage d’énormes volumes de données non structurées générées au sein d’une entreprise, s’il est mal géré, peut entra?ner des dépenses plus élevées. Les données contenues dans les documents papier ou dans un format électronique doivent être scannées pour qu’une application de recherche puisse analyser les idées, en fonction des mots utilisés dans certains contextes. C’est ce qu’on appelle la recherche d’entreprise ou recherche sémantique.