Pour toute entreprise souhaitant garantir la validité, l’exhaustivité et la précision des données durant tout leur cycle de vie, l’intégrité des données est essentielle. Grâce à cette démarche, on peut s’apercevoir des altérations fortuites ou intentionnelles que la donnée a pu subir. Afin de prendre des décisions stratégiques fondées sur l’analyse de données, vous devez disposer d’un moyen efficace vous permettant de savoir qui supprime ou trafique les données de votre entreprise. C’est pour cette raison que l’intégrité des données est essentielle.

Ce qu'il faut retenir :

🔒 Intégrité des données Garantit la validité et la fiabilité des données.
💽 Types de données Les fichiers et les données des bases de données sont concernés.
🛡️ Intégrité physique Protège l'exactitude des données pendant le stockage.
🧠 Intégrité logique Assure la conservation et la protection des données.
📜 Conformité RGPD Essentiel pour respecter les réglementations de protection des données.
🔍 Validation de l'entrée Exiger une validation pour garantir l'exactitude des données.
🔍 Validation des données Assurer que les processus de données ne sont pas corrompus.
🗑️ Suppression des doublons Nettoyer les données errantes et supprimer les doublons.
💾 Sauvegarde régulière Sauvegarder les données selon un calendrier prédéfini.

L’intégrité des données, de quoi il s’agit

Par intégrité des données, on entend la fiabilité et la crédibilité des données tout au long de leur cycle de vie. Il s’agit d’une représentative de l’état de vos données, et par ailleurs du processus visant à de garantir et de préserver la validité ainsi que l’exactitude des données. Les documents officiels sont nombreux à faire référence au principe d’intégrité des données. Parmi les définitions proposées, on distingue quelques-unes :

  • le Référentiel Général de Gestion des Archives affirme que l’intégrité est comme étant la « qualité d’un document ou d’une donnée qui n’a pas été altéré. Dans le monde numérique, un document ou une donnée est réputé intègre si son empreinte à un temps t+1 est identique à l’empreinte prise à un temps t. » ;
  • la norme ISO/CEI 27000 :2016 indique « l’intégrité est la propriété d’exactitude et de complétude » ;
  • d’après l’Instruction Générale Interministérielle n° 1300. Cest la « propriété assurant qu’une information ou un traitement n’a pas été modifié ou détruit de façon non autorisée ».

Ainsi, garantir l’intégrité des données, c’est s’assurer que les informations stockées ou transmises resteront cohérentes, fiables, vérifiables et exactes quels que soient leur usage et leur durée de conservation. Elle compte parmi les dimensions de la Gouvernance des Données.

Quelles sont les données concernées par l’intégrité des données

Tous les types de données numériques sont concernés par l’intégrité. On peut généralement distinguer deux grandes catégories :

  • les fichiers, notamment les vidéos, les documents bureautiques et les images, entre autres. Cela concerne également les fichiers qui se rapportent à l’exploitation du SI tel que les fichiers de configurations, les journaux d’événements et les programmes informatiques ;
  • les données dans les bases de données, aussi bien technique que métier.

Gros plan sur les différents types d’intégrité des données

On distingue deux types d’intégrité des données, dont l’intégrité logique et l’intégrité physique. Ils sont tous les deux composés d’un ensemble de processus et de méthodes qui garantissent l’intégrité des données dans les bases de données relationnelles et hiérarchiques.

Qu’est-ce que l’intégrité physique

L’intégrité physique se rapporte à la protection de l’unité et de l’exactitude des données durant leur récupération et leur stockage. En cas de coupure de courant, de piratage des fonctions de la base de données ou de catastrophes naturelle, l’intégrité physique est compromise. La détérioration du stockage, les erreurs humaines et de nombreux autres problèmes peuvent aussi empêcher les programmeurs système, les responsables du traitement des données, les vérificateurs et les programmeurs application d’obtenir des données précises. Voici quelques détails qui vous permettront d’en savoir plus.

Qu’est-ce que l’intégrité logique

L’intégrité logique assure la conservation des données inchangées durant leurs différentes utilisations dans une base de données relationnelle. Par ailleurs, elle protège les données contre les pirates informatiques et les erreurs humaines, mais pas comme le fait l’intégrité physique. On compte 4 types d’intégrité logique :

  • l’intégrité de l’entité qui s’appuie sur des valeurs uniques identifiant des données ou sur la création de clés primaires. Cela dans s’assurer que les données sont répertoriées une seule fois et que toutes les zones de table sont remplies ;
  • l’intégrité de domaine désigne un ensemble de processus garantissant l’exactitude de chaque donnée dans un domaine. Elle peut inclure des contraintes ainsi que d’autres mesures limitant le type, le format et le nombre de données saisies ;
  • l’intégrité référentielle se rapporte à la série de processus indispensable afin de garantir une utilisation et un stockage homogènes des données. La structure de la base de données concernant l’utilisation des clés étrangères prévoit des règles qui garantissent que seuls les ajouts, les changements ou les suppressions de données appropriées sont entrepris. Elles incluent des contraintes qui garantissent l’exactitude des données, refusent l’entrée de données inadaptées ou éliminent l’entrée de doublons ;
  • l’intégrité définie par l’utilisateur fait référence aux règles et aux contraintes que l’utilisateur a créées pour satisfaire ses besoins particuliers. Dans certains cas, l’intégrité référentielle, l’intégrité de l’entité et l’intégrité de domaine ne suffisent pas à assurer la protection des données. Dans ce cas, il convient d’incorporer, aux mesures d’intégrité des données, des règles d’entreprise spécifiques.

Garantir la conformité avec le RGPD grâce à l’intégrité des données

Pour une entreprise, il est essentiel de garantir la conformité avec les règlements de protection des données tels sur le RGPD. Les entreprises qui ne respectent pas ces règlements peuvent être exposées à de lourdes amendes. Selon la situation, ces amendes peuvent être accompagnées d’actions en justice. Une entreprise qui commet des infractions de conformité répétées peut même entrer en faillite. De ce fait, il est essentiel de garantir l’intégrité des données.

Conseils pratiques pour conserver l’intégrité des données des systèmes informatisés

Il existe plusieurs manières qui vous permettent de préserver efficacement l’intégrité des données, et ainsi réduire les risques auxquels votre entreprise est exposée :

Réaliser une validation de l’entrée

Vous devez exiger que l’entrée soit validée, et cela, même si votre ensemble de données, soit fourni ou non par une source connue (autre application, utilisateur malintentionné, utilisateur final ou toute autre source). Pour avoir l’assurance que l’entrée est exacte, ces données doivent être vérifiées et validées.

Garantir la validation des données

Il est important de certifier que vos processus de données n’ont pas été corrompus. Avant de vous lancer dans la validation des données, pensez à identifier les caractéristiques techniques et attributs clés essentiels. Ainsi, vous pourriez bénéficier d’une meilleure organisation.

Procéder à la suppression des données en double

Des données sensibles provenant d’une base de données sécurisée atterrissent sûrement dans une feuille de calcul, un document, des dossiers partagés ou un e-mail. Alors, des employés qui ne possèdent pas l’accès requis peuvent y avoir accès. Dans ce cas, il est plus prudent de nettoyer les données errantes et de supprimer les doublons. Les petites entreprises qui ne possèdent pas de personnel dédié peuvent utiliser ces quelques outils pour supprimer les fichiers en doubles stockés dans le cloud ou sur un disque dur :

  • duplicate Images Finder ;
  • clone Files Checker ;
  • Doublekiller ;
  • easy duplicate Finder ;
  • winMerge.

Si vous utilisez des serveurs sous Windows, vous pouvez supprimer les fichiers clonés en vous servant de la fonctionnalité de Déduplication des données. Vous pouvez également supprimer les fichiers errants grâce au Gestionnaire de ressources du serveur de fichiers.

Faire une sauvegarde régulière

Pour garantir d’intégrité des données, pensez à sauvegarder et à enregistrer les données ainsi que les métadonnées selon un calendrier prédéfini. En outre, pensez à vérifier la récupération de toutes les données lors des audits internes.