Le grand défi de la gouvernance des données

La gouvernance des données est important pour votre entreprise, peu importe ce que vos sources de données sont grands ou comment ils sont gérés. Dans le monde traditionnel des entrepôts de données ou de gestion de base de données relationnelle, il est probable que votre entreprise a des règles sur la façon dont les données doivent être protégées et bien compris.

Par exemple, dans le monde de la santé, il est essentiel de conserver les données patient privé. Vous pouvez être en mesure de stocker et analyser les données sur les patients, tant que noms, numéros de sécurité sociale, et d'autres données personnelles sont masquées. Vous devez vous assurer que les personnes non autorisées ne peuvent pas accéder aux données privées ou restreintes.

Qu'est-ce qui se passe quand vous inondez votre environnement avec des sources de données de grandes qui proviennent d'une variété de sources? Certaines de ces sources viendra de fournisseurs commerciaux de tiers qui ont soigneusement sélectionnées et les données masquées données sensibles.

Cependant, il est fort probable que les sources de données de grandes peuvent être précaire et non protégé, et inclure un grand nombre de données personnelles. Pendant le traitement initial de ces données, vous aurez probablement analyser beaucoup de données qui ne se révèlent être pertinents pour votre organisation. Par conséquent, vous ne voulez pas investir des ressources pour protéger et régir les données que vous ne comptez pas conserver.

Si des données personnelles sensibles passe sur votre réseau, vous pouvez exposer votre entreprise à des exigences de conformité imprévus. Pour les données qui est véritablement exploratoire, avec des contenus inconnus, il pourrait être plus sûr d'effectuer l'analyse initiale dans un “ fortifiée ” environnement qui est interne, mais segmenté, ou dans le nuage.

Enfin, après vous décidez qu'un sous-ensemble de ces données va être analysé plus profondément afin que les résultats peuvent être incorporés dans votre processus d'affaires, il est important d'instituer un processus d'application attentivement les exigences de gouvernance pour que les données.

Quelles questions devriez-vous envisager lorsque vous incorporez ces sources non vérifiés de travaux dans votre environnement? Considérez ce qui suit:

  • Déterminer à l'avance qui est autorisé à accéder à de nouvelles sources de données initialement comme après les données ont été analysées et comprises.

  • Comprendre comment ces données seront séparés des données d'autres entreprises.

  • Comprendre ce que votre responsabilité est de tirer parti des données. Si les données est une propriété privée, vous devez vous assurer que vous respectez les contrats ou les règles d'utilisation. Certaines données peuvent être liés à un contrat d'utilisation avec un fournisseur.

  • Comprendre où vos données seront trouvent physiquement. Vous pouvez inclure des données qui sont liés à des clients ou prospects dans des pays spécifiques qui ont des exigences de confidentialité strictes. Vous devez être au courant des détails de ces sources pour éviter de violer les règlements.

  • Comprendre comment vos données doit être traitée si elle est physiquement déplacé d'un endroit à l'autre. Allez-vous stocker certaines de ces données avec un fournisseur de nuage? Quel type de promesses seront cette offre du fournisseur en termes de où les données seront stockées, et comment il sera garanti?

Juste parce que vous avez créé une sécurité et processus de gouvernance pour vos sources de données traditionnelles ne signifie pas que vous pouvez supposer que les employés et les partenaires d'élargir ces règles à de nouvelles sources de données. Vous devez tenir compte de deux questions clés: la visibilité des données et de la confiance de ceux qui travaillent avec les données.


  • Visibilité: Alors que les analystes et les partenaires avec lesquels vous travaillez affaires peuvent être désireux d'utiliser ces nouvelles sources de données, vous ne pouvez pas être au courant de la façon dont ces données seront utilisées et contrôlée. En d'autres termes, vous ne pouvez pas avoir le contrôle sur votre visibilité dans vos ressources qui sont en cours d'exécution hors de votre contrôle.

    Cette situation est particulièrement gênant si vous devez vous assurer que votre fournisseur suit les règlements ou lois conformité. Cela est également vrai lorsque vous utilisez un fournisseur de cloud pour gérer ces données parce que le stockage peut être très peu coûteux à gérer.

  • Employés non vérifiés de travaux: Bien que votre entreprise peut passer par une vérification approfondie des antécédents sur l'ensemble de ses employés, vous êtes maintenant en espérant que pas initiés malveillants travaillent dans diverses unités d'affaires en dehors d'elle. Vous avez également de supposer que votre fournisseur de nuage a diligemment vérifié ses employés.

    Cette préoccupation est réelle, car près de 50 pour cent des failles de sécurité sont causés par des initiés. Si votre entreprise va utiliser ces nouvelles sources de données d'une manière hautement distribué, vous devez avoir un plan pour faire face à l'intérieur ainsi que les menaces extérieures.

Vous avez la responsabilité de vous assurer que vos nouvelles sources de données de grandes ne pas ouvrir votre entreprise à des menaces imprévues ou risques de gouvernance. Il est de votre responsabilité d'avoir une bonne sécurité, les processus de gouvernance, et de l'éducation en place dans votre environnement de gestion de l'information entière.

Comme avec tout le cycle de vie de la technologie, vous devez disposer d'un processus pour évaluer la capacité de votre organisation à répondre à la volonté de tous les constituants de suivre les exigences de sécurité et de gouvernance. Vous pouvez déjà avoir des processus de sécurité des données, la vie privée, et de la gouvernance en place pour vos bases de données structurées existantes et des entrepôts de données. Ces processus doivent être étendus pour votre grand mise en œuvre de données.


» » » » Le grand défi de la gouvernance des données