读《华为数据之道》
本书对华为公司多年数据治理和数据消费变革历程进行了系统性的总结,从治理体系、架构方法、流程规范、IT工具、数据组织等多方面总结了企业在数据治理中面临的挑战和解决方案,并介绍了华为独有的创新成果,如:数据底座、数据湖、主题联接、数据地图、数据生态等。
非数字原生企业数字化转型的挑战:
业态特征:产业链条长、多业态并存
运营环境:数据交互和共享风险高
IT 建设过程:数据复杂、历史包袱重
数据质量:数据可信和一致性的要求程度高
华为数据之道
数据工作建设整体架构
企业级数据综合治理体系
数据作为一种新的生产要素,在企业构筑竞争优势过程中起着重要作用,企业应将数据作为一种战略资产进行管理。
数据分类和特性差异
信息架构
华为的企业 4A 架构, IA(信息架构)、BA(业务架构)、AA(应用架构)、TA(技术架构),以下是信息架构:
其中数据资产目录实例化:
数据底座
华为通过建设数据底座,将公司内外部的数据汇聚在一起,对数据进行重新组织和联接,让数据有清晰的定义和统一的结构,并在尊重数据安全与隐私的前提下,让数据更易获取,最终打破数据孤岛和垄断。通过数据底座,可以实现如下目标:
- 统一管理结构化、非结构化数据。
- 打通数据供应通道,为数据消费提供丰富的数据原材料、半成品及成品,满足公司自助分析、数字化运营等不同场景的数据消费需求。
- 确保公司数据完整、一致、共享。
- 保障数据安全可控。
数据入湖的几种方式对比:
数据服务与传统集成方式对比
数据服务是基于数据分发、发布的框架,将数据作为一种服务产品来提供,以满足客户的实时数据需求,它能复用并符合企业和工业标准,兼顾数据共享和安全。
数据服务和传统的集成方式有很大的区别,数据的使用方(IT 人员或者业务人员)不再需要点对点地寻找数据来源,再点对点进行数据集成,从而形成错综复杂的集成关系,而是通过公共数据服务按需获取各类数据。
数据感知媒介推荐
数据安全隐私数据分层分级
内部信息密级维度分为五类:
外部公开: 可以在公司外部公开发布的信息,不属于保密信息。
内部公开: 可以在全公司范围内公开,但不应向公司外部扩散的信息。
秘密: 是公司较为重要或敏感的信息,其泄露会使公司利益遭受损害,其影响范围较大。
机密: 是公司非常重要或敏感的信息,其泄露会使公司利益遭受较大损害,且影响范围广泛。
绝密: 是公司组重要或敏感的信息,其泄露会使公司利益遭受巨大损害,且影响范围巨大。
基于对 GDPR 的解读和企业内部的管理需求,分为 5 类管理:
个人数据: 与一个身份已被识别或者身份可被识别的自然人(数据主体)相关的任何信息。
敏感个人数据: 指在个人基本权利和自由方面极其敏感,一旦泄露可能会造成人身伤害、财务损失、名誉损害、身份盗窃或欺诈、歧视性待遇等的个人数据。通常情况下,敏感个人数据包括但不限于可以揭示种族或血统、政治观点、宗教或哲学信仰、工会成员资格的数据,用于唯一识别自然人的基因数据、生物数据(如指纹),与自然人的健康、性取向相关的数据。
商业联系个人数据:指自然人基于商业联系目的提供的可识别到个人的数据。
一般个人数据:除敏感个人数据、商业联系人以外的个人数据,作为一般个人数据。
特种个人数据:GDPR 法律中明文确定的特殊种类个人数据,严禁物理入湖,严禁共享及分析。