BigQuery 中的数据治理简介

本文档介绍了 BigQuery 数据治理,并说明了如何使用 BigQuery 功能来实施和强制执行 BigQuery 数据治理政策。如需更全面地了解 Google Cloud 中的数据治理,请参阅什么是数据治理?

数据治理是指在数据的整个生命周期内管理数据的安全性和质量,以确保访问权限和准确性符合组织政策和法规。这些数据治理优先级可分为三个类别:

以下几个部分定义了这些数据治理类别,讨论了 BigQuery 功能如何支持它们,并为您建议后续步骤。

访问权限控制

数据访问管理是定义、强制执行和监控用于管理谁有权访问数据的规则和政策的过程。访问权限管理可确保只有获得授权的用户才能访问数据。BigQuery 提供以下功能来帮助您处理数据访问权限:

  • Identity and Access Management (IAM)借助 IAM,您可以控制哪些人有权访问您的 BigQuery 资源,例如项目、数据集、表和视图。您可以向用户、群组和服务账号授予 IAM 角色。这些角色定义了他们可以对您的资源执行的操作。
  • 列级访问权限控制行级访问权限控制。通过列级和行级访问权限控制,您可以根据用户属性或数据值来限制对表中特定列和行的访问。此控件让您可实施精细的访问,以帮助保护敏感数据免遭未经授权的访问。
  • 数据传输管理借助 VPC Service Controls,您可以围绕 Google Cloud 资源创建边界,并根据组织的政策控制对这些资源的访问。
  • 审核日志审核日志会详细记录组织中的用户活动和系统事件。这些日志可帮助您强制执行数据治理政策并识别潜在的安全风险。

针对访问权限控制的后续步骤

下表概述了您可以执行的后续步骤,以详细了解访问权限控制功能:

经验等级 学习路线
新的云用户
经验丰富的云用户

数据监管

数据监管在查询、传输或存储期间对数据进行适当分类、遮盖、隐去或加密,从而帮助您保护敏感数据。此方法可增强数据保护和组织方式。BigQuery 提供以下功能来帮助您进行数据监管:

  • 数据遮盖借助数据遮盖功能,您可以遮盖表中的敏感数据,同时仍允许授权用户访问周围的数据。它还可以遮盖与敏感数据模式匹配的数据,以防止意外泄露数据。
  • 加密BigQuery 自动加密所有静态数据传输中数据,同时允许您自定义加密设置,以满足您的特定需求和要求。
  • 元数据管理利用元数据管理,您可标记资源,而这反过来又可以帮助您进行数据搜索、组织和分类。

针对数据监管的后续步骤

下表概述了让您可详细了解数据监管功能的后续步骤:

经验等级 学习路线
新的云用户
  • 了解默认情况下,Google 如何对静态数据和传输中数据进行加密。
经验丰富的云用户

数据质量

数据质量管理是指跟踪数据沿袭并确保数据符合准确性、完整性和一致性标准的过程。BigQuery 提供以下功能来帮助您处理数据质量:

  • 数据沿袭借助数据沿袭,您可以跟踪数据在一段时间内的流动,深入了解数据的来源、随时间的变化情况以及在系统中的最终目标。
  • 数据分析扫描数据分析扫描让您可分析数据的统计特征,例如平均值和唯一值。
  • 数据质量扫描通过数据质量扫描,您可以执行数据检查,根据定义的规则验证数据,以及排查数据质量问题。

针对数据质量的后续步骤

下表概述了您可以执行的后续步骤,以详细了解访问数据质量功能:

经验等级 学习路线
新的云用户
  • 运行数据分析扫描,以深入了解您的数据,包括数据的限制或平均值。
经验丰富的云用户

后续步骤