Data Boost の概要

Spanner Data Boost は、サポートされている Spanner ワークロード用の独立したコンピューティング リソースを提供する、フルマネージドのサーバーレス サービスです。Data Boost を使用すると、プロビジョニングされた Spanner インスタンス上の既存のワークロードへの影響がほぼゼロの状態で、分析クエリとデータ エクスポートを実行できます。このサービスは、Google がリージョン レベルで管理する Spanner クラスタで構成されています。Data Boost をリクエストする有効なクエリの場合、Spanner はワークロードをこれらのサーバーに透過的にルーティングします。対象となるクエリは、クエリ実行プランの最初の演算子が分散ユニオンであるクエリです。これらのクエリは、Data Boost を利用するために変更する必要はありません。

Data Boost は、リソース競合による既存のトランザクション システムに悪影響が及ばないようにする次のシナリオで、最も効果的です。

  • 大量のデータを処理するアドホック クエリや頻度の低いクエリ。典型的な例は、BigQuery から Spanner への連携クエリです。
  • レポートまたはデータ エクスポート ジョブ。たとえば、Spanner データを Cloud Storage にエクスポートする Dataflow ジョブがあります。

次の図は、Data Boost が Spanner インスタンスと連携して独立したコンピューティング リソースを提供する方法を示しています。

Spanner アーキテクチャ内の Data Boost

利点

Data Boost には次の利点があります。

  • ワークロードの分離を提供します。クエリの複雑さや処理されるデータの量に関係なく、最新のデータに対してサポートされているクエリを実行しても、既存のトランザクション ワークロードへの影響はほぼゼロです。
  • レイテンシが同等以上である。
  • 時折発生する分析クエリをサポートするためだけに Spanner インスタンスを過剰にプロビジョニングすることを回避します。
  • バースト ロードに応じて弾力的にスケーリングされる、より多くのクエリ並列処理により、高度なスケーラビリティが実現します。
  • 包括的な指標を提供します。これにより、管理者は最も費用のかかるクエリを特定し、最適化する費用コンポーネントを決定できます。管理者は、クエリの次回の実行時のサーバーレス プロセッシング ユニットの消費量を監視することで、最適化の影響を検証できます。
  • 追加の運用上のオーバーヘッドは必要ありません。管理する追加のサービスはありません。容量のプランニングやプロビジョニング、スケーリングの待機、メンテナンスも不要です。

権限

Data Boost をリクエストするクエリまたはエクスポートを実行するプリンシパルには、spanner.databases.useDataBoost Identity and Access Management(IAM)権限が必要です。Cloud Spanner Database Readerroles/spanner.databaseReader)に基づいてカスタム IAM ロールを作成し、spanner.databases.useDataBoost を追加することをおすすめします。

課金と割り当て

Data Boost で実行されるクエリで使用された実際の処理ユニットに対してのみ料金が発生します。管理者は、費用超過を回避するために使用量の上限を設定できます。

次のステップ