Pengantar Analytics Hub

Analytics Hub adalah platform pertukaran data yang memungkinkan Anda berbagi data dan insight dalam skala besar di seluruh batas organisasi dengan framework keamanan dan privasi yang kuat. Dengan Analytics Hub, Anda dapat menemukan dan mengakses library data yang dipilih oleh berbagai penyedia data. Library data ini juga menyertakan set data yang disediakan Google.

Misalnya, dengan menggunakan Analytics Hub, Anda dapat meningkatkan inisiatif analisis dan ML Anda dengan set data pihak ketiga dan Google.

Sebagai pengguna Analytics Hub, Anda dapat melakukan tugas berikut:

  • Sebagai Analytics Hub Publisher, Anda dapat memonetisasi data dengan membagikannya kepada jaringan partner Anda atau dalam organisasi Anda sendiri secara real time. Listingan memungkinkan Anda berbagi data tanpa mereplikasi data yang dibagikan tersebut. Anda dapat membuat katalog sumber data yang siap dianalisis dengan izin terperinci yang memungkinkan Anda mengirimkan data kepada audiens yang tepat. Anda juga dapat mengelola langganan dan melihat metrik penggunaan untuk listingan.

  • Sebagai Analytics Hub Subscriber, Anda dapat menemukan data yang dicari, menggabungkan data bersama dengan data yang ada, dan memanfaatkan fitur bawaan BigQuery. Saat berlangganan listingan, set data tertaut akan dibuat di project Anda. Anda dapat mengelola langganan menggunakan Resource langganan, yang menyimpan informasi relevan tentang subscriber dan merepresentasikan hubungan antara publisher dan subscriber.

  • Sebagai Analytics Hub Viewer, Anda dapat menjelajahi set data yang dapat diakses di Analytics Hub dan meminta publisher untuk memberikan akses ke data bersama.

  • Sebagai Analytics Hub Administrator, Anda dapat membuat pertukaran data yang memungkinkan berbagi data, lalu memberikan izin kepada publisher dan subscriber data untuk mengakses pertukaran data ini.

Untuk mendapatkan informasi selengkapnya tentang peran pengguna Analytics Hub, lihat Mengonfigurasi peran Analytics Hub.

Arsitektur

Analytics Hub dibangun berdasarkan model publikasi dan langganan set data BigQuery. Pemisahan komputasi dan penyimpanan dalam arsitektur BigQuery memungkinkan publisher data berbagi data dengan subscriber sebanyak yang mereka inginkan tanpa harus membuat banyak salinan data. Publisher hanya dikenai biaya untuk penyimpanan data, sedangkan subscriber hanya membayar kueri yang dijalankan pada data yang dibagikan. Alur kerja publisher dan subscriber di Analytics Hub dijelaskan secara mendetail di bagian berikut.

Alur kerja publisher

Diagram berikut menjelaskan cara publisher berinteraksi dengan Analytics Hub:

Interaksi antara Analytics Hub Publisher dan Analytics Hub.
Gambar 1. Alur kerja Analytics Hub Publisher.

Dalam gambar 1, fitur berikut diberi label: Set data bersama, Pertukaran data, dan Listingan.

Set data bersama
Set data bersama adalah set data BigQuery yang merupakan unit berbagi data di Analytics Hub. Sebagai publisher, Anda dapat membuat atau menggunakan set data BigQuery yang sudah ada di project dengan objek yang didukung berikut yang ingin dikirimkan kepada subscriber Anda: Set data bersama mendukung keamanan tingkat kolom dan keamanan tingkat baris.
Pertukaran data
Pertukaran data adalah container yang memungkinkan layanan berbagi data secara mandiri. Pertukaran data berisi listingan yang merujuk pada set data bersama. Dengan Analytics Hub, publisher dan administrator dapat memberikan akses kepada subscriber di tingkat pertukaran dan listingan. Metode ini membantu menghindari pemberian akses pada set data bersama yang mendasarinya secara eksplisit. Analytics Hub Subscriber dapat menjelajahi pertukaran data, menemukan data yang dapat mereka akses, dan berlangganan set data bersama. Pertukaran data dapat berupa salah satu jenis berikut:
  • Pertukaran data pribadi. Secara default, pertukaran data bersifat pribadi dan hanya pengguna atau grup yang memiliki akses ke pertukaran tersebut yang dapat melihat atau berlangganan data.
  • Pertukaran data publik. Secara default, pertukaran data bersifat pribadi dan hanya pengguna atau grup yang memiliki akses ke pertukaran tersebut yang dapat melihat atau berlangganan listingannya. Namun, Anda dapat memilih untuk membuat pertukaran data menjadi publik. Listingan di pertukaran data publik dapat ditemukan dan dilanggan oleh pengguna Google Cloud (allAuthenticatedUsers). Untuk mengetahui informasi selengkapnya tentang pertukaran data publik, lihat Membuat pertukaran data menjadi publik.

Sebagai Analytics Hub Administrator, Anda dapat membuat beberapa pertukaran data di Analytics Hub, dan mengelola pengguna Analytics Hub lainnya.

Listingan
Listingan adalah referensi ke set data bersama yang dicantumkan publisher di pertukaran data. Sebagai publisher, Anda dapat membuat listingan dan menentukan deskripsi set data, sampel kueri yang akan dijalankan di set data, link ke dokumentasi yang relevan, dan informasi tambahan apa pun yang dapat membantu subscriber menggunakan set data Anda. Untuk mengetahui informasi selengkapnya, lihat Mengelola listingan. Listingan dapat berupa dua jenis berikut berdasarkan kebijakan Identity and Access Management (IAM) yang ditetapkan untuk listingan dan jenis pertukaran data yang berisi listingan:
  • Listingan publik. Listingan ini dibagikan kepada semua pengguna Google Cloud (allAuthenticatedUsers). Listingan di pertukaran data publik adalah listingan publik. Listingan ini dapat menjadi referensi set data publik gratis atau set data komersial. Jika listingan berasal dari set data komersial, subscriber dapat meminta akses ke listingan dan penyedia data akan menghubungi subscriber tersebut secara langsung.
  • Listingan pribadi. File ini dibagikan langsung kepada individu atau kelompok. Misalnya, listingan pribadi dapat merujuk pada set data metrik pemasaran yang Anda bagikan kepada tim internal lain dalam organisasi Anda.

Alur kerja subscriber

Diagram berikut menjelaskan cara subscriber berinteraksi dengan Analytics Hub:

Interaksi antara Analytics Hub Subscriber dan Analytics Hub.
Gambar 2. Alur kerja Analytics Hub Subscriber.

Pada Gambar 2, fitur Analytics Hub berikut diberi label: Set data bersama, Pertukaran data, Listingan, dan Set data tertaut.

Set data tertaut
Set data tertaut adalah set data BigQuery hanya baca yang berfungsi sebagai link simbolis ke set data bersama. Berlangganan listingan akan membuat set data tertaut dalam project Anda, bukan salinan set data, sehingga subscriber dapat membaca data, tetapi tidak dapat menambahkan atau memperbarui objek di dalamnya. Saat Anda membuat kueri objek seperti tabel dan tabel virtual melalui set data tertaut, data dari set data bersama akan ditampilkan. Untuk mengetahui informasi selengkapnya tentang set data tertaut, baca Melihat dan berlangganan listingan. Set data tertaut diotorisasi untuk mengakses tabel dan tabel virtual pada set data bersama. Subscriber dengan set data tertaut dapat mengakses tabel dan tabel virtual pada set data bersama tanpa otorisasi Identity and Access Management tambahan. Set data tertaut mendukung objek berikut:

Opsi traffic keluar data

Opsi traffic keluar data (pratinjau) memungkinkan penayang membatasi ekspor berdasarkan pelanggan data dari set data yang tertaut ke BigQuery.

Penayang dapat mengaktifkan batasan traffic keluar data pada listingan, hasil kueri, atau keduanya. Saat traffic keluar data dibatasi, batasan berikut akan diterapkan:

  • API salin, clone, ekspor, dan snapshot dinonaktifkan.

  • Opsi salin, clone, ekspor, dan snapshot di Konsol Google Cloud dinonaktifkan.

  • Menghubungkan set data yang dibatasi ke tabel Explorer dinonaktifkan.

  • BigQuery Data Transfer Service dinonaktifkan di set data yang dibatasi.

  • Pernyataan CREATE TABLE AS SELECT dan penulisan ke tabel tujuan dinonaktifkan.

Saat membuat listingan, Anda dapat menetapkan opsi traffic keluar data yang sesuai.

Batasan

Analytics Hub memiliki batasan berikut:

  • Set data bersama dapat memiliki maksimum 1.000 set data tertaut.

  • Set data dengan resource yang tidak didukung tidak dapat dipilih sebagai set data bersama saat Anda membuat listingan. Untuk mengetahui informasi selengkapnya tentang objek BigQuery yang didukung oleh Analytics Hub, lihat Set data bersama dalam dokumen ini.

  • Anda tidak dapat memperbarui listingan untuk membatasi traffic keluar data. Anda hanya dapat membatasi traffic data yang keluar di listingan baru.

  • Set data tertaut yang dibuat sebelum 25 Juli 2023 tidak akan diisi ulang oleh resource langganan. Hanya langganan yang dibuat setelah 25 Juli 2023 yang berfungsi dengan metode API.

  • Jika Anda adalah publisher, batasan interoperabilitas BigQuery berikut berlaku:

    • Subscriber tidak dapat membuat kueri tabel virtual dalam set data tertaut yang merujuk pada data dari project lain. Anda harus membuat tabel virtual yang diotorisasi untuk memberi subscriber akses ke data tabel virtual tanpa memberi mereka akses ke data sumber yang mendasarinya.

    • Rencana kueri mengungkapkan kueri tabel virtual bersama dan kueri rutin, termasuk project ID, dan set data lain yang terlibat dalam tabel virtual yang diotorisasi. Jangan sertakan apa pun, seperti kunci enkripsi yang dianggap sensitif, dalam kueri rutin atau tabel virtual bersama.

    • Set data bersama diindeks di Data Catalog. Pembaruan pada set data bersama, seperti menambahkan tabel atau tabel virtual, tersedia bagi subscriber tanpa keterlambatan. Namun, dalam skenario tertentu, misalnya, jika ada lebih dari seratus subscriber atau tabel dalam set data bersama, pembaruan mungkin memerlukan waktu hingga 18 jam untuk diindeks dalam Data Catalog. Karena keterlambatan dalam pengindeksan, subscriber tidak dapat langsung menelusuri resource yang telah diperbarui ini di Konsol Google Cloud.

    • Jika Anda telah menyiapkan kebijakan keamanan tingkat baris atau penyamaran data pada tabel yang tercantum, subscriber harus merupakan subscriber edisi Enterprise atau Enterprise Plus untuk menjalankan tugas kueri di set data tertaut. Untuk mengetahui informasi tentang edisi, lihat Pengantar edisi BigQuery.

  • Jika Anda adalah subscriber, batasan interoperabilitas BigQuery berikut berlaku:

    • Tabel virtual terwujud yang merujuk ke tabel dalam set data tertaut tidak didukung.

    • Pengambilan snapshot tabel set data tertaut tidak didukung.

    • Jika set data tertaut tidak ditempatkan dengan set data bersama, operasi baca ke tabel set data tertaut dengan ukuran kueri lebih dari 1 TB mungkin akan gagal. Anda dapat menghubungi dukungan untuk mengatasi masalah ini.

    • Anda tidak dapat menggunakan penentu region dengan tabel virtual INFORMATION_SCHEMA guna melihat metadata untuk set data tertaut.

    • Saat membuat kueri untuk rutinitas dalam set data tertaut, Anda hanya dapat membuat kueri untuk Fungsi yang ditentukan pengguna (UDF SQL dan JavaScript) dan jenis rutinitas Fungsi tabel. Membuat kueri untuk jenis rutinitas yang tidak didukung akan menghasilkan pesan error: Querying routine type type is not yet supported on linked dataset dataset.

  • Batasan berikut berlaku untuk metrik penggunaan:

  • Batasan berikut berlaku saat berlangganan data Cloud Data Salesforce:

    • Data Cloud Data dibagikan sebagai tampilan. Sebagai pelanggan, Anda tidak dapat mengakses tabel pokok yang dirujuk oleh tampilan.

Region yang didukung

Analytics Hub didukung di region dan multi-region berikut.

Region

Tabel berikut mencantumkan region di Amerika tempat Analytics Hub tersedia.
Deskripsi region Nama region Detail
Columbus, Ohio us-east5
Dallas us-south1
Iowa us-central1 ikon daun CO2 Rendah
Las Vegas us-west4
Los Angeles us-west2
Montréal northamerica-northeast1 ikon daun CO2 Rendah
Northern Virginia us-east4
Oregon us-west1 ikon daun CO2 Rendah
Salt Lake City us-west3
Sao Paulo southamerica-east1 ikon daun CO Rendah2
Santiago southamerica-west1
South Carolina us-east1
Toronto northamerica-northeast2
Tabel berikut mencantumkan region di Asia Pasifik tempat Analytics Hub tersedia.
Deskripsi region Nama region Detail
Delhi asia-south2
Hong Kong asia-east2
Jakarta asia-southeast2
Melbourne australia-southeast2
Mumbai asia-south1
Osaka asia-northeast2
Seoul asia-northeast3
Singapura asia-southeast1
Sydney australia-southeast1
Taiwan asia-east1
Tokyo asia-northeast1
Tabel berikut mencantumkan region di Eropa tempat Analytics Hub tersedia.
Deskripsi region Nama region Detail
Belgia europe-west1 ikon daun CO2 Rendah
Finlandia europe-north1 ikon daun CO Rendah2
Frankfurt europe-west3 ikon daun CO Rendah2
London europe-west2 ikon daun CO Rendah2
Belanda europe-west4
Warsawa europe-central2
Zürich europe-west6 ikon daun CO Rendah2
Tabel berikut mencantumkan wilayah di Timur Tengah tempat Analytics Hub tersedia.
Deskripsi region Nama region Detail
Dammam me-central2
Tel Aviv me-west1

Multi-region

Tabel berikut mencantumkan multi-region tempat Analytics Hub tersedia.
Deskripsi multi-region Nama multi-region
Pusat data di negara anggota Uni Eropa1 EU
Pusat data di Amerika Serikat US

1 Data yang berada di multi-region EU tidak disimpan di pusat data europe-west2 (London) atau europe-west6 (Zürich).

Region Omni

Tabel berikut mencantumkan Omni tempat Analytics Hub tersedia.
Deskripsi region Omni Nama region Omni
AWS
AWS - AS Timur (N. Utara) aws-us-east-1
AWS - AS Barat (Oregon) aws-us-west-2
AWS - Asia Pasifik (Seoul) aws-ap-northeast-2
AWS - Eropa (Irlandia) aws-eu-west-1
Azure
Azure - AS Timur 2 azure-eastus2

Contoh kasus penggunaan

Bagian ini menampilkan contoh cara menggunakan Analytics Hub.

Misalnya Anda adalah retailer dan organisasi Anda memiliki data perkiraan permintaan real-time di project Google Cloud bernama Forecasting. Anda ingin membagikan data perkiraan permintaan ini kepada ratusan vendor di sistem supply chain Anda. Berikut cara membagikan data Anda kepada vendor melalui Analytics Hub:

Analytics Hub Administrator

Sebagai pemilik project Forecasting, Anda harus mengaktifkan Analytics Hub API terlebih dahulu, lalu menetapkan peran Admin Analytics Hub kepada pengguna yang mengelola pertukaran data dalam project. Pengguna dengan peran Analytics Hub Admin disebut Analytics Hub Administrator.

Analytics Hub Administrator dapat melakukan tugas berikut:

  • Membuat, memperbarui, menghapus, dan membagikan pertukaran data di project Forecasting organisasi Anda.

  • Mengelola Analytics Hub Administrator lainnya.

  • Mengelola publisher dengan memberikan peran Analytics Hub Publisher kepada karyawan di organisasi Anda. Jika Anda ingin beberapa karyawan hanya dapat memperbarui, menghapus, dan membagikan listingan, tetapi tidak dapat membuatnya, Anda dapat memberi mereka peran Analytics Hub Listing Admin.

  • Mengelola subscriber dengan memberikan peran Analytics Hub Subscriber kepada grup Google yang terdiri dari semua vendor. Jika Anda ingin beberapa vendor hanya memiliki akses lihat ke pertukaran dan listingan yang tersedia, Anda dapat memberi mereka peran Analytics Hub Viewer. Vendor ini tidak dapat berlangganan listingan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola pertukaran data.

Analytics Hub Publisher

Publisher membuat listingan berikut untuk set data mereka di project Forecasting atau di project yang berbeda:

  • Listingan A: Set Data Perkiraan Permintaan 1
  • Listingan B: Set Data Perkiraan Permintaan 2
  • Listingan C: Set Data Perkiraan Permintaan 3

Sebagai penyedia data, Anda dapat melacak metrik penggunaan untuk set data bersama. Metrik penggunaan mencakup detail berikut:

  • Tugas yang dijalankan pada set data bersama.
  • Detail konsumsi set data bersama oleh project dan organisasi subscriber.
  • Jumlah baris dan byte yang diproses oleh tugas tersebut.

Untuk mengetahui informasi selengkapnya, lihat Mengelola listingan.

Analytics Hub Subscriber

Subscriber dapat menjelajahi listingan yang dapat mereka akses dalam pertukaran data. Mereka juga dapat berlangganan listingan ini dan menambahkan set data ini ke project mereka dengan membuat set data tertaut. Vendor kemudian dapat menjalankan kueri pada set data tertaut ini dan mengambil hasilnya secara real time.

Untuk mengetahui informasi selengkapnya, baca Melihat dan berlangganan listingan.

Harga

Tidak ada biaya tambahan untuk mengelola listingan atau pertukaran data. Analytics Hub Publisher dikenai biaya untuk penyimpanan data, sedangkan subscriber membayar kueri yang dijalankan pada data bersama berdasarkan model harga berbasis kapasitas atau on-demand. Untuk mengetahui informasi tentang harga, lihat Harga BigQuery.

Kuota

Untuk mengetahui informasi tentang kuota Analytics Hub, lihat Kuota dan batas.

Kontrol Layanan VPC

Anda dapat menetapkan aturan traffic masuk dan keluar yang diperlukan agar publisher dan subscriber dapat mengakses data dari project yang memiliki perimeter Kontrol Layanan VPC. Untuk mengetahui informasi selengkapnya, lihat aturan Kontrol Layanan VPC Hub Analytics Hub.

Langkah selanjutnya