Guia de início rápido: criar um lake

Nesta página, mostramos como começar a usar o Dataplex no Console do Google Cloud, orientando você na criação de um lake, como adicionar uma zona e anexando um recurso.

Antes de começar

  1. Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  4. Enable the Dataplex, Dataproc, Metastore do Dataproc, Data Catalog, BigQuery e Cloud Storage APIs.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Acessar o IAM
    2. Selecionar um projeto.
    3. Clique em CONCEDER ACESSO.
    4. No campo Novos principais, insira seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.

    5. Na lista Selecionar um papel, escolha um.
    6. Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
    7. Clique em Salvar.
    8. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    9. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    10. Enable the Dataplex, Dataproc, Metastore do Dataproc, Data Catalog, BigQuery e Cloud Storage APIs.

      Enable the APIs

    11. Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor

      Check for the roles

      1. In the Google Cloud console, go to the IAM page.

        Go to IAM
      2. Select the project.
      3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

      4. For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.

      Grant the roles

      1. In the Google Cloud console, go to the IAM page.

        Acessar o IAM
      2. Selecionar um projeto.
      3. Clique em CONCEDER ACESSO.
      4. No campo Novos principais, insira seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.

      5. Na lista Selecionar um papel, escolha um.
      6. Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
      7. Clique em Salvar.
      8. Crie um bucket do Cloud Storage:
        1. In the Google Cloud console, go to the Cloud Storage Buckets page.

          Go to Buckets page

        2. Click Create bucket.
        3. On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
          • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
          • For Choose where to store your data, do the following:
            • Select a Location type option.
            • Select a Location option.
          • For Choose a default storage class for your data, select the following: Standard.
          • For Choose how to control access to objects, select an Access control option.
          • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
        4. Click Create.

Criar um lake

As etapas a seguir mostram como criar um lake usando o console do Google Cloud.

  1. Acesse o Dataplex no console do Google Cloud.

    Acessar o Dataplex

  2. Navegue até a visualização Gerenciar.

  3. Clique em Criar.

  4. Digite um Nome de exibição.

  5. O ID do lake é gerado automaticamente.

  6. Especifique a Região em que o lake será criado.

    Para lakes criados em uma determinada região (por exemplo, us-central1), os dados de uma única região (us-central1) e os dados de várias regiões (us multi-region) podem ser anexados, dependendo das configurações da zona.

  7. Clique em Criar.

Adicionar uma zona ao lake

Depois de criar um lake, é possível adicionar zonas a ele. As zonas são agrupamentos lógicos de dados estruturados e não estruturados.

  1. Na visualização Gerenciar, clique no nome do lake você quer adicionar uma zona.

  2. Clique em Adicionar zona.

  3. Digite um Nome de exibição para a zona.

  4. Clique na lista suspensa Tipo. Escolha Raw Zone ou Curated Zone. Saiba mais sobre os tipos de zona.

  5. Em Locais dos dados, selecione Region ou Multirregional. O que você escolher não poderá ser alterado posteriormente. Os dados de região única e multirregião não podem ser combinados na mesma zona.

  6. Clique em Criar.

A criação da zona pode levar alguns minutos.

Anexar um recurso

Os dados podem ser armazenados em buckets do Cloud Storage ou conjuntos de dados do BigQuery e anexados como recursos a zonas de dados em um lake do Dataplex.

Siga estas etapas para anexar o bucket do Cloud Storage criado anteriormente como um recurso.

  1. Na visualização Gerenciar, clique no nome do lake a que você quer anexar um bucket do Cloud Storage.

  2. Na guia Zonas, clique na zona para adicionar o recurso.

  3. Na guia Assets, clique em Add Assets.

  4. Clique em Adicionar um recurso.

  5. Em Tipo, selecione Bucket de armazenamento.

  6. Em Nome de exibição, insira um nome para o recurso.

  7. No campo Bucket, clique em Procurar. Se você tiver um bucket do Cloud Storage, encontre-o e clique em Selecionar. Se você não tiver um bucket do Cloud Storage, crie um clicando no botão .

    1. Insira um nome exclusivo para o bucket. Clique em Continuar.

    2. Escolha um Tipo de local. Clique em Continuar.

    3. Escolha uma classe de armazenamento padrão para seus dados. Clique em Continuar.

    4. Escolha um nível de controle de acesso. Clique em Continuar.

    5. Escolha uma opção de proteção de dados ou Nenhuma. Clique em Continuar.

    6. Clique em Criar.

    7. Clique em Selecionar.

  8. Clique em Concluído.

  9. Clique em Continuar.

  10. Em Configurações de descoberta, selecione Herdar para herdar as configurações de descoberta do nível da zona.

  11. Clique em Continuar.

  12. Em Adicionar recursos, clique em Enviar.

Aguarde a conclusão da criação do recurso.

Limpar

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
  3. In the project list, select the project that you want to delete, and then click Delete.
  4. In the dialog, type the project ID, and then click Shut down to delete the project.

Se preferir, exclua os recursos usados neste tutorial. Os lakes não podem ser excluídos, a menos que todos os recursos de zona de dados abaixo deles tenham sido excluídos. Da mesma forma, as zonas de dados não podem ser excluídas a menos que todos os recursos de recursos delas tenham sido excluídos:

Remover o bucket de armazenamento

As etapas a seguir mostram como desanexar o recurso do Dataplex que você criou.

  1. Acesse o Dataplex no console do Google Cloud.

    Acessar o Dataplex

  2. Na visualização Gerenciar, clique no nome do lake que você criou.

  3. Na guia Zonas, clique no nome da zona que você criou.

  4. Na guia Recursos, selecione o recurso que será desanexado marcando a caixa à esquerda do nome do bucket.

  5. Clique em Excluir recurso.

  6. Clique em Excluir para confirmar a separação.

Excluir a zona

As etapas a seguir mostram como excluir a zona do Dataplex que você criou.

  1. Acesse o Dataplex no console do Google Cloud.

    Acessar o Dataplex

  2. Na visualização Gerenciar, clique no lake que você criou.

  3. Na guia Zonas, selecione a zona a ser excluída marcando a caixa à esquerda do nome da zona de dados.

  4. Clique em Delete Zone (Excluir zona).

  5. Clique novamente em Excluir para confirmar a ação.

Excluir o lake

Veja nas etapas a seguir como excluir o lake do Dataplex que você criou.

  1. Acesse o Dataplex no console do Google Cloud.

    Acessar o Dataplex

  2. Na visualização Gerenciar, clique no lake que você criou.

  3. Na parte superior da página, clique em Excluir.

  4. Para confirmar a exclusão, digite "delete" na caixa de texto.

  5. Clique em Excluir lake para confirmar a exclusão.

A seguir

Depois de criar lake, zonas e recursos, é possível: