Tarifs de Vertex AI Agent Builder

Les tarifs sont indiqués en dollars américains (USD).

Les tarifs des fonctionnalités en disponibilité générale listées seront appliqués à partir du 1er septembre 2023.

Vertex AI Agent Builder permet aux développeurs, même si leurs compétences en machine learning sont limitées, d'exploiter les les grands modèles de langage de fondation, l'expertise de la recherche et les technologies d'IA conversationnelle de Google pour créer des applications d'IA générative professionnelles

Crédits d'essai et Assistance

1 000$ de crédits d'essai GRATUITS sont attribués pour une utilisation avec Vertex AI Agent Builder. Ces crédits sont valables un an à compter de la création d'un compte Vertex AI Agent Builder à compter du 18 juillet 2023.

Vous avez des questions sur les fonctionnalités en disponibilité générale ou sur le packaging et la tarification des fonctionnalités en preview ?

Pour en savoir plus, veuillez contacter votre équipe commerciale Google Cloud .

Tarifs des agents Vertex AI

Vertex AI Agent Builder permet de créer rapidement des agents virtuels (chatbots) qui génèrent des réponses en fonction du contenu (site Web, documents). que vous incluez dans les data stores. Les agents Vertex AI vous permettent de créer un nouvel objet Dialogflow CX. un agent virtuel OU ajouter la fonctionnalité à un agent virtuel Dialogflow CX existant.

Pour ajouter des fonctionnalités d'IA générative supplémentaires à vos agents virtuels Dialogflow CX, vous pouvez utiliser des recours génératifs, qui utilisent un grand modèle de langage (LLM) afin de gérer de façon optimale les cas où il n'y a pas de correspondance avec l'intent de l'utilisateur. Les générateurs permettent à vos développeurs de bots d'injecter des actions génératives à n'importe quel moment de votre flux de conversation, par exemple pour résumer une conversation, personnaliser une interaction ou enchaîner plusieurs appels LLM pour créer un workflow génératif complet.

Tarifs de la fonctionnalité en disponibilité générale des agents Vertex AI

Chat avec les agents Vertex AI* 12 $ / 1 000 requête**
Voix pour les agents Vertex AI* 0,002 $ / seconde†
Chat Dialogflow CX***(fonctionnalités d'IA standards non génératives pour Chat) 7 $ / 1 000 requête**
Dialogflow CX Voice***(fonctionnalités d'IA standards non génératives pour Voice) 0,001 $ par seconde†
* Toutes les fonctionnalités d'IA générative, à savoir les agents de data store, les instances de secours génératifs, les générateurs et les applications d'agent, sont couvertes par les tarifs des SKU Chat et Voice pour les agents Vertex AI. Si vous utilisez plusieurs types de fonctionnalités d'IA générative dans une même requête, vous serez facturé séparément pour chaque fonctionnalité en fonction de son utilisation.

* Les clients peuvent combiner des requêtes par seconde Dialogflow CX (non génératifs) et des agents Vertex AI (génératifs) dans le même agent ou flux. L'utilisation réelle de chaque ensemble de caractéristiques sera automatiquement facturée. Vous pouvez ainsi exploiter l'IA générative de manière sélective lorsque c'est possible et ne payer que ce que vous utilisez réellement.

** Requête (ou requête): facturation facturée à l'usage pour chaque requête ou requête individuelle.
Une requête ou une requête est définie comme un appel d'API au service Dialogflow ou au service Agents Vertex AI, qu'il soit effectué directement via l'API, ou indirectement via l'intégration ou la console.
Par exemple, un utilisateur posant une question à un agent virtuel (chatbot) et que le chatbot répond est une requête. Une interaction utilisateur avec le chatbot peut être constituée de plusieurs requêtes pour accomplir une tâche.

† Inclut la reconnaissance vocale, la synthèse vocale, la synthèse vocale et la téléphonie. La durée totale du traitement audio facturé est indépendante de tout traitement sans frais non audio (latence de l'API, traitement du webhook, etc.) pouvant survenir avant, pendant ou après le traitement audio.

* Les fonctionnalités Dialogflow CX Chat et Dialogflow CX Voice ne sont pas éligibles aux crédits d'essai GRATUITS de 1 000 $. Dialogflow CX propose un programme de crédits d'essai supplémentaires qui peut être associé à ce programme de crédits d'essai GRATUITS de Vertex AI Agent Builder. Pour consulter d'autres définitions de la mesure Dialogflow CX, cliquez ici.

Exemple de tarification pour la fonctionnalité en disponibilité générale des agents Vertex AI

Exemple de combinaison de réponses basées sur l'intention et génératives: service client sur le site Web

  • Des flux déterministes basés sur l'intention sont utilisés pour certaines questions spécifiques au client (facturation, paiement)
  • Réponses génératives utilisées pour gérer les questions dont l'intention n'est pas définie, mais dont la réponse figure sur le site Web

Hypothèses :

  • 100 millions de visites annuelles du site Web
  • 5% des visiteurs utilisent le chatbot, 3 requêtes par utilisation, 50% d'IA générative, 50% basées sur l'intention
Volume de SKU Tarif Prix catalogue total
Chat Dialogflow CX (basé sur l'intent)
7,5 M par an
100 M x 5% d'utilisation x 3 requêtes x 50% basées sur l'intention
* 7 € / 1 000 requêtes = 52 500 $
Chat d'entreprise Dialogflow CX (génératif)
7,5 M par an
100 M x 5% d'utilisation x 3 requêtes x 50% d'IA générative
* 12 € / 1 000 requêtes = 90 000 $
Données indexées
50 Go par an
10 Go gratuits, donc 40 Go utilisés pour calculer le prix
* 5,00 $ / Go x 12 mois = 2 400 $

Tarifs de Vertex AI Search

Vertex AI Agent Builder permet de créer rapidement des moteurs de recherche pour des sites Web, ainsi que des données non structurées et structurées afin de récupérer des informations et de générer des réponses fondées. Pour en savoir plus sur les fonctionnalités disponibles dans Vertex AI Search,

Tarifs des fonctionnalités de disponibilité générale de Vertex AI Search

Recherche en édition Standard* 2 $ / 1 000 requête
Recherche Enterprise Edition* 4 $ / 1 000 requête
Module complémentaire LLM de recherche de base** +4 $ / 1 000 requêtes saisies par l'utilisateur**
Module complémentaire LLM de recherche avancée** +10,00 € / 1 000 requêtes saisies par l'utilisateur**
Recherche Édition Standard – Fonctionnalités de recherche non structurées
Édition Enterprise – Recherche non structurée et fonctionnalités de recherche pour site Web
Module complémentaire LLM pour la recherche de base** : fournit des réponses et des résumés à des requêtes simples/multitours, avec possibilité de traiter des requêtes simples, des requêtes composées, des requêtes longues, des requêtes multitours, compatible avec des modèles tels que TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien)
Module complémentaire LLM pour la recherche avancée** (version Preview publique actuelle, en disponibilité générale, le 1er juillet 2024) : fournit des réponses et des résumés aux requêtes à sauts multiples (une requête qui contient au moins deux questions imbriquées, la réponse à une clarifiant la question suivante), qui prend en charge des modèles tels que TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien). Nous avons facturé en fonction du nombre de requêtes saisies par l'utilisateur, et non du nombre de sauts.
Preview privée – Recherche structurée et nouvelles fonctionnalités d'IA générative (contactez le service commercial pour connaître les dernières fonctionnalités)

*Requête: facturation facturée à l'usage pour chaque requête ou saisie de requête
Une requête ou une requête est définie comme un appel d'API à Enterprise Search, qu'il soit effectué directement via l'API, ou indirectement lié à l'intégration ou à la console.
Exemple: un utilisateur posant une question en langage naturel et que le moteur de recherche y répond ne correspond qu'à une seule requête.

** Le module complémentaire LLM à une requête pour augmenter le traitement afin d'utiliser une IA générative fonctionnalité,
Le module complémentaire LLM peut être utilisé de manière interchangeable avec Search Standard Edition ou Search Enterprise Edition.
Exemple: Exécuter une requête Search Enterprise avec une requête de synthèse = 1 requête Search Enterprise + 1 requête du module complémentaire LLM

Exemple de tarification pour la fonctionnalité GA de Vertex AI Search

Exemple de données non structurées : Recherche de documents

Hypothèse:

  • 10 millions de requêtes par an dans l'édition Standard
  • 10 millions de requêtes Enterprise Edition avec 10 millions de requêtes de synthèse LLM par an
  • 100 000 documents, à environ 1 Mo chacun
Volume de SKU Tarif Prix catalogue total
Recherche standard
10 millions d'euros par an * 2 $ / 1 000 requêtes = 20 000 $
Rechercher dans Enterprise
10 millions d'euros par an * 4,00 $ / 1 000 requêtes = 40 000 $
Module complémentaire LLM de recherche de base
Chaque requête ajoutée à une requête standard ou Enterprise
10 millions d'euros par an * + 4 € / 1 000 requêtes saisies par l'utilisateur = + de 40 000 $
Module complémentaire LLM de recherche avancée
Chaque requête ajoutée à une requête standard ou Enterprise
10 millions d'euros par an * + 10,00 € / 1 000 requêtes saisies par l'utilisateur = + de 100 000 $
Données indexées
100 Go par an 10 Go gratuits, soit 90 Go utilisés dans le calcul du prix * 5,00 $ / Go x 12 mois = 5 400 $

Tarifs de Data Index

Tarifs du stockage de données d'index dans Vertex AI Agent Builder

Données indexées 5 $ / Gio par mois
* Quota gratuit de 10 Gio par mois fourni
** Partagé entre Vertex AI Agent Builder
*** Le stockage est calculé comme suit : 500 kibioctets (Kio) * "nombre de pages sur le site Web", où 1 Kio correspond à 1 024 octets. (500 Kio équivaut à ~0,000477 Gio.L'indexation des données le tarif pour un site Web de 1 000 pages est de 2,38 $par mois.)

Tarifs de Vertex AI Search pour le secteur de la santé

Vertex AI Search pour le secteur de la santé permet de créer rapidement des moteurs de recherche réglés sur le plan médical plutôt que des données de santé.

Healthcare Search 20 $ pour 1 000 requête

Vertex AI Search for Healthcare inclut certaines fonctionnalités en version preview, telles que les réponses d'IA générative, les mises à jour en continu de l'index, etc. Ces fonctionnalités peuvent être facturées différemment du prix catalogue actuel lors de leur sortie en disponibilité générale.

Hypothèse:

  • 1 000 000 de requêtes de recherche concernant la santé par mois

  • 1 000 Gio de données de santé indexées

Volume de SKU Tarif Prix catalogue total
1 000 000 de recherches 20 $/1 000 20 000 $
1 000 Gio 5 $/Gio 5 000 $

Tarifs de Vertex AI Search pour les médias

Vertex AI Search for Media vous permet de fournir des résultats vidéo très pertinents en exploitant la requête et la compréhension contextuelle de Google pour améliorer la visibilité sur votre site multimédia.

Vertex AI Agent Builder: index de données 5 $ / Go par mois
Vertex AI Search: nombre de requêtes de l'API Media Search 2 $ / 1 000 requête

Tarifs de Vertex AI Search pour les recommandations de médias

Les seules opérations de recommandations de médias qui entraînent des frais sont l'entraînement, le réglage ou la demande de prédictions en appelant la méthode recommend. L'importation et la gestion des événements utilisateur ou des informations figurant dans les documents sont gratuites.

Les coûts d'entraînement (par nœud et par heure) sont facturés quotidiennement si votre modèle est en cours d'entraînement ou si vous avez envoyé une demande de reprise de l'entraînement. Lorsque vous mettez en veille ou supprimez un modèle, vous n'êtes plus facturé. Consultez la documentation sur la gestion de l'entraînement.

Les coûts du réglage (par nœud et par heure) des modèles actifs sont facturés une fois le réglage terminé. Vous ne payez un réglage incomplet que si vous mettez en pause ou supprimez un modèle pendant un réglage en cours. Dans ce cas, les nœuds-heure utilisés avant l'arrêt du réglage du modèle vous sont facturés. Consultez la documentation sur la gestion du réglage.

Requêtes de prédiction par mois Prix pour 1 000 prédictions
Jusqu'à 20 000 000 0,27 $
Les 280 000 000 suivantes 0,18 $
Après 300 000 000 0,10 $
Fonctionnalité Prix
Entraînement et réglage 2,50 $ par nœud et par heure

Exemple de tarification pour les recommandations de médias

Hypothèse:

  • 1 000 000 000 de requêtes de prédiction par mois

  • Entraîne un seul modèle par jour, qui se réentraîne automatiquement une fois par jour

  • Cela représente environ 500 nœud-heures d'entraînement du modèle et 100 heures de réglage de modèle par mois

Volume de SKU Tarif Prix catalogue total
20 premiers millions de prédictions * 0,27 $ / 1 000 prédictions = 5 400 $
280 millions de prédictions suivants * 0,18 $ / 1 000 prédictions = 50 400 $
700 millions de prédictions suivants * 0,10 $ / 1 000 prédictions = 70 000 $
500 nœud-heures (entraînement) * 2,50 $ / heure = 1 250 $
100 nœud-heures (réglage) * 2,50 $ / heure = 250 $
Total 127 300 $

Frais d'observabilité Google Cloud

Media Recommendations consigne une erreur dans Google Cloud Observability pour chaque requête API qui génère une erreur, telle qu'une requête d'événement utilisateur contenant un fichier JSON mal formé, ou une demande d'importation de document dont le prix est négatif. Les recommandations de médias consignent également une erreur pour chaque requête de prédiction associée à une valeur document qui ne se trouve pas dans le datastore importé.

Les frais d'observabilité Google Cloud sont facturés par Gio de journaux stockés, ainsi que la conservation au-delà du et la durée de conservation par défaut. Pour en savoir plus sur les attribution gratuite et conservation des données, consultez la page des tarifs de Google Cloud Observability.

La taille des données de journalisation dépend de la taille de votre charge utile JSON, alors qu'un Gio correspondrait à environ 200 000 erreurs de recommandations de médias.

Tarifs de l'API Grounded Generation

L'API Grounded Generation vous permet de créer des réponses génératives à vos requêtes à l'aide des informations de la recherche Google ou de vos propres données.

Invite d'entrée (inclut une invite utilisateur, des instructions système et des informations sur l'ancrage intégré) Facturée au prix du modèle Gemini sélectionné.
Sortie Facturée au prix du modèle Gemini sélectionné.
Ground Generation pour s'ancrer sur vos propres données récupérées 2,50 $ / 1 000 requêtes
Ground Generation pour s'ancrer dans la recherche Google Pour en savoir plus, consultez Éléments au sol dans la recherche Google.
Les frais supplémentaires liés à la récupération des données sont déterminés par le système de récupération sélectionné (par exemple, Vertex AI Search).

Exemple n° 1: Ancrage sur Vertex AI Search et faits d'ancrage intégrés

L'utilisateur utilise Vertex AI Search et d'autres faits d'ancrage pour générer des réponses fondées. Chaque requête d'entrée compte 2 500 caractères (y compris les faits d'ancrage intégrés) et chaque requête de sortie comporte 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.

Volume par requête Prix pour 1 000 requêtes
Invite de saisie 2 500 caractères 1 000 requêtes x 0,000125 $ pour 1 000 caractères x 2 500 caractères par requête = 0,3125$pour 1 000 requêtes
Sortie 200 caractères 1 000 requêtes x 0,000375 $ pour 1 000 caractères x 2 caractères par requête = 0,075$pour 1 000 requêtes
Ground Generation pour s'ancrer sur vos propres données récupérées 1 requête 2,50$pour 1 000 requêtes
Récupération des données: Vertex AI Search (édition Enterprise) 1 requête 4,00$pour 1 000 requêtes
Total: 6,8875 $ pour 1 000 requêtes

L'utilisateur utilise la recherche Google pour générer des réponses fondées. Chaque requête d'entrée comporte 500 caractères et chaque requête de sortie de 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.

Volume par requête Prix pour 1 000 requêtes
Invite de saisie 500 caractères 1 000 requêtes x 0,000125 $ pour 1 000 caractères x 500 caractères par requête = 0,0625$pour 1 000 requêtes
Sortie 200 caractères 1 000 requêtes x 0,000375 $ pour 1 000 caractères x 200 caractères par requête = 0,075$pour 1 000 requêtes
Ground Generation pour s'ancrer dans la recherche Google 1 requête 35,00$pour 1 000 requêtes
Total: 35,1375 $ pour 1 000 requêtes

Consulter les tarifs de l'API Grounding

L'ancrage de la vérification permet de déterminer dans quelle mesure un texte (la réponse possible) est ancré dans un ensemble donné de textes de référence (les faits).

Vérifier la connexion à la terre 0,00075 $ pour 1 000 caractères de réponse

Tarifs des fonctionnalités Document AI

Pour obtenir des informations complètes sur la tarification de toutes les fonctionnalités de Document AI, consultez la page des tarifs de Document AI.

Pour en savoir plus sur les fonctionnalités Document AI intégrées et facturées via Vertex AI Search, reportez-vous aux tableaux ci-dessous.

Numériser du texte

Processeur 1 à 5 000 000 pages/mois * À partir de 5 000 001 pages/mois
Processeur OCR d'entreprise de documents 1,50 $ par tranche de 1 000 pages 0,60 $ par ensemble de 1 000 pages

Extraire des structures et des entités à partir de documents

Analyseur de mise en page (inclut la fragmentation initiale) 10 $ par tranche de 1 000 pages

*La taille d'une page dépend du format de fichier :

  • Images (JPEG/JPG, PNG, BMP, HEIF): chaque image = 1 page

  • PDF: chaque page du PDF = 1 page

  • TIFF: chaque image du TIFF = une page

  • Mot (DOCX): jusqu'à 3 000 caractères = 1 page

  • Excel (XLSX): chaque onglet = une page

  • Powerpoint (PPTX): chaque diapositive correspond à une page.

  • HTML: jusqu'à 3 000 caractères = 1 page

  • Documents analysés: jusqu'à 3 000 caractères = 1 page

Tarifs de l'API de classement

L'API de classement prend une liste de documents et reclasse ces documents en fonction de leur pertinence par rapport à une requête.

Par rapport aux représentations vectorielles continues, qui examinent uniquement la similarité sémantique d'un document et d'une requête, l'API de classement peut vous fournir des scores précis sur la façon dont un document répond à une requête donnée.

L'API de classement peut être utilisée pour améliorer la qualité des résultats de recherche après la récupération d'un ensemble initial de documents candidats.

Classer les documents

Classement 1 $ pour 1 000 requêtes

Une requête se définit comme contenant jusqu'à 100 documents, bien qu'un utilisateur puisse spécifier plus de 100 documents par requête. Si plus de 100 documents sont spécifiés, le tarif augmente de 1 pour chaque multiple de 100 documents.
Exemple:

  • 132 documents à classer = 2 requêtes

  • 200 documents à classer = 2 requêtes

  • 399 documents à classer = 4 requêtes

  • 401 documents à classer = 5 requêtes

Étape suivante

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial