Es posible que las funciones en fase beta no estén disponibles en tu red. Lee las notas de la versión de esta función para cuando se encuentre en disponibilidad general.
Los archivos del informe de Transferencia de datos proporcionan datos no agregados a nivel del evento a partir de sus campañas de anuncios. Básicamente, estos datos son contenido sin procesar de los registros del servidor de anuncios de Ad Manager, y se genera un archivo separado para cada tipo de evento. Los archivos de Transferencia de datos contienen datos del evento con una precisión de segundos. En ellos, puede incluir información adicional que le permita ver el dispositivo, la ubicación y otros datos relacionados con el evento. Los socios deben aprobar las unidades de anuncios en Ad Manager para que se muestren en sus archivos de Transferencia de datos.
Cómo comenzar
Los archivos de informes de Transferencia de datos tienen un costo adicional. Comuníquese con su administrador de cuentas para habilitar la función. Una vez que la función esté habilitada, podrás configurar tus tipos de archivo de Transferencia de datos. Google Ad Manager ofrece dos opciones para la transferencia de datos: CSV y Parquet.
Si su organización no puede administrar el procesamiento de las tareas de extracción, transformación y carga (ETL), admitir archivos grandes, manipular archivos de texto, diseñar y administrar almacenes de datos medianos o diseñar e implementar secuencias de comandos, considere trabajar con un socio aprobado de Google Marketing Platform.
Archivos disponibles del informe de Transferencia de datos
Cada archivo de Transferencia de datos contiene información sobre distintos eventos. Puede agregar campos a cada tipo de archivo para ver la información contextual relacionada con esos eventos.
Backfill
correspondiente, el archivo Network
no incluye las impresiones publicadas desde Ad Exchange o AdSense a través de la asignación dinámica. Use el archivo Backfill
para obtener información sobre las impresiones asignadas dinámicamente.Información acerca de los datos que se incluyen en los archivos de Transferencia de datos
- Retrasos en los datos
Es normal que se produzcan retrasos de unas pocas horas. Sin embargo, en algunas ocasiones, los archivos de Transferencia de datos demoran más tiempo del habitual en procesarse. Si se retrasan los datos, aparecen en el archivo por lotes correspondiente a la siguiente hora con una marca de tiempo precisa. Esto podría significar, por ejemplo, que la mayoría de las marcas de tiempo de un archivo correspondan al período entre las 8 a.m. y las 9 a.m., con algunas previas si se retrasó el proceso. -
Horas sin actividad
Si no hay actividad durante una hora determinada, se publica un archivo vacío de Transferencia de datos que solo contiene los datos del encabezado. - Límites de fecha y hora
El primer archivo por hora de un día determinado suele contener los eventos que ocurrieron desde la medianoche hasta la 1 a.m. (hora del Pacífico), pero las marcas de tiempo del evento están expresadas según la zona horaria de la red del publicador. Por ejemplo, si el publicador tiene configurada la hora del este, el primer archivo por hora contendrá los eventos que ocurrieron entre las 3 a.m. y las 4 a.m. Los eventos de las tres horas previas estarán incluidos en los archivos del día anterior. Por lo tanto, es posible que las marcas de tiempo correspondan a una fecha diferente a la establecida en el nombre del archivo. Consulte siempre la marca de tiempo de los eventos en el archivo, no la hora en la que se publicó ni el nombre del archivo. - Informes de anuncios principales y complementarios en Transferencia de datos
Los archivos de Transferencia de datos muestran las impresiones de las creatividades principales y complementarias, pero la herramienta de consultas solo cuenta las impresiones que se publican en el conjunto de creatividades principales y complementarias (no una impresión para cada creatividad), a menos que se desglose la información por creatividades principales o complementarias.
El valor de IsCompanion es "TRUE" en las impresiones de la creatividad complementaria. El campo CreativeId contiene los ID de las creatividades individuales para las creatividades principales y complementarias, y no el ID del conjunto de creatividades. En Transferencia de datos, no hay ningún campo adicional para el ID del conjunto de creatividades que permita asociar las impresiones complementarias con las principales. - Discrepancias con los informes de Ad Manager
Periódicamente, se quitan el tráfico dañino o los datos de spam de los informes de Ad Manager o de aquellos que se generan mediante una API. Debido a la programación de publicación de los archivos de Transferencia de datos, es posible que parte de esta limpieza no se vea reflejada. Por lo tanto, es posible que Transferencia de datos muestre una cantidad ligeramente superior de impresiones, clics u otros eventos. Si se produce una discrepancia, la diferencia suele ser de aproximadamente un 1%.Es posible que los archivos de Transferencia de datos de
CodeServes
muestren un valor más alto que la métrica de recuento de publicaciones de código en los informes de Ad Manager. Esto se debe a que Transferencia de datos cuenta una publicación del código por cada impresión publicada, mientras que los informes solo cuentan una publicación de código por cada solicitud. Es posible que algunos formatos de creatividades, como los anuncios de texto de Google Ads, contengan varias impresiones para una sola solicitud. Agrupa tus archivos de Transferencia de datos en función de los valores del campoKeyPart
para encontrar las impresiones únicas que quieras comparar.
Beneficios y desventajas de los formatos de salida CSV y Parquet
CSV (valores separados por comas) | Parquet (almacenamiento en columnas) | |
---|---|---|
Legibilidad y accesibilidad | Es muy legible para las personas y se puede abrir y editar fácilmente con editores de texto básicos o software de hojas de cálculo. | Requiere herramientas especializadas para la visualización y edición, y no es tan accesible para los usuarios no técnicos. |
Universalidad y compatibilidad | Es compatible con prácticamente todas las herramientas de análisis y procesamiento de datos. | Es posible que se requieran bibliotecas o software adicionales para lograr la compatibilidad total, en especial en sistemas más antiguos. |
Simplicidad y facilidad de uso | Estructura simple, fácil de entender y con la que se puede trabajar, especialmente para conjuntos de datos más pequeños o análisis ad hoc rápidos. | Puede ser más complejo de implementar inicialmente, especialmente para los usuarios que no están familiarizados con el almacenamiento en columnas. |
Rendimiento y eficiencia | Puede ser más lento para conjuntos de datos grandes debido al almacenamiento basado en filas y la falta de compresión. | Ofrece un rendimiento superior para el procesamiento y el análisis de datos a gran escala debido al almacenamiento en columnas y las técnicas de compresión eficientes. |
Eficiencia del almacenamiento | Menos eficiente en el almacenamiento debido a la falta de compresión integrada y el potencial de almacenamiento de datos redundantes. | Es muy eficiente en el almacenamiento debido al almacenamiento en columnas y a los algoritmos de compresión avanzados, lo que reduce los costos de almacenamiento. Parquet puede ser de un 50 a un 75% más pequeño que los archivos CSV, especialmente para conjuntos de datos grandes. |
Si ya tienes habilitada la transferencia de datos en CSV, comunícate con tu administrador de cuentas para obtener acceso a Parquet.
Descargue un archivo de muestra
Puedes descargar estos archivos de muestra como CSV o Parquet para obtener una vista previa de los datos y campos que contiene cada uno de los archivos del informe de Transferencia de datos.
Tipo de evento | Nombre y tipo de archivo | Qué muestra | Archivos de muestra |
---|---|---|---|
Ofertas que se pueden unir | NetworkBackfillBidsJoinable |
Información sobre las ofertas. Se puede unir con otros archivos de transferencia de datos. 1 archivo por hora. |
|
CodeServe | NetworkCodeServes |
Registra todas las respuestas de Ad Manager, se hayan descargado o no. 2 archivos por hora. Nota: Los archivos de solicitud y publicación del código se incluyen con el archivo de impresiones sin costo adicional. |
|
Impresión | NetworkImpressions |
Incluye información sobre las impresiones descargadas. 2 archivos por hora. |
|
Solicitud | NetworkRequests |
Registra todas las solicitudes de anuncios que recibe Ad Manager, se hayan completado o no. 2 archivos por hora. Nota: Los archivos de solicitud y publicación del código se incluyen con el archivo de impresiones sin costo adicional. |
|
Vista activa | NetworkActiveViews |
Incluye información sobre las impresiones basadas en Ad Manager que son aptas para Vista activa. 2 archivos por hora. |
|
Ofertas | NetworkBackfillBids (Beta) |
Incluye información sobre ofertas en subastas de Authorized Buyers y Open Bidding. 1 archivo por hora. |
|
Clic | NetworkClicks |
Incluye información sobre los clics. 2 archivos por hora. |
|
Oferta mínima para ganar | NetworkMinimumBidToWin (Beta) |
Informa sobre los compradores de oferta mínima necesarios para ganar la subasta cuando compite al menos una línea de pedido remanente. 1 archivo por hora. |
|
Conversión de Rich Media | NetworkRichMediaConversions |
Incluye información sobre eventos de Studio, incluidas tanto las acciones estándares como las personalizadas (poner Me gusta, reproducir y pausar), la duración de la acción y mucho más. 2 archivos por hora. |
|
Conversión de video | NetworkVideoConversions |
Incluye información sobre eventos específicos de video, incluidas las acciones (poner Me gusta, reproducir, pausar), IDs de contenido, posicionamiento del grupo de anuncios y mucho más. Consulta todos los eventos de video. 2 archivos por hora. |
|
Cómo se entregan los archivos
Los archivos de Transferencia de datos se envían a los buckets de almacenamiento en la nube de Ad Manager cada hora. Le recomendamos que los revise a intervalos regulares para comprobar si hay actualizaciones. La mayoría de los datos se entregan y están disponibles entre 5 y 15 horas después de la hora registrada, aunque en algunos eventos retrasados el proceso puede demorar hasta 8 días después de ocurrido el evento. Ad Manager no envía información relacionada con la transferencia de datos a servidores de terceros.
Los nombres de los archivos incluyen la hora de inicio de los eventos en la zona horaria del Pacífico (respetando el horario de verano). Sin embargo, las marcas de tiempo presentes en ese archivo se proporcionan siempre de acuerdo con la zona horaria de la red de Ad Manager (la cual podría no respetar el horario de verano). Esto puede provocar que se omitan archivos o se generen archivos vacíos. También podría ocasionar que algunos archivos contengan más de una hora de datos, según la interacción entre estas configuraciones de zona horaria.
Nombres de archivo
Los nombres de los archivos de Transferencia de datos siguen una convención predecible:
- CSV:
[Tipo]_[ID de red]_[AAAAMMDD]_[HH].gz
- Parquet:
[Tipo][ID de red][AAAAMMDD]_[HH]-[Índice de partición]-de-[Cantidad total de particiones].parquet
AAAAMMDD
corresponde al año, el mes y el día.HH
corresponde a la hora de inicio en formato de 24 horas.La hora (01, 02, 03) que integra cada nombre de archivo está expresada según la zona horaria del Pacífico. Sin embargo, las marcas de tiempo de los archivos de Transferencia de datos permiten que los publicadores vean los datos expresados según la zona horaria específica de su red. Tenga en cuenta esta diferencia cuando calcule la entrega de archivos.
[Índice de partición]
: Indica en qué partición se encuentra el archivo en relación con la cantidad total de archivos (particiones) creados, a partir de cero.[Cantidad total de particiones]
es la cantidad de archivos (particiones) que se usaron para crear el archivo
Archivos de Transferencia de datos en el proceso de solicitud de anuncio
Revise el siguiente gráfico para comprender los tipos de archivos de Transferencia de datos asociados con varias etapas del proceso de solicitud de anuncio.
Use los archivos de informe de Transferencia de datos
Una vez que haya configurado Transferencia de datos, los archivos se guardarán en los buckets de almacenamiento en la nube de Ad Manager. Puede acceder a ellos en la Web, con una herramienta de línea de comandos o mediante una API. Más información para acceder a los buckets de almacenamiento en la nube de Ad Manager
Si limita la transferencia y el análisis de datos a un conjunto específico de archivos de Transferencia de datos según la hora de inicio incluida en el nombre del archivo, es posible que se omitan los datos que se proporcionan en un archivo posterior debido al horario de verano, retrasos en la recopilación de datos o alguna otra situación similar. Un enfoque más eficaz es leer todos los archivos de Transferencia de datos en un sistema separado (como un almacén de datos o un motor de consultas) y restringir el análisis según la marca de tiempo de los eventos.
Los archivos de transferencia de datos están disponibles en dos formatos: CSV o Parquet.
Los usuarios pueden elegir CSV, Parquet o ambas opciones de salida para cada archivo. Parquet es el formato óptimo para los casos de uso y la transferencia de datos del almacén de datos, mientras que los archivos CSV se pueden usar en un editor de hojas de cálculo según el tamaño del archivo. A continuación, le proporcionamos algunos ejemplos de formas típicas en las que puede aplicar la información de Transferencia de datos:
- Agregación de eventos y actividades del usuario por dimensión (por ejemplo, por creatividad)
- Cálculo de las conversiones únicas en varios días
- Coincidencia de los usuarios con una base de datos de clientes
- Elaboración de informes sobre la información geográfica y demográfica del usuario
Puede usar las tablas de coincidencias a fin de asociar los nombres a los ID para los valores incluidos en los archivos de Transferencia de datos. De este modo, podrá hacer coincidir la información de publicación de anuncios (como la unidad de anuncios o la línea de pedido) con los valores asignados previamente que están almacenados en la base de datos.
Guardar archivos localmente
Como regla general, cada evento utiliza entre 25 y 35 bytes en un archivo comprimido. Por lo tanto, 10 millones de impresiones requerirían alrededor de 300 MB de espacio en disco en un archivo CSV comprimido. Es probable que veas tamaños de archivo más pequeños con el formato de salida Parquet. Tenga en cuenta que estas son estimaciones y que el archivo podría ser más grande. Además, como este es el tamaño de los datos cuando están comprimidos, necesita espacio adicional para descomprimir y usar los archivos.
Los archivos de Transferencia de datos con una antigüedad superior a 60 días se borran definitivamente de Ad Manager. Si desea almacenar sus archivos por más de los 60 días asignados, le recomendamos que los almacene localmente o que los traslade a una solución de almacenamiento en la nube permanente (por ejemplo, una cuenta independiente de Google Cloud Storage sobre la que tenga control total).
Más información sobre el Servicio de transferencia de datos de BigQuery
Facilite el procesamiento de los archivos grandes de Transferencia de datos
Google Code lanzó un kit de herramientas de código abierto llamado CRUSH (Custom Reporting Utilities for Shell) que permite procesar datos de texto delimitado desde la línea de comandos o en secuencias de comandos de shell. Las herramientas CRUSH se sometieron a un exhaustivo proceso de desarrollo y pruebas, y funcionan mejor en los sistemas operativos Linux o Unix. La comunidad de código abierto ofrece asistencia para CRUSH.
Una alternativa que no utiliza código abierto es DMX, un software de integración de datos desarrollado por Syncsort.