Conjunto de datos
Usaremos un conjunto de datos público gratuito de big query para hacer el caso práctico.
Diccionario de los datos
https://console.cloud.google.com/marketplace/product/bigquery-public-datasets/google-search-trends?hl=es-419&inv=1&invt=Abtm6Q&project=airy-timing-281514
- term - Cadena de texto (STRING): Nombre del término o palabra clave (por ejemplo, "Acme Inc").
- dma_name - Cadena de texto (STRING): Nombre completo del Área de Mercado Designada (DMA).
- dma_id - Número entero (INT): ID numérico de 3 dígitos utilizado para identificar una DMA.
- week - Fecha (DATE): Primer día de la semana para los datos correspondientes al término, DMA y score.
- refresh_date - Fecha (DATE): Fecha en la que se actualizó la combinación de término, score y DMA.
- score - Número entero (INT): Índice de 0 a 100 que indica la popularidad de un término en una DMA durante una fecha específica, comparado con otras fechas para ese término.
- rank - Número entero (INT): Clasificación numérica que muestra la posición del término en comparación con otros términos populares en el mercado de EE.UU. (por ejemplo, un rango de 1 a 25).
Análisis Exploratorio Previo
1️⃣ ¿Cuántos registros hay en el dataset?
👉 Consulta: Usamos COUNT(*)
para ver el volumen de datos disponible.
SELECT COUNT(*) AS total_registros
FROM `bigquery-public-data.google_trends.top_terms`;
2️⃣ ¿Cuál es el rango de fechas disponible en la tabla?
👉 Consulta: Encontramos la fecha más antigua y la más reciente.
SELECT MIN(week) AS fecha_inicio, MAX(week) AS fecha_fin
FROM `bigquery-public-data.google_trends.top_terms`;