Google BigQuery

En este artículo se describe cómo conectar Tableau a Google BigQuery y cómo configurar la fuente de datos.

Antes de empezar

Antes de empezar, recopile esta información de conexión:

  • Correo electrónico o teléfono y contraseña de Google BigQuery

Establecer la conexión y configurar la fuente de datos

  1. Inicie Tableau y, en Conectar, seleccione Google BigQuery. Para obtener una lista completa de conexiones de datos, seleccione Más en A un servidor. En la pestaña en que Tableau se abre en el navegador predeterminado, haga lo siguiente:

    1. Inicie sesión en Google BigQuery con su correo electrónico o teléfono y luego seleccione Siguiente para escribir la contraseña. Si aparecen varias cuentas, seleccione la que tenga los datos de Google BigQuery a los que quiere acceder y escriba la contraseña si todavía no ha iniciado sesión.

    2. Seleccione Aceptar para que Tableau pueda acceder a sus datos de Google BigQuery.

    3. Cierre la ventana del navegador cuando se le indique.

  2. En la página de la fuente de datos, haga lo siguiente:

    1. (Opcional) Seleccione el nombre predeterminado de la fuente de datos en la parte superior de la página y luego escriba un nombre único para su uso en Tableau. Por ejemplo, utilice una nomenclatura de fuente de datos que ayude a que los demás usuarios de la fuente de datos puedan deducir a qué fuente de datos deben conectarse.

    2. (Opcional) En la lista desplegable Proyecto de facturación, seleccione un proyecto de facturación. Si no selecciona un proyecto de facturación, aparece EmptyProject en el campo después de haber seleccionado los campos restantes.

    3. Seleccione un proyecto en la lista desplegable Proyecto. También puede seleccionar publicdata para conectarse a datos de ejemplo en BigQuery.

    4. Seleccione un conjunto de datos en la lista desplegable Conjunto de datos.

    5. En Tabla, seleccione una tabla.

      Use SQL personalizado para conectarse a una consulta específica, en lugar de conectarse a toda la fuente de datos. Para obtener más información, consulte Conectarse a una consulta de SQL personalizada.

Notas:
Google BigQuery ha cambiado la compatibilidad de BigQuery de SQL heredado (BQL) a SQL estándar. Sus libros de trabajo se actualizarán para admitir SQL estándar cuando los abra en Tableau.
- Debido al gran volumen de datos de BigQuery, Tableau recomienda conectarse en tiempo real.
- La función Radians() no es compatible con Google BigQuery.

Utilizar atributos de personalización para mejorar el rendimiento de las consultas

Nota: los atributos de personalización no se admiten actualmente en Tableau Prep Builder.

Puede utilizar los atributos de personalización para mejorar el rendimiento de los conjuntos de resultados de gran tamaño que indica BigQuery a Tableau Online y Tableau Server, así como en Tableau Desktop.

Puede incluir estos atributos en el libro de trabajo o fuente de datos publicada, siempre y cuando especifique los atributos antes de publicar el libro de trabajo o la fuente de datos en Tableau Online o Tableau Server.

Utilizar los atributos de personalización de Google BigQuery

Los atributos de personalización aceptan los valores enteros y afectan tanto a las consultas en tiempo real como a las actualizaciones de extractos de la conexión especificada.

Los siguientes atributos permiten aumentar en gran medida el rendimiento de los conjuntos de resultados de gran tamaño:

bq-fetch-tasks Número de tareas de fondo paralelas que se utilizan al recuperar datos mediante HTTP. El valor predeterminado es 10.
bq-large-fetch-rows

Número de filas que se recuperan en cada lote de consultas de gestión de colas. El valor predeterminado es 50 000.

También están disponibles los siguientes atributos, que se utilizan principalmente en las consultas pequeñas:

bq-fetch-rows Número de filas que se recuperan en cada lote de consultas que no son de gestión de colas. El valor predeterminado es 10 000.
bq-response-rows Número de filas indicadas en consultas que no son de gestión de colas ni de lotes. El valor predeterminado es 10 000.

Esta opción de funcionalidad acepta los valores "yes" y "no" y puede resultar útil durante las pruebas:

CAP_BIGQUERY_FORCE_SPOOL_JOB Obliga a todas las consultas a utilizar el método de las tablas temporales. El valor predeterminado es “no.” Cámbielo a “yes” para activar este atributo.

Cómo indica Tableau las filas de Google BigQuery

Tableau emplea dos métodos para indicar filas desde BigQuery: el método predeterminado sin gestión de colas y el método de tablas temporales (gestión de colas):

  • En el primer intento, las consultas se ejecutan mediante la consulta predeterminada sin gestión de colas, que utiliza la opción bq-fetch-rows.

  • Si el conjunto de resultados es demasiado grande, la API de BigQuery indica un error y el conector de BigQuery de Tableau vuelve a intentar a efectuar la consulta guardando los resultados en una tabla temporal de BigQuery. El conector de BigQuery lleva a cabo una lectura de dicha tabla temporal, que es un trabajo de gestión de colas que utiliza la opción bq-large-fetch-rows.

Cómo especificar los atributos

Puede especificar los atributos de dos maneras: en un archivo .tdc de personalización de fuentes de datos de Tableau o en el XML del libro de trabajo o de la fuente de datos.

Especificar los atributos en un archivo .tdc

Para especificar los atributos de personalización durante una operación de publicación de un libro de trabajo o una fuente de datos desde Tableau Desktop, siga estos pasos:

  1. Cree un archivo XML que contenga los atributos de personalización.

  2. Guarde el archivo con la extensión .tdc , por ejemplo, BigQueryCustomization.tdc.

  3. Guarde el archivo en la carpeta My Tableau Repository\Datasources.

Tableau Server lee e incluye los atributos de personalización del archivo .tdc en el momento de publicar el libro de trabajo o la fuente de datos en Tableau Online o Tableau Server.

Importante: Tableau no hace pruebas con archivos TDC ni los admite. Estos archivos se deben usar como una herramienta para explorar o para tratar algunos problemas ocasionales que tenga con la conexión de datos. La creación y el mantenimiento de archivos TDC hace necesario editar con cuidado, y no se permite compartir dichos archivos.

Ejemplo de un archivo .tdc con las opciones recomendadas para extractos grandes
<connection-customization class='bigquery' enabled='true' version='8.0' >
  <vendor name='bigquery' />
  <driver name='bigquery' />
  <customizations>
    <customization name='bq-fetch-tasks' value='10' />
    <customization name='bq-large-fetch-rows' value='10000' />
  </customizations>
</connection-customization>

Incrustar atributos manualmente en el XML del archivo del libro de trabajo o la fuente de datos

Puede incrustar manualmente los atributos de personalización en la etiqueta "connection" del archivo .twb del libro de trabajo o del archivo .tds de la fuente de datos. En el siguiente ejemplo, los atributos de personalización de BigQuery aparecen en negrita para que sean más fáciles de ver.

Ejemplo de atributos incrustados manualmente

<connection CATALOG='publicdata' EXECCATALOG='some-project-123' REDIRECT_URI='some-url:2.0:oob' SCOPE='https://www.googleapis.com/auth/bigquery https://www.googleapis.com/auth/userinfo.profile https://www.googleapis.com/auth/userinfo.email' authentication='yes' bq-fetch-tasks='10' bq-large-fetch-rows='10000' bq_schema='samples' class='bigquery' connection-dialect='google-bql' connection-protocol='native-api' login_title='Sign in to Google BigQuery' odbc-connect-string-extras='' project='publicdata' schema='samples' server='googleapis.com/bigquery' server-oauth='' table='wikipedia' username=''>

Comprobar si el libro de trabajo usa SQL estándar o anterior

En 2016, Google actualizó las API de BigQuery para admitir SQL estándar además de BigQuery SQL (que ahora se llama SQL heredado). A partir de Tableau 10.1, el conector Google BigQuery se ha actualizado para admitir SQL estándar y aún sigue admitiendo SQL heredado. SQL estándar permite a los usuarios del conector BigQuery emplear expresiones de nivel de detalle, obtener una validación de metadatos más rápida y seleccionar un proyecto de facturación con la conexión.

Ahora, al crear un libro de trabajo nuevo, Tableau admite SQL estándar de forma predeterminada. Tableau también admite SQL heredado usando la opción Use Legacy SQL del panel Datos. Por ejemplo, al abrir un libro de trabajo que se creó con una versión anterior de Tableau Desktop y si el libro de trabajo utiliza SQL heredado, se selecciona la opción Usar SQL heredado.

La opción Usar SQL heredado se puede configurar por los siguientes motivos:

  • Tiene un libro de trabajo que desea actualizar para utilizar SQL estándar con el objetivo de escribir expresiones de nivel de detalle o aprovechar otras mejoras. En este caso, compruebe que la opción Usar SQL heredado no esté seleccionada.

  • Va a crear un libro de trabajo nuevo que se tiene que conectar a una vista de SQL heredada. Dado que no puede combinar SQL heredado con SQL estándar, debe seleccionar la casilla de verificación Usar SQL heredado para que el libro de trabajo funcione.

En Google BigQuery, las vistas se escriben en SQL estándar o en SQL heredado. Puede combinar vistas escritas en SQL estándar con vistas escritas en SQL estándar y viceversa, así como combinar cualquier versión de SQL con una tabla. No obstante, no se pueden combinar en un libro de trabajo vistas escritas en SQL estándar y vistas escritas en SQL heredado. Al combinar vistas, debe marcar la casilla de verificación Usar SQL heredado para que se corresponda con el tipo de SQL utilizado en la vista a la que se va a conectar.

Nota: Tableau Desktop impone ciertas limitaciones al trabajar con datos anidados cuando se usa SQL heredado o estándar. Por ejemplo, si una tabla contiene datos anidados y está utilizando SQL heredado o SQL estándar, Actualizar ahora no funcionará en la página de fuente de datos.

Para obtener más información sobre cómo migrar del SQL anterior al SQL estándar, consulte Migrar desde SQL anterior(Link opens in a new window) en el sitio web de la Plataforma en la nube de Google.

Solucionar problemas de Google BigQuery

Conexiones a varias cuentas

Al usar la creación web o publicar en Internet, no puede usar varias cuentas de Google BigQuery en el mismo libro de trabajo. Puede tener varias conexiones de cuentas de Google BigQuery en Tableau Desktop.

Al publicar flujos, las credenciales que utiliza para conectarse a Google BigQuery en el paso de entrada deben coincidir con las credenciales configuradas en la pestaña Configuración de la página Configuración de mi cuenta para Google BigQuery en Tableau Server o Tableau Online. Si selecciona unas credenciales diferentes o ninguna en la configuración de autenticación al publicar el flujo, este fallará y se producirá un error de autenticación hasta que edite la conexión para el flujo en Tableau Server o Tableau Online para que coincida con esas credenciales.

Creación web con Internet Explorer 11 y Edge

En Internet Explorer 11 y Edge, no puede acceder a un servidor usando una conexión no segura (http). Use una conexión segura (https) o cambie a otro navegador.

Consulte también

¡Gracias por sus comentarios!