Google BigQuery

En este artículo se describe cómo conectar Tableau a Google BigQuery y cómo configurar la fuente de datos.

Nota: algunas de las funcionalidades y personalizaciones que se enumeran en este artículo no son compatibles con Tableau Prep Builder. Para obtener más información sobre la conexión de datos en Prep Builder, consulte Conectarse a datos(El enlace se abre en una ventana nueva).

Antes de empezar

Antes de empezar, recopile esta información de conexión:

  • Correo electrónico o teléfono y contraseña de Google BigQuery

 

Recomendación

Configure un cliente OAuth personalizado para usar las políticas de TI de su empresa

Puede controlar completamente su configuración de OAuth de acuerdo con sus propias políticas de TI con un cliente de OAuth personalizado. La opción de usar su propio cliente OAuth lo libera de estar atado a los ciclos de lanzamiento de Tableau y al programa de rotación de clientes OAuth de Tableau. Para obtener información sobre cómo configurar su propio cliente OAuth, consulte Configurar OAuth personalizado para un sitio.

Establecer la conexión y configurar la fuente de datos

Nota: Para usar las credenciales de la cuenta de servicio para una nueva fuente de datos de Google BigQuery, la conexión debe crearse en Tableau Desktop.

  1. Inicie Tableau y, en Conectar, seleccione Google BigQuery.

    Complete una de las siguientes dos opciones para continuar.

     

    Opción 1:

    1. En Autenticación, seleccione Iniciar sesión con OAuth.
    2. Haga clic en Iniciar sesión.
    3. Especifique su contraseña para continuar.
    4. Seleccione Aceptar para que Tableau pueda acceder a sus datos de Google BigQuery. Se le pedirá que cierre el navegador.

     

     

    Opcion 2:

    Sugerencia: si usa Tableau Server o Tableau Cloud para publicar, debe comenzar al iniciar sesión en el producto que está usando y luego añadir sus credenciales guardadas de Google BigQuery en la configuración de la cuenta. Esto evitará un "Error de credenciales no válidas".

    1. En Autenticación, seleccione Iniciar sesión con el archivo de cuenta de servicio (JSON).
    2. Indique la ruta del archivo o use el botón Examinar para buscarlo.
    3. Haga clic en Iniciar sesión.
    4. Especifique su contraseña para continuar.
    5. Seleccione Aceptar para que Tableau pueda acceder a sus datos de Google BigQuery. Se le pedirá que cierre el navegador.
  2.  

  3. En la página de la fuente de datos, haga lo siguiente:

    1. (Opcional) Seleccione el nombre predeterminado de la fuente de datos en la parte superior de la página y luego escriba un nombre único para su uso en Tableau. Por ejemplo, utilice una nomenclatura de fuente de datos que ayude a que los demás usuarios de la fuente de datos puedan deducir a qué fuente de datos deben conectarse.

    2. (Opcional) En la lista desplegable Proyecto de facturación, seleccione un proyecto de facturación. Si no selecciona un proyecto de facturación, aparece EmptyProject en el campo después de haber seleccionado los campos restantes.

    3. Seleccione un proyecto en la lista desplegable Proyecto. También puede seleccionar publicdata para conectarse a datos de ejemplo en BigQuery.

    4. Seleccione un conjunto de datos en la lista desplegable Conjunto de datos.

    5. En Tabla, seleccione una tabla.

      Use SQL personalizado para conectarse a una consulta específica, en lugar de conectarse a toda la fuente de datos. Para obtener más información, consulte Conectarse a una consulta de SQL personalizada.

Notas:
Google BigQuery ha cambiado la compatibilidad de BigQuery de SQL heredado (BQL) a SQL estándar. Sus libros de trabajo se actualizarán para admitir SQL estándar cuando los abra en Tableau.
- Debido al gran volumen de datos de BigQuery, Tableau recomienda conectarse en tiempo real.
- La función Radians() no es compatible con Google BigQuery.

Utilizar atributos de personalización para mejorar el rendimiento de las consultas

Nota: Los atributos de personalización no se admiten actualmente en Tableau Prep Builder.

Puede utilizar los atributos de personalización para mejorar el rendimiento de los conjuntos de resultados de gran tamaño que indica BigQuery a Tableau Cloud y Tableau Server, así como en Tableau Desktop.

Puede incluir estos atributos en el libro de trabajo o fuente de datos publicada, siempre y cuando especifique los atributos antes de publicar el libro de trabajo o la fuente de datos en Tableau Cloud o Tableau Server.

Utilizar los atributos de personalización de Google BigQuery

Los atributos de personalización aceptan los valores enteros y afectan tanto a las consultas en tiempo real como a las actualizaciones de extractos de la conexión especificada.

Los siguientes atributos permiten aumentar en gran medida el rendimiento de los conjuntos de resultados de gran tamaño:

bq-fetch-tasksNúmero de tareas de fondo paralelas que se utilizan al recuperar datos mediante HTTP. El valor predeterminado es 10.
bq-large-fetch-rows

Número de filas que se recuperan en cada lote de consultas de gestión de colas. El valor predeterminado es 50 000.

También están disponibles los siguientes atributos, que se utilizan en las consultas pequeñas:

bq-fetch-rowsNúmero de filas que se recuperan en cada lote de consultas que no son de gestión de colas. El valor predeterminado es 10 000.
bq-response-rowsNúmero de filas indicadas en consultas que no son de gestión de colas ni de lotes. El valor predeterminado es 10 000.

Esta opción de funcionalidad acepta los valores "yes" y "no" y puede resultar útil durante las pruebas:

CAP_BIGQUERY_FORCE_SPOOL_JOBObliga a todas las consultas a utilizar el método de las tablas temporales. El valor predeterminado es “no.” Cámbielo a “yes” para activar este atributo.

Cómo indica Tableau las filas de Google BigQuery

Tableau emplea dos métodos para indicar filas desde BigQuery: el método predeterminado sin gestión de colas y el método de tablas temporales (gestión de colas):

  • En el primer intento, las consultas se ejecutan mediante la consulta predeterminada sin gestión de colas, que utiliza la opción bq-fetch-rows.

  • Si el conjunto de resultados es demasiado grande, la API de BigQuery indica un error y el conector de BigQuery de Tableau vuelve a intentar a efectuar la consulta guardando los resultados en una tabla temporal de BigQuery. El conector de BigQuery lleva a cabo una lectura de dicha tabla temporal, que es un trabajo de gestión de colas que utiliza la opción bq-large-fetch-rows.

Cómo especificar los atributos

Puede especificar los atributos de dos maneras: en un archivo .tdc de personalización de fuentes de datos de Tableau o en el XML del libro de trabajo o de la fuente de datos.

Especificar los atributos en un archivo .tdc

Para especificar los atributos de personalización durante una operación de publicación de un libro de trabajo o una fuente de datos desde Tableau Desktop, siga estos pasos:

  1. Cree un archivo XML que contenga los atributos de personalización.

  2. Guarde el archivo con la extensión .tdc , por ejemplo, BigQueryCustomization.tdc.

  3. Guarde el archivo en la carpeta My Tableau Repository\Datasources.

Tableau Server lee e incluye los atributos de personalización de archivos .tdc en el momento de publicar el libro de trabajo o la fuente de datos en Tableau Cloud o Tableau Server.

Importante: Tableau no hace pruebas con archivos TDC ni los admite. Estos archivos se deben usar como una herramienta para explorar o para tratar algunos problemas ocasionales que tenga con la conexión de datos. La creación y el mantenimiento de archivos TDC hace necesario editar con cuidado, y no se permite compartir dichos archivos.

Ejemplo de un archivo .tdc con las opciones recomendadas para extractos grandes
<connection-customization class='bigquery' enabled='true' version='8.0' >
  <vendor name='bigquery' />
  <driver name='bigquery' />
  <customizations>
    <customization name='bq-fetch-tasks' value='10' />
    <customization name='bq-large-fetch-rows' value='10000' />
  </customizations>
</connection-customization>

Incrustar atributos manualmente en el XML del archivo del libro de trabajo o la fuente de datos

Puede incrustar manualmente los atributos de personalización en la categoría "connection" del archivo workbook.twb o del archivo .tds de la fuente de datos. En el siguiente ejemplo, los atributos de personalización de BigQuery aparecen en negrita para que sean más fáciles de ver.

Ejemplo de atributos incrustados manualmente

<connection CATALOG='publicdata' EXECCATALOG='some-project-123' REDIRECT_URI='some-url:2.0:oob' SCOPE='https://www.googleapis.com/auth/bigquery https://www.googleapis.com/auth/userinfo.profile https://www.googleapis.com/auth/userinfo.email' authentication='yes' bq-fetch-tasks='10' bq-large-fetch-rows='10000'bq_schema='samples' class='bigquery' connection-dialect='google-bql' connection-protocol='native-api' login_title='Sign in to Google BigQuery' odbc-connect-string-extras='' project='publicdata' schema='samples' server='googleapis.com/bigquery' server-oauth='' table='wikipedia' username=''>

Comprobar si el libro de trabajo usa SQL estándar o anterior

En 2016, Google actualizó las API de BigQuery para admitir SQL estándar además de BigQuery SQL (que ahora se llama SQL heredado). A partir de Tableau 10.1, el conector Google BigQuery se ha actualizado para admitir SQL estándar y aún sigue admitiendo SQL heredado. SQL estándar permite a los usuarios del conector BigQuery emplear expresiones de nivel de detalle, obtener una validación de metadatos más rápida y seleccionar un proyecto de facturación con la conexión.

Ahora, al crear un libro de trabajo nuevo, Tableau admite SQL estándar de forma predeterminada. Tableau también admite SQL heredado usando la opción Use Legacy SQL del panel Datos. Por ejemplo, al abrir un libro de trabajo que se creó con una versión anterior de Tableau Desktop y si el libro de trabajo utiliza SQL heredado, se selecciona la opción Usar SQL heredado.

La opción Usar SQL heredado se puede configurar por los siguientes motivos:

  • Tiene un libro de trabajo que desea actualizar para utilizar SQL estándar con el objetivo de escribir expresiones de nivel de detalle o aprovechar otras mejoras. En este caso, compruebe que la opción Usar SQL heredado no esté seleccionada.

  • Va a crear un libro de trabajo que se tiene que conectar a una vista de SQL heredada. Dado que no puede combinar SQL heredado con SQL estándar, debe seleccionar la casilla de verificación Usar SQL heredado para que el libro de trabajo funcione.

En Google BigQuery, las vistas se escriben en SQL estándar o en SQL heredado. Puede combinar vistas escritas en SQL estándar con vistas escritas en SQL estándar y viceversa, así como combinar cualquier versión de SQL con una tabla. No obstante, no se pueden combinar en un libro de trabajo vistas escritas en SQL estándar y vistas escritas en SQL heredado. Al combinar vistas, debe marcar la casilla de verificación Usar SQL heredado para que se corresponda con el tipo de SQL utilizado en la vista a la que se va a conectar.

Nota: Tableau Desktop impone ciertas limitaciones al trabajar con datos anidados cuando se usa SQL heredado o estándar. Por ejemplo, si una tabla contiene datos anidados y está utilizando SQL heredado o SQL estándar, Actualizar ahora no funcionará en la página de fuente de datos.

Para obtener más información sobre cómo migrar del SQL anterior al SQL estándar, consulte Migrar desde SQL anterior(El enlace se abre en una ventana nueva) en el sitio web de la Plataforma en la nube de Google.

Usar BigQuery BI Engine para analizar datos

Puede usar BigQuery BI Engine para realizar servicios de análisis rápidos y de baja latencia y análisis interactivos con informes y dashboards respaldados por BigQuery. Para obtener más información, incluidas instrucciones sobre cómo integrar BigQuery BI Engine con Tableau, consulte Analizar datos de BigQuery mediante BI Engine y Tableau en la documentación de Google.

Solucionar problemas de Google BigQuery

Conexiones a varias cuentas

Al usar la creación web o publicar en Internet, no puede usar varias cuentas de Google BigQuery en el mismo libro de trabajo. Puede tener varias conexiones de cuentas de Google BigQuery en Tableau Desktop.

Al publicar flujos, las credenciales que utiliza para conectarse a Google BigQuery en el paso de entrada deben coincidir con las credenciales configuradas en la pestaña Configuración de la página Configuración de mi cuenta para Google BigQuery en Tableau Server o Tableau Cloud. Si selecciona unas credenciales diferentes o ninguna en la configuración de autenticación al publicar el flujo, este fallará y se producirá un error de autenticación hasta que edite la conexión para el flujo en Tableau Server o Tableau Cloud para que coincida con esas credenciales.

Creación web con Internet Explorer 11 y Edge

En Internet Explorer 11 y Edge, no puede acceder a un servidor usando una conexión no segura (http). Use una conexión segura (https) o cambie a otro navegador.

Consulte también

¡Gracias por sus comentarios!Sus comentarios se han enviado correctamente. ¡Gracias!