Spark SQL

En este artículo se describe cómo conectar Tableau a una base de datos de Spark SQL y cómo configurar la fuente de datos. Tableau se puede conectar a Spark versión 1.2.1 y posteriores.

Puede usar el conector Spark SQL para conectarse a un clúster Spark en Azure HDInsight, Azure Data Lake, Databricks o Apache Spark.

Antes de empezar

Antes de empezar, recopile esta información de conexión:

  • Nombre del servidor donde se hospeda la base de datos a la que desea conectarse y número de puerto
  • Método de autenticación:
    • Sin autenticación
    • Kerberos
    • Nombre de usuario
    • Nombre de usuario y contraseña
    • Servicio de Microsoft Azure HDInsight
  • Transporte. Las elecciones que haga dependerán del método de autenticación que elija y pueden incluir los datos siguientes:
    • Binario
    • SASL
    • HTTP
  • Credenciales de inicio de sesión. Las elecciones dependen del método de autenticación que elija y pueden incluir los datos siguientes:
    • Nombre de usuario
    • Contraseña
    • Dominio
    • FQDN de host
    • Nombre del servicio
    • Ruta HTTP
  • ¿Va a conectarse a un servidor SSL?
  • (Opcional) La instrucción SQL inicial se ejecuta cada vez que Tableau se conecta

Controlador necesario

Este conector necesita un controlador para comunicarse con la base de datos. Es posible que ya tenga el controlador necesario instalado en el equipo. Si el controlador no está instalado en el equipo, Tableau muestra un mensaje en el cuadro de diálogo de conexión con un enlace a la página Descarga de controladores(El enlace se abre en una ventana nueva), donde podrá encontrar enlaces de controladores e instrucciones de instalación.

Establecer la conexión y configurar la fuente de datos

  1. Inicie Tableau y, en Conectar, seleccione Spark SQL. Para obtener una lista completa de conexiones de datos, seleccione Más en A un servidor. A continuación, siga estos pasos:

    1. Escriba el nombre del servidor que hospeda la base de datos y el número de puerto que desea usar.
    2. Conecte con la base de datos mediante SparkThriftServer. Observe que, aunque se facilitan las conexiones heredadas de SharkServer y SharkServer2, no son compatibles con Tableau.
    3. Seleccione el método de autenticación. Luego, en función de su selección, indique la información que se le solicite.
    4. Seleccione Iniciar sesión.
    • Si el servidor está protegido mediante contraseña y usted no se encuentra en un entorno Kerberos, deberá especificar el nombre de usuario y la contraseña.
    • Active la casilla de verificación Requerir SSL al conectarse a un servidor SSL.
    • (Opcional) Seleccione SQL inicial para especificar que se ejecute un comando SQL al inicio de cada conexión, por ejemplo, al abrir el libro de trabajo, actualizar un extracto, iniciar sesión en Tableau Server o publicar en Tableau Server. Para obtener más información, consulte Ejecutar SQL inicial.
  2. Si Tableau no puede establecer la conexión, compruebe que las credenciales sean correctas. Si sigue sin poder conectar, su equipo tiene problemas para encontrar el servidor. Póngase en contacto con el administrador de red o con el administrador de la base de datos.

  3. En la página de la fuente de datos, haga lo siguiente: 

    1. (Opcional) Seleccione el nombre predeterminado de la fuente de datos en la parte superior de la página y luego escriba un nombre único para su uso en Tableau. Por ejemplo, utilice una nomenclatura de fuente de datos que ayude a que los demás usuarios de la fuente de datos puedan deducir a qué fuente de datos deben conectarse.

    2. En la lista desplegable Esquema, seleccione el icono de búsqueda o bien escriba el nombre del esquema en el cuadro de texto, seleccione el icono de búsqueda y, luego, seleccione el esquema.
    3. En el cuadro de texto Tabla, seleccione el icono de búsqueda o bien escriba el nombre de la tabla, seleccione el icono de búsqueda, arrastre la tabla al lienzo y, por último, seleccione la pestaña de la hoja para iniciar el análisis.

      Use SQL personalizado para conectarse a una consulta específica, en lugar de conectarse a toda la fuente de datos. Para obtener más información, consulte Conectarse a una consulta de SQL personalizada.

Nota: A partir de la versión 2018.3, la autenticación Kerberos para Spark SQL admite la delegación. La delegación no está admitida en 2018.2 y anteriores, lo cual quiere decir que en versiones anteriores no puede utilizar Credenciales de Viewer como método de autenticación al publicar un libro de trabajo o una fuente de datos en Tableau Server; solo puede utilizar Cuenta Ejecutar como del servidor.

Iniciar sesión en un equipo Mac

Al usar Tableau Desktop en un Mac, cuando especifique el nombre de servidor para conectarse, use un nombre de dominio completamente calificado, como por ejemplo, mydb.test.ourdomain.lan, en lugar de un nombre de dominio relativo, como por ejemplo, mydb o mydb.test.

Como alternativa, puede añadir el dominio a la lista de dominios de búsqueda del equipo Mac para que, cuando se conecte, solo tenga que proporcionar el nombre del servidor. Para actualizar la lista de dominios de búsqueda, vaya a Preferencias del sistema > Red > Avanzada y, a continuación, abra la pestaña DNS.

 

Consulte también

¡Gracias por sus comentarios!