Amazon S3

Questo articolo descrive come connettere Tableau al connettore senza driver Amazon S3 e impostare l’origine dati.

Prima di iniziare

Prima di iniziare, raccogli le seguenti informazioni di connessione:

  • La regione AWS del bucket S3.

  • Il nome del bucket S3.

  • La chiave di accesso IAM di AWS per il bucket S3 (ID chiave e chiave di accesso segreta).

Autorizzazioni

Assicurati che il tuo utente IAM di AWS disponga delle autorizzazioni di lettura per il bucket S3.

Suggerimenti

I seguenti suggerimenti possono contribuire a migliorare le prestazioni.

  • Le prestazioni ottimali si ottengono se il client è in esecuzione in un ambiente AWS (ad esempio, Tableau Desktop o Server installato in un’istanza EC2 o utilizzando Tableau Cloud).
  • Il supporto per i bucket tra diverse regioni funziona, ma le prestazioni saranno inferiori rispetto all’accesso alla stessa regione. Potrebbero essere previsti costi aggiuntivi a causa delle tariffe per l’uscita dei dati.

Effettuare la connessione e impostare l’origine dati

  1. Avvia Tableau e, in Connetti, seleziona Amazon S3 dall’elenco di Connettori aggiuntivi.
  2. Seleziona Installa e riavvia Tableau per installare il connettore.
  3. Dopo il riavvio di Tableau, vai a Connetti, quindi seleziona Amazon S3 dall’elenco dei connettori installati.
  4. Inserisci la regione del bucket, il nome del bucket, l’ID della chiave di accesso e la chiave di accesso segreta.
  5. Seleziona Accedi.
  6. Nei contenuti del bucket seleziona un file a cui connetterti.
  7. Seleziona Connetti.

Impostare l’origine dati

Per impostare un’origine dati, completa le seguenti fasi.

  1. (Facoltativo) Seleziona il nome dell’origine dati predefinita nella parte superiore della pagina.
  2. Inserisci un nome di origine dati univoco da utilizzare in Tableau.
  3. Trascina nel canvas dal riquadro di sinistra uno o più file a cui desideri connetterti.
  4. Per avviare l’analisi, seleziona la scheda Foglio 1.

Unificare i dati

Puoi unificare i file dal bucket S3. Per maggiori informazioni sull’unificazione, consulta Unificare i dati. Per eseguire un’unificazione con caratteri jolly che includa i file nelle sottocartelle, la cartella radice o il bucket deve contenere almeno un file corrispondente alla struttura dei file contenuti nelle sottocartelle da includere nell’unificazione. Questo file è il primo file a cui ti connetti durante la creazione dell’unificazione.

Problemi noti e limitazioni

Nelle sezioni seguenti sono descritti i problemi noti e le limitazioni che possono influire sul corretto utilizzo del connettore Amazon S3.

Nota: questo connettore non è attualmente supportato nelle connessioni virtuali o nel Web authoring di Tableau Prep.

Problemi noti e limitazioni dell’autenticazione
  • È supportata solo l’autenticazione con chiave segreta/chiave di accesso dell’utente IAM di Amazon senza token di sessione.

Problemi noti e limitazioni della pubblicazione
  • Le cartelle di lavoro e le origini dati devono essere pubblicate utilizzando l’opzione di autenticazione “Password incorporata”. L’opzione “Avvisa utente” non è attualmente supportata.

Problemi noti e limitazioni dell’unificazione
  • Solo Tableau Desktop supporta l’unificazione con caratteri jolly.
  • Il Web authoring supporta solo l’unificazione manuale definita dall’utente (trascinamento dei file).
Problemi noti e limitazioni per il tipo di file
  • Al momento sono supportati i file Parquet,.csv, .gz compressi ed Excel.
  • Per impostazione predefinita, tutti i dati vengono importati in formato stringa.
  • Non puoi unificare o creare un join di più tipi di file in un’unica connessione (ad esempio, Parquet e.csv insieme).
  • Al momento sono supportati solo i file.csv delimitati da virgole.
  • La dimensione massima di un file è 15 GB.
  • Il set di risultati cumulativi di un join o di un’unificazione non può superare i 15 GB.
  • I file Excel attualmente non possono avere una dimensione superiore a circa 100 MB, a causa di problemi di prestazioni del parser di file Excel nel connettore.
Ulteriori problemi noti e imitazioni per i file Parquet
  • I file parquet devono essere nel formato descritto nella documentazione dell’API Hyper.
  • Le colonne nidificate e quindi i tipi nidificati MAP e LIST non sono supportati.
  • I tipi BSON, UUID ed ENUM non sono supportati.
  • Il tipo fisico FIXED_LEN_BYTE_ARRAY senza alcun tipo logico o convertito non è supportato.
  • Il tipo DECIMAL è supportato solo fino a 8 byte (18 cifre decimali). Prendi in considerazione l’utilizzo di double se hai bisogno di più di 18 cifre decimali.
  • I tipi TIME_MILLIS e TIME_NANOS non sono supportati. Prendi in considerazione l’utilizzo di TIME_MICROS.
  • La codifica BIT_PACKED deprecata non è supportata. Nessun file Parquet recente dovrebbe utilizzare questa codifica, poiché è deprecata da oltre cinque anni.
  • La codifica DELTA_LENGTH_BYTE_ARRAY e la recente codifica BYTE_STREAM_SPLIT non sono supportate, poiché non sono scritte da alcuna libreria. Se dovessi riscontrare file Parquet che utilizzano queste codifiche, comunicacelo.
  • Le compressioni supportate sono SNAPPY, GZIP, ZSTD e LZ4_RAW.

Vedi anche