Amazon S3
Questo articolo descrive come connettere Tableau al connettore senza driver Amazon S3 e impostare l’origine dati.
Prima di iniziare, raccogli le seguenti informazioni di connessione:
La regione AWS del bucket S3.
Il nome del bucket S3.
La chiave di accesso IAM di AWS per il bucket S3 (ID chiave e chiave di accesso segreta).
Autorizzazioni
Assicurati che il tuo utente IAM di AWS disponga delle autorizzazioni di lettura per il bucket S3.
Suggerimenti
I seguenti suggerimenti possono contribuire a migliorare le prestazioni.
- Le prestazioni ottimali si ottengono se il client è in esecuzione in un ambiente AWS (ad esempio, Tableau Desktop o Server installato in un’istanza EC2 o utilizzando Tableau Cloud).
- Il supporto per i bucket tra diverse regioni funziona, ma le prestazioni saranno inferiori rispetto all’accesso alla stessa regione. Potrebbero essere previsti costi aggiuntivi a causa delle tariffe per l’uscita dei dati.
Effettuare la connessione e impostare l’origine dati
- Avvia Tableau e, in Connetti, seleziona Amazon S3 dall’elenco di Connettori aggiuntivi.
- Seleziona Installa e riavvia Tableau per installare il connettore.
- Dopo il riavvio di Tableau, vai a Connetti, quindi seleziona Amazon S3 dall’elenco dei connettori installati.
- Inserisci la regione del bucket, il nome del bucket, l’ID della chiave di accesso e la chiave di accesso segreta.
- Seleziona Accedi.
- Nei contenuti del bucket seleziona un file a cui connetterti.
- Seleziona Connetti.
Impostare l’origine dati
Per impostare un’origine dati, completa le seguenti fasi.
- (Facoltativo) Seleziona il nome dell’origine dati predefinita nella parte superiore della pagina.
- Inserisci un nome di origine dati univoco da utilizzare in Tableau.
- Trascina nel canvas dal riquadro di sinistra uno o più file a cui desideri connetterti.
- Per avviare l’analisi, seleziona la scheda Foglio 1.
Unificare i dati
Puoi unificare i file dal bucket S3. Per maggiori informazioni sull’unificazione, consulta Unificare i dati. Per eseguire un’unificazione con caratteri jolly che includa i file nelle sottocartelle, la cartella radice o il bucket deve contenere almeno un file corrispondente alla struttura dei file contenuti nelle sottocartelle da includere nell’unificazione. Questo file è il primo file a cui ti connetti durante la creazione dell’unificazione.
Problemi noti e limitazioni
Nelle sezioni seguenti sono descritti i problemi noti e le limitazioni che possono influire sul corretto utilizzo del connettore Amazon S3.
Nota: questo connettore non è attualmente supportato nelle connessioni virtuali o nel Web authoring di Tableau Prep.
Problemi noti e limitazioni dell’autenticazione
È supportata solo l’autenticazione con chiave segreta/chiave di accesso dell’utente IAM di Amazon senza token di sessione.
Problemi noti e limitazioni della pubblicazione
Le cartelle di lavoro e le origini dati devono essere pubblicate utilizzando l’opzione di autenticazione “Password incorporata”. L’opzione “Avvisa utente” non è attualmente supportata.
Problemi noti e limitazioni dell’unificazione
- Solo Tableau Desktop supporta l’unificazione con caratteri jolly.
- Il Web authoring supporta solo l’unificazione manuale definita dall’utente (trascinamento dei file).
Problemi noti e limitazioni per il tipo di file
- Al momento sono supportati i file Parquet,.csv, .gz compressi ed Excel.
- Per impostazione predefinita, tutti i dati vengono importati in formato stringa.
- Non puoi unificare o creare un join di più tipi di file in un’unica connessione (ad esempio, Parquet e.csv insieme).
- Al momento sono supportati solo i file.csv delimitati da virgole.
- La dimensione massima di un file è 15 GB.
- Il set di risultati cumulativi di un join o di un’unificazione non può superare i 15 GB.
- I file Excel attualmente non possono avere una dimensione superiore a circa 100 MB, a causa di problemi di prestazioni del parser di file Excel nel connettore.
Ulteriori problemi noti e imitazioni per i file Parquet
- I file parquet devono essere nel formato descritto nella documentazione dell’API Hyper.
- Le colonne nidificate e quindi i tipi nidificati MAP e LIST non sono supportati.
- I tipi BSON, UUID ed ENUM non sono supportati.
- Il tipo fisico FIXED_LEN_BYTE_ARRAY senza alcun tipo logico o convertito non è supportato.
- Il tipo DECIMAL è supportato solo fino a 8 byte (18 cifre decimali). Prendi in considerazione l’utilizzo di double se hai bisogno di più di 18 cifre decimali.
- I tipi TIME_MILLIS e TIME_NANOS non sono supportati. Prendi in considerazione l’utilizzo di TIME_MICROS.
- La codifica BIT_PACKED deprecata non è supportata. Nessun file Parquet recente dovrebbe utilizzare questa codifica, poiché è deprecata da oltre cinque anni.
- La codifica DELTA_LENGTH_BYTE_ARRAY e la recente codifica BYTE_STREAM_SPLIT non sono supportate, poiché non sono scritte da alcuna libreria. Se dovessi riscontrare file Parquet che utilizzano queste codifiche, comunicacelo.
- Le compressioni supportate sono SNAPPY, GZIP, ZSTD e LZ4_RAW.
Vedi anche
- Impostare le origini dati, per aggiungere altri dati a questa origine dati o preparare i dati prima di analizzarli.
- Creazione di grafici e analisi dei dati, per iniziare l’analisi dei dati.
- Optimizing Your Amazon Redshift and Tableau Software Deployment for Better Performance(Il collegamento viene aperto in una nuova finestra) - White paper di Tableau (registrazione o accesso obbligatorio)
- Explore Big Data Analytics with Amazon Redshift(Il collegamento viene aperto in una nuova finestra) - Webinar su richiesta di Tableau (registrazione o accesso obbligatorio)