Amazon S3
本文介紹如何將 Tableau 連線無驅動程式 Amazon S3 連接器並設定資料來源。
開始前,請收集以下連線資訊:
您的 S3 貯體的 AWS 區域。
S3 貯體名稱。
您的 S3 貯體的 AWS IAM 存取金輪(金輪 ID 和秘密存取金輪)。
權限
確保 AWS IAM 使用者具有對 S3 儲存貯體的讀取權限。
推薦設定
以下建議有助於增加效能。
- 如果該用戶端在 AWS 環境中執行(例如,安裝在 EC2 執行個體中的 Tableau Desktop 或 Server 或使用 Tableau Cloud),則可以實現最佳效能。
- 跨區域貯體驅動程式有效,但效能會比同區域存取差。資料出口費可能會產生額外支出。
進行連線並設定資料來源
- 啟用 Tableau,然後在「連線」下,從其他連接器清單中選取 Amazon S3。
- 選取「安裝並重新啟動 Tableau」以安裝該連接器。
- Tableau 重新啟動後,移至「連線」,然後從已安裝連接器清單中選取「Amazon S3 」。
- 輸入您的貯體區域、貯體名稱、存取金輪 ID 和秘密存取金輪。
- 選取「登入」。
- 在貯體的內容中選取要連線的檔案。
- 選取「連線」。
設定資料來源
完成以下步驟以設定資料來源。
- (可選)在頁面頂部選取預設資料來源名稱。
- 輸入在 Tableau 中使用的唯一資料來源名稱。
- 將要連線的一個或多個檔案從左窗格拖到畫布中。
- 要開始分析,請選取「工作表 1」索引標籤。
聯集資料
您可以聯集 S3 貯體中的檔案。有關聯集的詳情,請參閱聯集資料。要執行包含子資料夾中檔案的萬用字元聯集,根資料夾或貯體必須至少有一個檔案(與子資料夾中包含的檔案的結構相匹配)才能包含在聯集中。該檔案是建立聯集聯合時連線到的第一個檔案。
已知問題和限制
以下部分介紹了可能影響您使用 Amazon S3 連接器的成功程度的已知問題和限制。
附註:Tableau Prep Web 製作或虛擬連線當前不支援此連接器。
驗證已知問題和限制
僅支援不含工作階段權杖的 Amazon IAM 嘉實優質秘密金輪/存取金輪驗證。
發佈已知問題和限制
工作簿和資料來源必須使用「嵌入密碼」驗證選項進行發佈。目前不支援「提示使用者」。
聯集已知問題和限制
- 僅 Tableau Desktop 支援萬用字元聯集。
- Web 製作僅驅動程式使用者定義的手動聯集(拖動檔案)。
檔案類型已知問題和限制
- 目前支援 Parquet、.csv、壓縮的 .gz 和 Excel 檔案。
- 根據設計,所有資料均以字串格式匯入。
- 無法在單一連線中跨多種檔案類型進行聯集或聯結(例如,Parquet 和 .csv 在一起時)。
- 目前僅支援逗號分隔的 .csv 檔案。
- 檔案大小限制為 15GB。
- 聯結或聯集的累積結果集不能超過 15gb。
- 由於連接器中 Excel 檔案解析器的效能問題,Excel 檔案目前不能超過約 100 mb。
其他 Parquet 檔案已知問題和限制
- Parquet 檔案必須採用我們 超級 API 文檔中描述的格式。
- 不支援巢狀行及因此產生的巢狀類型「藍圖」與「清單」。
- 不支援 BSON、UUID 和 ENUM 類型。
- 不支援沒有任何邏輯或轉換類型的物理類型 FIXED_LEN_BYTE_ARRAY。
- DECIMAL 類型最多僅支援 8 位字元(18 個十進制數字)。如果需要超過 18 位十進制數字,請考慮使用 double。
- 不支援 TIME_MILLIS 和 TIME_NANOS 類型。考慮使用 TIME_MICROS 取代。
- 不支援已棄用的 BIT_PACKED 編碼。最近的 Parquet 檔案不應使用此編碼,因為它已棄用超過五年。
- 不支援 DELTA_LENGTH_BYTE_ARRAY 編碼和最近的 BYTE_STREAM_SPLIT 編碼,因為它們不是由任何庫編寫的。如果您遇到任何使用這些編碼的 Parquet 檔案,請告訴我們。
- 支援的壓縮包括 SNAPPY、GZIP、ZSTD 和 LZ4_RAW。
另請參閱
- 最佳化 Amazon Redshift 與 Tableau Software 部署提高效能(連結在新視窗開啟) - Tableau 白皮書(需要註冊或登入)
- 使用 Amazon Redshift 瀏覽巨量資料分析(連結在新視窗開啟) - Tableau 點播網路研討會(需要註冊或登入)