Amazon S3

本文介紹如何將 Tableau 連線無驅動程式 Amazon S3 連接器並設定資料來源。

開始前

開始前,請收集以下連線資訊:

  • 您的 S3 貯體的 AWS 區域。

  • S3 貯體名稱。

  • 您的 S3 貯體的 AWS IAM 存取金輪(金輪 ID 和秘密存取金輪)。

權限

確保 AWS IAM 使用者具有對 S3 儲存貯體的讀取權限。

推薦設定

以下建議有助於增加效能。

  • 如果該用戶端在 AWS 環境中執行(例如,安裝在 EC2 執行個體中的 Tableau Desktop 或 Server 或使用 Tableau Cloud),則可以實現最佳效能。
  • 跨區域貯體驅動程式有效,但效能會比同區域存取差。資料出口費可能會產生額外支出。

進行連線並設定資料來源

  1. 啟用 Tableau,然後在「連線」下,從其他連接器清單中選取 Amazon S3
  2. 選取「安裝並重新啟動 Tableau」以安裝該連接器。
  3. Tableau 重新啟動後,移至「連線」,然後從已安裝連接器清單中選取「Amazon S3 」
  4. 輸入您的貯體區域、貯體名稱、存取金輪 ID 和秘密存取金輪。
  5. 選取「登入」
  6. 在貯體的內容中選取要連線的檔案。
  7. 選取「連線」。

設定資料來源

完成以下步驟以設定資料來源。

  1. (可選)在頁面頂部選取預設資料來源名稱。
  2. 輸入在 Tableau 中使用的唯一資料來源名稱。
  3. 將要連線的一個或多個檔案從左窗格拖到畫布中。
  4. 要開始分析,請選取「工作表 1」索引標籤。

聯集資料

您可以聯集 S3 貯體中的檔案。有關聯集的詳情,請參閱聯集資料。要執行包含子資料夾中檔案的萬用字元聯集,根資料夾或貯體必須至少有一個檔案(與子資料夾中包含的檔案的結構相匹配)才能包含在聯集中。該檔案是建立聯集聯合時連線到的第一個檔案。

已知問題和限制

以下部分介紹了可能影響您使用 Amazon S3 連接器的成功程度的已知問題和限制。

附註:Tableau Prep Web 製作或虛擬連線當前不支援此連接器。

驗證已知問題和限制
  • 僅支援不含工作階段權杖的 Amazon IAM 嘉實優質秘密金輪/存取金輪驗證。

發佈已知問題和限制
  • 工作簿和資料來源必須使用「嵌入密碼」驗證選項進行發佈。目前不支援「提示使用者」。

聯集已知問題和限制
  • 僅 Tableau Desktop 支援萬用字元聯集。
  • Web 製作僅驅動程式使用者定義的手動聯集(拖動檔案)。
檔案類型已知問題和限制
  • 目前支援 Parquet、.csv、壓縮的 .gz 和 Excel 檔案。
  • 根據設計,所有資料均以字串格式匯入。
  • 無法在單一連線中跨多種檔案類型進行聯集或聯結(例如,Parquet 和 .csv 在一起時)。
  • 目前僅支援逗號分隔的 .csv 檔案。
  • 檔案大小限制為 15GB。
  • 聯結或聯集的累積結果集不能超過 15gb。
  • 由於連接器中 Excel 檔案解析器的效能問題,Excel 檔案目前不能超過約 100 mb。
其他 Parquet 檔案已知問題和限制
  • Parquet 檔案必須採用我們 超級 API 文檔中描述的格式。
  • 不支援巢狀行及因此產生的巢狀類型「藍圖」與「清單」。
  • 不支援 BSON、UUID 和 ENUM 類型。
  • 不支援沒有任何邏輯或轉換類型的物理類型 FIXED_LEN_BYTE_ARRAY。
  • DECIMAL 類型最多僅支援 8 位字元(18 個十進制數字)。如果需要超過 18 位十進制數字,請考慮使用 double。
  • 不支援 TIME_MILLIS 和 TIME_NANOS 類型。考慮使用 TIME_MICROS 取代。
  • 不支援已棄用的 BIT_PACKED 編碼。最近的 Parquet 檔案不應使用此編碼,因為它已棄用超過五年。
  • 不支援 DELTA_LENGTH_BYTE_ARRAY 編碼和最近的 BYTE_STREAM_SPLIT 編碼,因為它們不是由任何庫編寫的。如果您遇到任何使用這些編碼的 Parquet 檔案,請告訴我們。
  • 支援的壓縮包括 SNAPPY、GZIP、ZSTD 和 LZ4_RAW。

另請參閱