Amazon S3
この記事では、Tableau をドライバレスの Amazon S3 コネクタに接続し、データ ソースを設定する方法を説明します。
はじめる前に、次の接続情報を収集します。
S3 バケットの AWS リージョン。
S3 バケット名。
S3 バケットの AWS IAM アクセス キー (キー ID とシークレット アクセス キー)。
パーミッション
AWS の IAM ユーザーに S3 バケットの読み取り権限があることを確認してください。
推奨事項
次の推奨事項はパフォーマンスの向上に役立ちます。
- クライアントが AWS 環境で実行されている場合 (たとえば、EC2 インスタンスにインストールされた Tableau Desktop または Tableau Server、あるいは Tableau Cloud を使用している場合)、最適なパフォーマンスが得られます。
- クロスリージョン バケットのサポートは機能しますが、パフォーマンスは同一リージョン アクセスよりも悪くなります。データ送信に追加料金が発生する場合もあります。
接続してデータ ソースを設定する
- Tableau を起動して [接続] を開き、[追加コネクタ] のリストから [Amazon S3] を選択します。
- [Tableau のインストールと再起動] を選択し、コネクタをインストールします。
- Tableau を再起動したら [接続] を開き、インストール済みコネクタのリストから [Amazon S3 ] を選択します。
- バケット リージョン、バケット名、アクセス キー ID、シークレット アクセス キーを入力します。
- [サインイン] を選択します。
- バケットのコンテンツで、接続するファイルを選択します。
- [接続] を選択します。
データ ソースの設定
データ ソースを設定するには、次の手順を実行します。
- (オプション) ページの上部でデフォルトのデータ ソース名を選択します。
- Tableau で使用する一意のデータ ソース名を入力します。
- 接続したい 1 つまたは複数のファイルを、左側のペインからキャンバスにドラッグします。
- 分析を開始するには、[シート 1] のタブを選択します。
データのユニオン
S3 バケットからファイルをユニオンできます。ユニオンの詳細については、「データのユニオン」を参照してください。サブフォルダー内のファイルを含めるワイルドカード ユニオンを実行するには、ルート フォルダーまたはバケットに、サブフォルダーに含まれるファイルの構造と一致する、ユニオンに含めるファイルが少なくとも 1 つ必要です。このファイルは、ユニオンを作成するときに接続する最初のファイルです。
既知の問題と制限
以下のセクションでは、Amazon S3 ベータ コネクタを使用する際のパフォーマンスに影響を与える、既知の問題と制限について説明します。
注: このコネクタは現在、Tableau Prep の Web 作成または仮想接続ではサポートされていません。
認証の既知の問題と制限
セッショントークンを使用しない Amazon IAM ユーザーのシークレット キー/アクセス キーの認証のみがサポートされています。
パブリッシュの既知の問題と制限
ワークブックとデータ ソースは、「埋め込みパスワード」認証オプションを使用してパブリッシュされている必要があります。「ユーザーへのプロンプト」は現在サポートされていません。
ユニオンの既知の問題と制限
- Tableau Desktop のみがワイルドカード ユニオンをサポートしています。
- Web オーサリングでは、ユーザー定義の手動ユニオン (ファイルのドラッグ) のみをサポートしています。
ファイル タイプの既知の問題と制限
- 現時点では、Parquet、CSV、圧縮 .gz、および Excel ファイルがサポートされています。
- すべてのデータは、設計上、文字列形式でインポートされます。
- 1 つの接続で複数のファイル タイプをユニオンまたは結合することはできません (たとえば、Parquet と .csv を一緒にするなど)。
- 現在、カンマ区切りの .csv ファイルのみがサポートされています。
- ファイル サイズの上限は 15 GB です。
- 結合またはユニオンの累積結果セットは 15 GB を超えることはできません。
- コネクタ内の Excel ファイル パーサーのパフォーマンスの問題により、Excel ファイルは現在、最大 100 MB を超えることはできません。
追加の Parquet ファイルの既知の問題と制限
- Parquet ファイルは、「ハイパー API ドキュメント」に記載された形式である必要があります。
- ネストされた列、したがってネストされたタイプの MAP および LIST はサポートされていません。
- BSON、UUID、ENUM のタイプはサポートされていません。
- 論理型または変換された型を持たない、物理型の FIXED_LEN_BYTE_ARRAY はサポートされていません。
- DECIMAL 型は、最大 8 バイト (10 進数 18 桁) までのみサポートされます。18 桁を超える 10 進数が必要な場合は、double の使用を検討してください。
- TIME_MILLIS タイプと TIME_NANOS タイプはサポートされていません。代わりに TIME_MICROS の使用を検討してください。
- 非推奨の BIT_PACKED エンコードはサポートされていません。このエンコーディングは 5 年以上前に非推奨になっているため、最近の Parquet ファイルではこのエンコーディングを使用しないでください。
- DELTA_LENGTH_BYTE_ARRAY エンコードと最近の BYTE_STREAM_SPLIT エンコードは、どのライブラリでも記述されていないため、サポートされていません。これらのエンコーディングを使用している Parquet ファイルを見つけた場合は、お知らせください。
- サポートしている圧縮形式は、SNAPPY、GZIP、ZSTD、および LZ4_RAW です。
関連項目
- データ ソースの設定 – このデータ ソースにさらにデータを追加したり、データ分析の前にデータを準備したりします。
- グラフの構築とデータの分析 – データ分析を開始します。
- パフォーマンス向上のために Amazon Redshift と Tableau ソフトウェアの展開を最適化 (英語)(新しいウィンドウでリンクが開く) - Tableau ホワイトペーパー (登録またはサインインが必要です)
- Amazon Redshift によるビッグ データ分析 (英語)(新しいウィンドウでリンクが開く) - Tableau オンデマンド セミナー (登録またはサインインが必要です)