データへの接続

Tableau Prep Builder を使用してデータのクリーニングと準備を行うには、Tableau Desktop と同様にデータに接続して新しいフローを開始します。既存のフローを開き、中止した時点に移動することもできます。

スタート ページの右側で最近のフローを表示してアクセスできるので、進行中の作業を簡単に見つけることができます。データに接続したら、フローで操作するデータを識別するため、インプット ステップで別のオプションを使用します。

フローの開始またはオープン

Tableau Prep Builder は一般的なタイプのデータや Tableau データ抽出 (.tde または .hyper) への接続をサポートしています。さらにバージョン 2019.3.1 以降では、パブリッシュされたデータ ソースへの接続に対するサポートも追加されています。Tableau Desktop でサポートされているコネクタが、お使いの Tableau Prep Builder のバージョンではまだサポートされていない可能性があります。それぞれの新しいバージョンで新しいコネクタが追加されるため、[接続] ペインでコネクタが利用可能かどうかを確認してください。

: コネクタがサポートされていないバージョンでフローを開くと、フローを開くことはできますが、エラーが発生する可能性があったり、データ接続を削除しない限り実行されません。

Tableau Desktop と同様に、カスタム SQL クエリを使用して今すぐデータに接続することもできます。詳細については、Tableau Desktop と Web 作成のヘルプの「カスタム SQL クエリへの接続」を参照してください。

データに接続できるかを確認するには、Tableau Prep Builder を開いて [接続の追加] ボタンをクリックし、データに対応するコネクタが [接続] の左ペインに記載されているかどうかを確認します。

: 一部のコネクタではデータへの接続には、ドライバーのダウンロードとインストールが必要な場合があります。ドライバーのダウンロード リンクとインストール指示を入手するには、Tableau Web サイトのドライバーのダウンロード ページを参照してください。

新しいフローの開始

  1. Tableau Prep Builder を開き、[接続の追加] ボタンをクリックします。

  2. コネクタのリストより、ファイルの種類またはデータをホストするサーバーを選択します。プロンプトが表示される場合には、サインインおよびデータへのアクセスに必要な情報を入力します。

  3. [接続] ペインで次のいずれかを実行します。

    • ファイルに接続した場合は、テーブルをダブルクリックするか、[フロー] ペインにテーブルをドラッグしてフローを開始します。

      単一テーブルの場合、データをフローに追加すると、Tableau Prep Builder は [フロー] ペインで自動的にインプット ステップを作成します。

    • データベースに接続した場合は、データベースまたはスキーマを選択してから、テーブルをダブルクリックするか、[フロー] ペインにテーブルをドラッグしてフローを開始します。

      : 1 つのデータ ソースから複数のファイルまたはデータベース表に接続する場合は、ワイルドカード検索を使用して、インプット ステップでファイルまたはテーブルのユニオンを作成できます。詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

既存フローを開く

既存フローを開くには、スタート ページで次のいずれかを実行します。

  • [最近のフロー] でフローを選択します。

  • [フローを開く] をクリックし、フロー ファイルに移動して開きます。

[ファイル] > [新規作成] または [ファイル] > [開く] の順にクリックして、新しいワークスペースを開きます。複数のフローで同時に作業する場合は、このオプションを使用して複数の Tableau Prep Builder ワークスペースを開くことができます。Tableau Prep Builder バージョン 2019.3.1 以前で [ファイル] > [開く] を選択すると、Tableau Prep Builder では現在開いているフローが選択した新しいフローに置き換えられます。

パブリッシュされたデータ ソースへの接続 (バージョン 2019.3.1 以降)

データ ソースを Tableau Desktop から Tableau Server または Tableau Online へパブリッシュするか、フローから出力としてパブリッシュすると、これらのパブリッシュされたデータ ソースに接続してフローの入力データ ソースとして使用できます。

: パブリッシュされたデータ ソースがインプットとして含まれるフローをパブリッシュすると、パブリッシャーが既定のフロー所有者として割り当てられます。フローを実行するときは、フロー所有者を実行アカウントに使用します。実行アカウントの詳細については、「実行サービス アカウント」を参照してください。Tableau Server または Tableau Online でフロー所有者を変更できるのは、サイト管理者またはサーバー管理者だけです。

この機能を使用する場合は、次の要件が適用されます。

  • Tableau Server バージョン 2019.3 で使用可能なパブリッシュされたデータ ソースへの接続が完全にサポートされています。Tableau Server の以前のバージョンでパブリッシュされたデータ ソースに接続する場合、すべての機能を使用できない可能性があります。
  • パブリッシュされたデータ ソースに接続するには、サインインしている Tableau Server サイトで Explorer 以上の役割が割り当てられている必要があります。サイト ロールの詳細については、Tableau Server ヘルプの「ユーザーのサイト ロールの設定」を参照してください。
  • 多次元 (キューブ) データまたはユーザー フィルターを含むパブリッシュされたデータ ソースは、現在サポートされていません。
  • マルチサーバー接続はサポートされていません。次の操作を実行するには、同じサーバーまたはサイトへの接続を使用する必要があります。
    • パブリッシュされたデータ ソースに接続する。
    • フロー出力を Tableau Server または Tableau Online へパブリッシュする。
    • Tableau Server または Tableau Online でのフローの実行をスケジュールする。

パブリッシュされたデータ ソースへ接続するには、次の手順を実行します。

  1. Tableau Prep Builder を開き、[接続の追加] ボタンをクリックします。

  2. コネクタのリストから、[Tableau Server] を選択します。

  3. サインインしてサーバーまたはサイトに接続します。

  4. データ ソースを選択するか、検索オプションを使用してデータ ソースを検索し、フロー ペインにドラッグしてフローを開始します。[入力] ペインの [Tableau Server] タブに、パブリッシュされたデータ ソースの詳細が表示されます。

Google BigQuery への接続 (バージョン 2019.3.1 以降)

Tableau Prep Builder は、Tableau Desktop と同様に、Google BigQuery を使用したデータへの接続をサポートしています。Oauth 認証資格情報を設定して、Tableau Prep Builder で Google BigQuery と通信できるようにする必要があります。また、フローを Tableau Server または Tableau Online にパブリッシュする計画がある場合は、それらのアプリケーションに対しても Oauth 接続を構成する必要があります。

: Tableau Prep Builder では、Google BigQuery のカスタマイズ属性の使用は現在サポートされていません。

インプット ステップで Google BigQuery への接続に使用する認証資格情報は、Tableau Server または Tableau Online で Google BigQuery の [マイ アカウントの設定] ページにある [設定] タブで設定される認証資格情報と一致する必要があります。

フローをパブリッシュするときに認証設定で別の認証資格情報を選択するか、何も選択しなかった場合、Tableau Server または Tableau Online でフローの接続を編集するまでフローが認証エラーで失敗します。

認証資格情報を編集するには、次の手順を実行します。

  1. Tableau Server または Tableau Online で、Google BigQuery 接続の [接続] タブにある [その他のアクション] をクリックします。
  2. [接続の編集] を選択します。
  3. [マイ アカウントの設定] ページの [設定] タブで設定した保存済みの認証資格情報を選択します。

詳細については、Tableau Desktop と Web 作成のヘルプの「アカウント設定の管理」を参照してください。フローのパブリッシュ時に認証を設定する方法については、フローのパブリッシュを参照してください。

SAP HANA への接続 (バージョン 2019.2.1 以降)

Tableau Prep Builder では、Tableau Desktop と同様に SAP HANA を使用したデータへの接続をサポートしますが、いくつかの違いがあります。Tableau Desktop と同じ手順を使用してデータベースに接続します。詳細については、「SAP HANA」を参照してください。接続して表を検索した後で、表をキャンバスにドラッグし、フローの構築を開始します。

フローを開くときに変数とパラメーターを求める機能は、Tableau Prep Builder ではサポートされていません。代わりに、[入力] ペインで [変数とパラメーター] タブをクリックし、使用する変数とオペランドを選択します。その後、事前設定された値のリストから選択するか、カスタム値を入力することで、データベースにクエリを実行して必要な値を返します。

: Tableau Prep Builder のバージョン 2019.2.2 以降では、初期 SQL を使用して接続をクエリし、変数に複数の値がある場合はドロップダウン リストから必要な値を選択できます。

変数を追加することもできます。[変数] セクションでプラス ボタン をクリックし、変数とオペランドを選択してからカスタム値を入力します。

: このコネクタは、Tableau Prep Conductor バージョン 2019.1 ではサポートされていません。このコネクタを使用するフローを作成すると、フローをパブリッシュすることはできますが、Tableau Server のスケジュール機能を使用してフローを実行することはできません。代わりに、コマンド ライン インターフェイスを使用してフローを実行して、データを最新の状態に保つことができます。コマンド ラインからのフロー実行の詳細については、コマンド ラインからフロー出力ファイルを更新を参照してください。バージョンの互換性の詳細については、Tableau Prep とのバージョン互換性を参照してください。

ODBC を使用した接続 (バージョン 2019.2.2 以降)

[接続] ペインにリストされていないデータ ソースへ接続する必要がある場合は、SQL 標準をサポートするその他のデータベース (ODBC) コネクタを使用して任意のデータ ソースに接続し、ODBC API を実装できます。その他のデータベース (ODBC) コネクタを使用したデータへの接続は、Tableau Desktop での使用方法に似ていますが、いくつかの相違点があります。

  • 接続できるのは、DSN (データ ソース名) オプションを使用する場合のみです。

  • Tableau Server でフローをパブリッシュして実行するには、サーバーが一致する DSN を使用して構成されている必要があります。

    : その他のデータベース (ODBC) コネクタを含むコマンド ライン (Tableau Prep Builder) からのフローの実行は、現在サポートされていません。

  • Windows と MacOS の両方に単一の接続エクスペリエンスがあります。ODBC ドライバー (Windows) の接続属性の確認を求める機能はサポートされていません。

  • Tableau Prep Builder でサポートされているのは、64 ビットドライバーのみです。

接続の前に

その他のデータベース (ODBC) コネクタを使用してデータに接続するには、データベース ドライバーをインストールして、DSN (データ ソース名) の設定と構成を行う必要があります。Tableau Server にフローをパブリッシュして実行するには、サーバーが一致する DSN を使用して構成されている必要があります。

重要: Tableau Prep Builder でサポートされているのは、64 ビットドライバーのみです。32 ビット ドライバーの設定と構成を既に行っており、ドライバーで 32 ビット版と 64 ビット版の同時インストールが許可されていない場合は、32 ビット版をアンインストールしてから 64 ビット版をインストールする必要があります。

  1. ODBC データ ソース アドミニストレーター (64 ビット) (Windows) または ODBC Manager ユーティリティ (MacOS) のいずれかを使用して DSN を作成します。

    お使いの Mac にユーティリティがインストールされていない場合は、www.odbcmanager.net などからダウンロードするか、odbc.ini ファイルを手動で編集できます。

  2. ODBC データ ソース アドミニストレーター (64 ビット) (Windows) または ODBC Manager ユーティリティ (MacOS) で、新しいデータ ソースを追加してからデータ ソースのドライバーを選択し、[完了] をクリックします。

  3. [ODBC Driver Setup (ODBC ドライバーのセットアップ)] ダイアログで、サーバー名、ポート、ユーザー名、パスワードなどの構成情報を入力します。[テスト] (ダイアログにこのオプションがある場合) をクリックして接続が正しく設定されていることを確認してから、構成を保存します。

    : Tableau Prep Builder では、接続属性の確認を求める機能はサポートされていません。DNS の構成時にこの情報を設定する必要があります。

    次の例では、MySQL Connector の構成ダイアログを示します。

その他のデータベース (ODBC) を使用した接続

  1. Tableau Prep Builder を開き、[接続の追加] ボタンをクリックします。

  2. コネクタのリストから、[その他のデータベース (ODBC)] を選択します。

  3. [その他のデータベース (ODBC)] ダイアログで、ドロップダウン リストから DSN を選択し、ユーザー名とパスワードを入力します。次に、[サインイン] をクリックします。

  4. [接続] ペインで、ドロップダウン リストからデータベースを選択します。

初期 SQL を使用した接続のクエリ (バージョン 2019.2.2 以降)

対応するデータベースへの接続時に初期 SQL コマンドを指定できます。このコマンドは、データベースへの接続時に実行されます。たとえば、Amazon Redshift に接続する場合、データベースへの接続時に、インプット ステップでフィルターを追加するときのように、SQL ステートメントを入力してフィルターを適用できます。SQL コマンドは、データがサンプリングされ Tableau Prep Builder に読み込まれる前に適用されます。

データを更新して初期 SQL コマンドを再度実行するには、次のいずれかの操作を行います。

•初期 SQL コマンドを変更して、接続を再確立するようにインプット ステップを更新する。

•フローを実行する。初期 SQL コマンドは、すべてのデータを処理する前に実行されます。

•Tableau Server で実行するフローをスケジュールする。初期 SQL は、フローが実行されるたびにデータの読み込み操作の一部として実行されます。

  1. [接続] ペインで、リストから初期 SQL をサポートするコネクタを選択します。
  2. [初期 SQL の表示] リンクをクリックしてダイアログを展開し、SQL ステートメントを入力します。

重要: Tableau Prep Builder の初期 SQL では、パラメーターがまだサポートされていません。Tableau Desktop と同様にパラメーターを試行および入力しようとすると、エラーが表示されます。

Tableau データ抽出への接続

Tableau データ抽出に接続すると、Tableau Prep Builder は抽出をアンパッケージし、hyper が展開されます。フロー操作が結果の生データに適用されるため、大量の一時容量を使用します。

つまり、そのサイズのファイルに対応する大量の RAM とディスク容量が必要となる可能性があります。たとえば、列が 18、行が 120 万ある抽出ファイルは 360MB (非圧縮で 8.5 GB) あり、これを解凍すると、ファイルをサポートするには最大 32GB の RAM、16 コア、500GB のディスク容量が必要になる可能性があります。

Data Interpreter を使用したファイルのクリーニング

Microsoft Excel ファイルを操作する場合、Data Interpreter を使用してデータのサブテーブルを検出したり、関係のない情報を削除して分析用データの準備を行うことができます。Data Interpreter をオンにすると、これらのサブテーブルを検出し、[接続] ペインの [テーブル] セクションで新しいテーブルとしてリストに記載します。

その後、[フロー] ペインにドラッグできます。Tableau Prep Builder バージョン 2018.1.2 以降を使用している場合は、[複数ファイル] タブで [ワイルドカード ユニオン] オプションを選択し、見つかったすべてのサブテーブルをフローに含めることができます。インプット ステップでのワイルドカード ユニオンの使用に関する詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成を参照してください。

Data Interpreter をオフにすると、これらのテーブルは [接続] ペインから削除されます。これらのテーブルがフローで既に使用されている場合は、データの欠落のためフローでエラーが発生します。

: 現在、Data Interpreter は Excel スプレッドシートのサブテーブルのみを検出します。テキスト ファイルとスプレッドシートの開始行の指定はサポートされていません。

以下の例は、[接続] ペインで Excel スプレッドシートに Data Interpreter を使用した結果を示しています。Data Interpreter が 2 つの追加サブテーブルを検出しました。

Data Interpreter 使用前 Data Interpreter 使用後

Data Interpreter を使用するには、以下の手順を完了します。

  1. [データへの接続][Microsoft Excel] の順に選択します。

  2. ファイルを選択し、[開く] をクリックします。

  3. [Data Interpreter の使用] チェック ボックスを選択します。

  4. 新しいテーブルを [フロー] ペインにドラッグし、フローに含めます。古いテーブルを削除するには、古いテーブルのインプット ステップを右クリックし、[削除] を選択します。

フィードバックをくださりありがとうございます! フィードバックの送信中にエラが発生しました。もう一度やり直すか、メッセージをお送りください