インプット ステップでのデータの追加

データ ソースに接続してフローの構築を開始した後で、新しいデータを取り込めるようにデータ接続を更新する必要が生じる場合があります。また、インプット ステップでデータ セットを結合またはユニオンし、大量のデータ ソースをより効率的に処理することもできます。

インプット ステップでのデータの更新

フローの操作を開始した後でインプット ファイルや表のデータが変更された場合は、インプット ステップを更新して新しいデータを取り込むことができます。

ファイルのインプット ステップのタイプ

ファイルのインプット ステップを更新するには、次のいずれかを実行します。

  • フロー ペインのトップ メニューで、[更新] ボタンをクリックしてすべてのインプット ステップを更新します。単一のインプット ステップを更新する場合は、[更新] ボタンの横にあるドロップダウン矢印をクリックし、リストからそのインプット ステップを選択します。

  • フロー ペインで、更新するインプット ステップを右クリックし、メニューから [更新] を選択します。

ファイル、データベース、または Tableau 抽出のインプット ステップのタイプ

データベースまたは Tableau 抽出のインプット ステップを更新するには、次のいずれかの操作を実行します。

  • 接続の編集を試行します。

    : パフォーマンスを維持するには、Tableau Prep Builder で大きなデータ セットをサンプリングします。データをサンプリングする場合、プロファイル ペインに新しいデータが表示される場合と表示されない場合があります。インプット ステップの [データ サンプル] タブでデータをサンプリングする方法の設定を変更できますが、これによりパフォーマンスに影響が出る可能性があります。データ サンプルのサイズに関する設定の詳細については、データ サンプルのサイズの設定を参照してください。

    1. [接続] ペインで、データ ソースを右クリック (MacOS では Ctrl を押しながらクリック) して、[編集] を選択します。

    2. データベースにサインインするか、ファイルまたは Tableau 抽出を再度選択して、接続を再確立します。

  • インプット ステップを削除した後でフローに再び追加します。

    1. フロー ペインで、更新するインプット ステップを右クリックし、メニューから [削除] を選択します。

      これにより、フローは一時的にエラー状態になります。

    2. 更新されたファイルに再び接続します。

    3. 表を、フロー ペイン内のフローの 2 番目のステップの上 (インプット ステップを追加する場所) までドラッグします。[追加] オプションの上にドロップすると、表がフローに再び接続されます。

インプット ステップでのファイルおよびデータベース表のユニオン作成

単一データ ソースの複数のファイルやデータベース表を操作する場合、ワイルドカード検索を使用してファイルや表を検索した後でデータをユニオンして、インプット ステップにそのファイルまたは表のデータをすべて含めることができます。ファイルをユニオンするには、ファイルが同じ親ディレクトリまたは子ディレクトリにある必要があります。

パターンに一致し、同じフォルダーに追加される新しいファイルは、次にフローを開いた際、またはコマンド ラインから実行する際にユニオンに自動的に追加されます。新しいファイルは既にフローと一緒にパッケージされているため、パッケージド フロー ファイル (.tflx) は新しいファイルを自動的には取得しません。パッケージド フローに新しいファイルを追加するには、フロー ファイル (.tfl) を開いて新しいファイルを取得してから、フローを再パッケージして新しいファイル データを含めます。

データベース表をユニオンするには、表が同じデータベースにあり、データベース接続でユニオンに対するワイルドカード検索の使用がサポートされている必要があります。次のデータベースでこのタイプのユニオンがサポートされています。

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

ユニオンの作成後にファイルや表を追加または削除する場合、インプット ステップを更新し、新しいデータや変更されたデータでフローを更新できます。

: 現在、この機能は Excel および .csv (テキスト) ファイルと、上記の特定のデータベースに保存されたデータ表にのみ適用できます。このオプションは、Tableau データ抽出では使用できません。

ファイル用のワイルドカード ユニオンは、Tableau Prep Builder バージョン 2018.1.2 以降で使用できます。データベース表用のワイルドカード ユニオンは、Tableau Prep Builder バージョン 2018.3.1 以降で使用できます。以前のバージョンでこのタイプのユニオンを含むフロー接続を編集すると、エラーが発生する可能性があります。

異なるデータ ソースのユニオン データが必要な場合は、ユニオン ステップを使用して行うことができます。ユニオン ステップの作成の詳細については、データのユニオン作成を参照してください。

ファイルのユニオン

既定で、Tableau Prep Builder は接続先の .csv と同じディレクトリのすべての .csv ファイル、または接続先の Excel ファイルのすべてのシートでユニオンを作成します。データ インタープリターを使用して Excel ファイルのクリーニングを行っており、Tableau Prep Builder バージョン 2018.1.2 以降を使用している場合は、データ インタープリターが見つけたサブテーブルのユニオンや追加を行うためにワイルドカード検索を使用することができます。

既定のユニオンを変更する必要がある場合には、以下の条件を使用し、ユニオンに含める必要があるファイルまたはシートを検索してください。

  • [次の場所で検索]: ファイルの検索に使用するディレクトリを選択します。親フォルダーのサブディレクトリにあるファイルを含めるには、[サブフォルダーを含める] チェック ボックスをオンにします。

  • [ファイル]: ワイルドカード検索条件に一致するファイルを含めるか除外するかを選択します。

  • [一致パターン (xxx*)]: ワイルドカード検索パターンを入力し、ファイル名にその文字を含むファイルを検索します。たとえば、「ord*」と入力すると、そのファイル名を含むすべてのファイルが返されます。指定ディレクトリにあるすべてのファイルを含めるには、このフィールドを空欄のままにします。

インプット ステップでファイルをユニオンするには、以下を実行します。

  1. [接続の追加] ボタンをクリックし、[接続] で .csv ファイルの場合には [テキスト ファイル]、Excel ファイルの場合には [Microsoft Excel] をクリックしてから、ファイルを選択して開きます。

  2. [入力] ペインで [複数ファイル] タブを選択し、[ワイルドカード ユニオン] を選択します。

    以下の例は、一致パターンを使用したワイルドカード ユニオンを示しています。[フロー] ペインの "Orders_Central (オーダー_中央)" インプット ステップにあるファイル アイコンのプラス記号は、このステップにワイルドカード ユニオンが含まれていることを示しています。ユニオンに含まれるファイルは、[ファイルを含める] に記載されています。

  3. 検索、ファイル、および一致パターンのオプションを使用し、ユニオンを作成するファイルを検索します。

  4. [適用] をクリックして、ファイルのユニオンを作成します。

フローに新しいステップを追加する際、プロファイル ペインの [File Paths (ファイル パス)] フィールドにはデータ セットに追加されているすべてのファイルが表示されます。このフィールドは自動的に追加されます。

データベース表のユニオン (バージョン 2018.3.1 以降)

  1. [接続の追加] ボタンをクリックし、[接続] の下で、ワイルドカード ユニオンがサポートされているデータベースに接続します。

  2. 表をフロー ペインにドラッグします。

  3. [入力] ペインで [複数の表] タブを選択し、[ワイルドカード ユニオン] を選択します。

  4. 検索、[表]、および [一致パターン] のオプションを使用し、ユニオンする表を検索します。

    ユニオンに含めることができるのは、[接続] ペインの [表] セクションに表示される表だけです。ワイルドカード検索では、スキーマやデータベース接続内を検索して表を見つけることはできません。

  5. [適用] をクリックして、表データをユニオンします。

    フローに新しいステップを追加する際、プロファイル ペインの [表名] フィールドにはデータ セットに追加されているすべての表が表示されます。このフィールドは自動的に追加されます。

ユニオン後のフィールドのマージ

インプット ステップでユニオンを作成後に、フィールドをマージする必要が生じる場合があります。これはその後の任意のステップで行うことができますが、インプット ステップと出力ステップは例外です。詳細については、フィールドをマージする際のその他のオプションを参照してください。

インプット ステップでのデータの結合 (バージョン 2019.1.3 以降)

リレーションシップ データを含む表があるデータベースに接続すると、Tableau Prep Builder で表内のどのフィールドが一意の識別子として識別され、どのフィールドが関連フィールドとして識別されるかを検出および表示できるほか、そのフィールドに関連する表の名前も表示できます。

[リンクされているキー] という名前の新しい列が [入力] ペインに表示され、存在する場合には以下のリレーションシップが表示されます。

  • 一意の識別子。このフィールドは、表内の各行を一意に識別します。表には一意の識別子が複数ある可能性があります。フィールドの値は一意である必要があり、空欄または null にすることはできません。

  • 関連フィールド。このフィールドは、表をデータベース内の別の表に関連付けます。表には関連フィールドが複数ある可能性があります。

  • 一意の識別子と関連フィールドの両方。このフィールドは、この表内の一意の識別子で、表をデータベース内の別の表にも関連付けます。

これらのリレーションシップを利用し、関連する表をすばやく検索してフローに追加したり、インプット ステップから結合を作成したりできます。この機能は、表のリレーションシップが定義されているサポートされる任意のデータベース コネクタで使用できます。

  1. 一意の識別子や関連フィールド (外部キー) など、フィールドのリレーションシップ データを含むデータベース (Microsoft SQL Server など) に接続します。
  2. [入力] ペインで、 関連フィールドとして、または 一意の識別子と関連フィールドの両方としてマークされているフィールドをクリックします。

    関連する表のリストが表示されているダイアログが開きます。

  3. 追加または結合する表にカーソルを合わせ、プラス ボタンをクリックして表をフローに追加するか、結合ボタンをクリックして選択した表との結合を作成します。

    結合を作成すると、Tableau Prep Builder は定義済みのフィールドのリレーションシップを使用して表を結合し、結合の作成に使用する結合句のプレビューを表示します。

  4. または、[フロー] ペインのメニューから関連する表を結合することもできます。プラス アイコンが表示されるまでステップにカーソルを合わせ、[結合の追加] を選択して関連する表のリストを表示します。2 つの表の間のリレーションシップを構成するフィールドに基づき、Tableau Prep Builder により結合が作成されます。

    : 表に定義済みの表のリレーションシップがない場合、このオプションは使用できません。

結合の操作の詳細については、データの結合を参照してください。

ありがとうございます! フィードバックの送信中にエラが発生しました。もう一度やり直すか、メッセージをお送りください