注: バージョン 2020.4.1 以降では、Tableau Server および Tableau Cloud でフローの作成と編集を行えるようになりました。このトピックの内容は、特に記載がない限り、すべてのプラットフォームに適用されます。Web 上でのフローの作成の詳細については、Tableau Server(新しいウィンドウでリンクが開く) および Tableau Cloud(新しいウィンドウでリンクが開く) ヘルプの「Web 上の Tableau Prep」を参照してください。
フローに含めるデータ セットの量を判断するため、データ セットを構成できます。データに接続するか、テーブルを [フロー] ペインにドラッグすると、インプット ステップがフローに自動的に追加されます。
インプット ステップでは、フローに含めるデータの内容と量を決定できます。これは常にフローの最初のステップになります。
Excel またはテキスト ファイルに接続している場合、インプット ステップからデータを更新することもできます。詳細については、「インプット ステップでのデータの追加(新しいウィンドウでリンクが開く)」を参照してください。
インプット ステップでは、次のことができます。
- フロー ペインのインプット ステップを右クリック (MacOS では Cmd を押しながらクリック) して、名前を変更したり、削除したりすることができます。
- 同じ親ディレクトリまたは子ディレクトリにある複数のファイルをユニオンします。詳細については、「インプット ステップでのファイルおよびデータベース テーブルのユニオン作成」を参照してください。
- (バージョン 2023.1 以降) データ セットの元の並べ替え順序に基づいて自動的に生成された行番号が含まれるようになりました。「データ セットの行番号を含める」を参照してください。
- フィールドを検索します。
- フィールド値の例を参照してください。
また、フィールド名を変更したりテキスト ファイルにテキスト設定を構成したりすることで、フィールドのプロパティを構成できます。
注: 角かっこが含まれるフィールド値は自動的に丸かっこに変換されます。
- アクションを実行して、フローに表示されるデータを変更します。データ サンプルのサイズの設定。
- フローで使用するデータ サンプルを構成します。
- 不要なフィールドを削除します。インプット ステップにはいつでも戻ることができ、後でフィールドを含めることができます。
- クリーニングする必要はないがフローに含めたいフィールドを非表示にします。必要に応じて、いつでも再表示できます。
- 選択したフィールドにフィルターを適用します。
データ接続のサポートされるフィールド データ型を変更します。
これらには、Microsoft Excel、テキスト ファイル、PDF ファイルのほか、Box、Dropbox、Google ドライブ、および OneDrive のデータが含まれます。他のデータ ソースの場合は、クリーニング ステップでデータ型を変更できます。
詳細については、「データに割り当てられたデータ型の確認」を参照してください
データ セットの行番号を含める
Tableau Prep Builder バージョン 2023.1 以降と Web 上の Microsoft Excel およびテキスト (.csv) ファイルでサポートされています。
注: このオプションは、現在、インプット ユニオンに含まれるファイルではサポートされていません。
バージョン 2023.1 以降、Tableau Prep は Microsoft Excel またはテキスト (.csv) ファイル タイプの行番号フィールドを自動的に生成します。以前のリリースでは、データの元の並べ替え順序に基づいて行番号を含める場合は、データ セットをフローに追加する前に手動でソースに追加する必要がありました。
このフィールドは、データに接続するときにインプット ステップで生成されます。既定ではフローから除外されていますが、ワンクリックでフローに含めることができます。フローに追加すると、他のフィールドと同様に動作し、フロー操作および計算フィールドで使用できます。
Tableau Prep は、計算フィールドの ROW_NUMBER 関数もサポートします。この関数は、行 ID やタイムスタンプなど、並べ替えを定義できるフィールドがデータ セットにある場合に役立ちます。この関数の使用方法については、「詳細レベル、ランク、タイルの計算の作成」を参照してください。
ソース行番号フィールドのフローへの追加
フィールドを右クリックまたは Cmd キーを押しながらクリック (MacOS) するか、[その他のオプション]
メニューをクリックして、[Include Field (フィールドを含める)] を選択します。
変更リストがクリアされ、フィールドがフロー データの一部になると、後続のフロー ステップに生成された行番号が表示されます。
ソース行番号の詳細
ソース行番号をデータ セット含める場合、次のオプションと考慮事項が適用されます。
- データ ソースの行番号は、データのサンプリングまたはフィルター処理の前に適用されます。
- ソース行番号は、各テーブルに固有のものです。ユニオン内の各インプットは、元の並べ替え順序を維持します。
- これにより、ソース行番号と呼ばれる新しいフィールドが作成され、フロー全体で維持されます。このフィールド名はローカライズされていませんが、いつでも名前を変更できます。
- この名前のフィールドが既に存在する場合、新しいフィールド名の数字が 1 ずつ増加します。たとえば、ソース行番号-1、ソース行番号-2 のようになります。
- フィールドのデータ型は以降のステップで変更できます。
- このフィールドは、フロー操作と計算で使用できます。
- この値は、インプット データが更新されるか、フローが実行されるたびに、データ セット全体に対して再生成されます。
- このフィールドは、インプット ユニオンでは使用できません。
カスタム SQL クエリへの接続
データベースがカスタム SQL の使用をサポートしている場合、[接続] ペインの下部あたりに [カスタム SQL] が表示されます。[カスタム SQL] をダブルクリックして [カスタム SQL] タブを開き、ここでクエリを入力してデータを事前選択したり、ソース固有の操作を使用することができます。クエリによりデータ セットを取得した後、データをフローに追加する前に、含めるフィールドの選択、フィルターの適用、データ型の変更を行うことができます。
カスタム SQL の詳細については、カスタム SQL を使用したデータへの接続を参照してください。
インプット ステップでクリーニング操作を適用
一部のクリーニング操作のみインプット ステップで利用できます。以下の変更はいずれもインプット フィールド リストで行えます。変更内容は [変更内容] ペインで追跡され、注釈は [フロー] ペインのインプット ステップの左側とインプット フィールド リストに追加されます。
- フィールドを非表示: フィールドを削除するのではなく非表示にして、フローが混雑しないようにします。フィールドは、必要に応じていつでも再表示できます。フローの実行時、非表示のフィールドは引き続きフローに含まれます。
- フィルター: 計算エディターを使用して値をフィルターするか、バージョン 2023.1 以降では、相対日付フィルター ダイアログを使用して、日付または日付と時刻のフィールドの日付範囲をすばやく指定できます。
フィールド名の変更: [フィールド名] フィールドで、フィールド名をダブルクリック (MacOS では Ctrl を押しながらクリック) し、新しいフィールド名を入力します。
データ型の変更: フィールドのデータ型をクリックし、メニューから新しいデータ型を選択します。このオプションは現在、Microsoft Excel、テキスト、PDF ファイル、Box、Dropbox、Google ドライブ、および OneDrive のデータ ソースでサポートされています。他のすべてのデータ ソースは、クリーニング ステップで変更できます。
フローに含めるフィールドの選択
注: バージョン 2023.1 以降では、複数のフィールドを選択して非表示、再表示、削除、または含めることができます。以前のリリースでは、一度に 1 つのフィールドを操作して、チェック ボックスをオンまたはオフにして、フィールドを含めたり削除したりすることができました。
[入力] ペインにはデータ セットに含まれるフィールドのリストが表示されます。既定では、自動生成されたフィールドであるソース行番号を除くすべてのフィールドが含まれます。フィールドの管理には、以下のオプションを使用します。
- 検索: リスト内のフィールドを検索します。
- 非表示: 目のアイコン
をクリックするか、[その他のオプション]
メニューから [フィールドの非表示] を選択して、フローに含めたいがクリ―ニングする必要のないフィールドを非表示にします。フィールドは実行時にフローによって処理されます。詳細については、「フィールドの非表示(新しいウィンドウでリンクが開く)」を参照してください。
- フィールドを含める: 1 つまたは複数の行を選択し、右クリックまたは Cmd キーを押しながらクリック (MacOS) するか、または [その他のオプション]
メニューから [Include Fields (フィールドを含める)] を選択すると、削除済みとマークされたフィールドを再び追加することができます。
- フィールドの削除: 1 つまたは複数の行を選択し、右クリックまたは Cmd キーを押しながらクリック (MacOS) して [X] をクリックするか、または [その他のオプション]
メニューから [フィールドの削除] を選択すると、フローに含めたくないフィールドを削除することができます。
インプット ステップでのフィールドへのフィルターの適用
インプット ステップでは、計算エディターを使用してフィルターを適用できます。バージョン 2023.1 以降では、相対日付フィルターを日付フィールドに追加して、特定の日付範囲のデータをフローに含めることもできます。詳細については、「データのフィルターリング(新しいウィンドウでリンクが開く)」の「相対日付フィルター」を参照してください。
その他のフィルター オプションは、他のステップ タイプで使用できます。詳細については、データのフィルターリング(新しいウィンドウでリンクが開く)を参照してください。
計算フィルターの適用
ツールバーの [値のフィルター] をクリックします。
計算エディターにフィルター条件を入力します。
相対日付フィルターの適用
インプット グリッドで、日付または日付と時刻というデータ型のフィールドを選択します。次に、右クリックまたは Cmd キーを押しながらクリック (MacOS) するか、または [その他のオプション]
メニューから [フィルター] > [相対日付] の順に選択します。
[相対日付フィルター] ダイアログで、フローに含める年、四半期、月、週、または日の正確な範囲を指定します。また、特定の日付を基準とするアンカーを構成し、NULL 値を含めることもできます。
フィールド名の変更
フィールド名を変更するには、[フィールド名] 列で名前を選択し、フィールドに新しい名前を入力します。フィールド グリッドとフロー ペインで、インプット ステップの左に注釈が追加されます。変更内容は、[変更内容] ペインでも追跡されます。
データ型の変更
現在、Microsoft Excel、テキスト、PDF ファイル、Box、Dropbox、Google ドライブ、および OneDrive のデータ ソースでサポートされています。他のすべてのデータ ソースは、クリーニング ステップで変更できます。
注: ソース行番号 (バージョン 2023.1 以降) のデータ型は、クリーニング ステップまたはその他のステップ タイプでのみ変更できます。
フィールドのデータ型を変更するには、次を実行します。
フィールドのデータ型をクリックします。
メニューから新しいデータ型を選択します。
また、フローの他のステップ タイプでフィールドのデータ型を変更したり、データの役割を割り当ててフィールド値を検証できるようにしたりすることもできます。データ型を変更する方法やデータの役割を使用する方法の詳細については、データに割り当てられたデータ型の確認(新しいウィンドウでリンクが開く)およびデータの役割を使用したデータの検証(新しいウィンドウでリンクが開く)を参照してください。
フィールド プロパティの構成
テキスト ファイルを操作する際、[設定] タブが表示されます。ここでは、テキスト ファイルのフィールド区切りなど、テキストのプロパティを構成したり、接続を編集したりできます。[接続] ペインでファイル接続を編集したり、増分更新の設定を構成したりすることもできます。フローの増分更新を設定する方法については、増分更新を使用したフロー データの更新を参照してください。
テキスト ファイルまたは Excel ファイルを操作する際、フローを開始する前に誤って推測したデータ型を修正することもできます。データ型の変更は、フローの開始後に [プロファイル] ペインのその後のステップでいつでも行なえます。
テキスト ファイルのテキスト設定の構成
テキスト ファイルの解析に使用する設定を変更するには、以下のオプションから選択します。
最初の行にヘッダーが含まれます (既定): 最初の行をフィールド ラベルとして使用するには、このオプションを選択します。
フィールド名を自動に生成: Tableau Prep Builder でフィールド ヘッダーの自動生成を行う場合は、このオプションを選択します。フィールドの命名規則は、Tableau Desktop と同じモデルに従っています。F1、F2 などです。
フィールド区切り: 列の区切りに使用するリストから文字を選択します。カスタム文字を入力するには、[その他] を選択します。
テキスト修飾子: ファイルで値を囲む文字を選択します。
文字セット: テキスト ファイルのエンコードを記述する文字セットを選択します。
ロケール: ファイルの解析に使用するロケールを選択します。この設定は、使用する小数点および桁区切りを示します。
データ サンプルのサイズの設定
ピーク パフォーマンスを維持するため、Tableau Prep では既定で、フローに含まれるデータはデータ セットの代表的なサンプルに制限されています。データ サンプルは、データ セットに含まれる合計フィールド数とそれらのフィールドのデータ型に基づき、最適な行数を計算することにより決定しています。その後、Tableau Prep は可能な限り迅速に、計算された量の最初の行数を取得します。
サンプルを計算する方法および返す方法に応じ、結果のデータ サンプルに必要な行がすべて含まれる場合もあれば、そうでない場合もあります。期待したデータが表示されない場合は、データ サンプル設定を変更し、再度クエリを実行できます。
Web 上でフローを作成または編集する場合は、フローに含めることができるデータの量に制限が適用され、データ サンプルを変更するために使用できるオプションは、Tableau Prep Builder で作業する場合と若干異なります。詳細については、Tableau Server(新しいウィンドウでリンクが開く) または Tableau Cloud(新しいウィンドウでリンクが開く) ヘルプの「サンプル データと処理の制限」を参照してください。
注: データがサンプリングされる場合、[サンプリング済み] のマークが [プロファイル] ペインに表示され、追加するすべてのステップで保持されます。行った変更は、フローで操作しているサンプルに適用されます。フローを実行すると、すべての変更がデータ セット全体に適用されます。
データ サンプル設定を変更するには、インプット ステップを選択し、[データ サンプル] タブで以下のオプションから選択します。
デフォルトのサンプル量 (デフォルト): Tableau Prep が返す合計行数を計算します。
すべてのデータを使用: サイズに関わらず、データ セットのすべての行を取得します (Tableau Prep Builder のみ)。パフォーマンスに影響したり、Tableau Prep Builder がタイムアウトする原因となる可能性があります。
注: パフォーマンスを維持するため、この設定を選択してもデータ サンプルの制限値 100 万行が集計とユニオンのステップ タイプに適用され、制限値 300 万行が結合とピボットのステップ タイプに適用されます。
固定の行数: データ セットから返す行数を選択します。推奨される行数は 100 万未満です。行数を 100 万超に設定すると、パフォーマンスに影響する可能性があります。
- Web オーサリングの場合: 大きなデータ セットを使用するときにユーザーが選択できる最大行数は、管理者が設定します。ユーザーは、その制限までの行数を選択できます。
クイック選択 (既定): データベースが可能な限り迅速に、要求された行数を返します。これは最初の N 行であるか、データベースが以前のクエリのメモリでキャッシュした行である可能性があります。
ランダムなサンプル: データベースは要求された行数を返しますが、データ セットのすべての行を確認し、すべての行のうち代表的なサンプルを返します。このオプションは、データの初回取得時にパフォーマンスに影響する可能性があります。