作業の保存と共有
注: バージョン 2020.4 以降では、Tableau Server および Tableau Online でフローを作成および編集できるようになりました。このトピックの内容は、特に記載がない限り、すべてのプラットフォームに適用されます。Web 上でのフローの作成の詳細については、Web 上での Tableau Prepを参照してください。
作業内容はフローのどの時点でも手動で保存することができます。または、Web 上でフローを作成または編集する際に Tableau で自動的に保存されるようにすることもできます。Web 上でフローを操作する場合、いくつかの相違点があります。
Tableau Prep Builder | Web 上での Tableau Prep |
---|---|
|
|
データを最新の状態に保つために、フローを Tableau Prep Builder やコマンド ラインから手動で実行することができます。また、Tableau Server または Tableau Online でパブリッシュされたフローを手動で実行するか、スケジュールに従って実行することもできます。フローの実行の詳細については、フローの実行を参照してください。
フローの保存
追加の操作を実行する前に、フローを保存して作業をバックアップしてください。フローは Tableau Prep フロー (.tfl) ファイル形式で保存されます。自動保存は Tableau Prep Builder では使用できません。
Tableau Desktop でワークブックをパッケージして共有するのと同様に、ローカル ファイル (Excel、テキスト ファイル、Tableau 抽出) をフローと一緒にパッケージして他のユーザーに共有することもできます。ローカル ファイルのみをフローと一緒にパッケージできます。データベース接続のデータなどは含まれません。
Web 作成では、ローカルファイルは自動的にフローと一緒にパッケージ化されます。ファイルへの直接接続はまだサポートされていません。
パッケージド フローを保存すると、フローはパッケージド Tableau Flow ファイル (.tflx) として保存されます。
-
フローを保存するには、トップ メニューから [ファイル] > [保存] を選択します。
-
Tableau Prep Builder では、データ ファイルをフローと一緒にパッケージ化するには、トップ メニューから次のいずれかを実行します。
-
[ファイル] > [パッケージド フローのエクスポート] を選択します。
-
[ファイル] > [名前を付けて保存] を選択します。その後、[名前を付けて保存] ダイアログで、[種類を指定して保存] ドロップダウン メニューより [パッケージド Tableau Flow ファイル] を選択します。
-
Web 上にフローを自動的に保存します (バージョン 2020.4 以降)
Web 上でフローを作成または編集する場合、フローに変更を加えると (データ ソースに接続してステップを追加するなど)、その作業は数秒ごとに下書きとして保存されるため、作業が失われることはありません。
フローは現在サインインしているサーバーにのみ保存できます。1 つのサーバーでフローの下書きを作成して、別のサーバーに保存またはパブリッシュすることはできません。フローをサーバー上の別のプロジェクトにパブリッシュする場合は、[ファイル] > [Publish As (名前を付けてパブリッシュ)] オプションを使用して、ダイアログからプロジェクトを選択します。
フローの下書きは、パブリッシュしてサーバー上のプロジェクトにアクセスするパーミッションを持つすべてのユーザーが使用できるようになるまで、自分以外のユーザーには表示できません。ステータスが下書きになっているフローには、下書きのバッジが付けられているため、進行中のフローは簡単に見つけることができます。フローがパブリッシュされていない場合は、下書きのバッジの横の [Never Published (パブリッシュされていない)] バッジが表示されます。
フローをパブリッシュした後にフローを編集してもう一度パブリッシュすると、新しいバージョンが作成されます。[リビジョン履歴] ダイアログでフローのバージョンのリストを確認できます。[検索] ページで、[アクション] メニューをクリックし、[リビジョン履歴] を選択します。
リビジョン履歴の管理の詳細については、Tableau Desktop ヘルプの「コンテンツのリビジョンの操作」(Link opens in a new window)を参照してください。
注: 自動保存は既定で有効化されています。管理者がサイトで自動保存を無効にすることは可能ですが、推奨されてません。Tableau Server REST API メソッドの「サイトの更新」を使用して、flowAutoSaveEnabled
属性を false に設定します。詳細については 、「Tableau Server REST API サイトのメソッド: サイトの更新(Link opens in a new window)」を参照してください。
ファイルの自動復元
既定では、Tableau Prep Builder (バージョン 2020.3.3 以降) でアプリケーションがフリーズまたはクラッシュした場合、開いているフローの下書きが自動的に保存されます。フローの下書きは マイ Tableau Prep リポジトリの [Recovered Flow (復元されたフロー)] フォルダーに保存されます。次回アプリケーションを開くと、ダイアログに復元されたフローの選択可能なリストが表示されます。復元されたフローを開いて中断した場所から続行するか、必要がない場合は復元されたフロー ファイルを削除することができます。
注: [Recovered Flow (復元されたフロー)] フォルダーの中にフローを復元した場合、このダイアログは、そのフォルダーが空になるまでアプリケーションを開くたびに表示されます。
この機能を有効にしたくない場合、管理者としてインストール中またはインストール後にオフにすることができます。この機能をオフにする方法については、Tableau Desktop および Tableau Prep の導入ガイドにある「ファイルの復元をオフにする」(Link opens in a new window)を参照してください。
Tableau Desktop でフロー出力を表示する
注: このオプションは Web 上では使用できません。
データのクリーニングを行う際に、進捗を Tableau Desktop で表示して確認したいと思うことがあるかもしれません。Tableau Desktop でフローを開くと、Tableau Prep Builder が永続的な Tableau .hyper ファイルと Tableau データ ソース (.tds) ファイルを作成します。ファイルは Tableau リポジトリのデータ ソース ファイルに保存されるので、いつでもデータを試すことができます。
Tableau Desktop でフローを開くと、選択したステップまで、操作が適用された状態のフローの作業中のデータ サンプルが表示されます。
注: データを試すことはできますが、Tableau ではデータのサンプルのみが表示されるため、ワークブックをパッケージド ワークブック (.twbx) として保存することはできません。Tableau でデータを操作する準備ができたら、フローの出力ステップを作成し、出力をファイルに保存するかパブリッシュされたデータ ソースとして保存してから、Tableau の完全なデータ ソースに接続します。
Tableau Desktop でデータ サンプルを表示するには、次の手順を実行します。
-
データを表示するステップを右クリックし、コンテキスト メニュ-から [Tableau Desktop でプレビュー] を選択します。
-
Tableau Desktop が [シート] タブで開きます。
データ抽出ファイルとパブリッシュされたデータ ソースを作成する
重要: Tableau Prep Builder バージョン 2020.3.1 以降では、フロー出力用に Tableau データ抽出 (.tde) ファイルを使用できなくなりました。Server バージョン 2020.3 以降にパブリッシュされ、このファイル タイプに出力されるフローは、変換してから、Hyper 抽出 (.hyper) ファイル タイプに出力する必要があります。そうしない場合は、フローの実行に失敗します。フローが Tableau Server または Tableau Online にパブリッシュされる場合、フローの実行エラーを回避するために、フローをダウンロードして、出力タイプを変更し、フローを再パブリッシュします。
フロー出力を生成するには、フローを実行します。フローを実行すると、変更内容がデータ セット全体に適用されます。フローを実行すると、Tableau データ ソース (.tds) および Tableau データ抽出 (.hyper) ファイルが作成されます。
注: データ抽出やパブリッシュされたデータ ソースは、Tableau Server バージョン 10.0 以降、または Tableau Online にパブリッシュできます。
Tableau Prep Builder
フロー出力から抽出ファイルを作成して、Tableau Desktop で使用したり、データをサード パーティに共有したりできます。抽出ファイルは以下の形式で作成できます。
-
Hyper 抽出 (.hyper): これは最新の Tableau 抽出ファイル タイプですが、Tableau Desktop または Tableau Server バージョン 10.5 以降でしか使用できません。
-
コンマ区切り値 (.csv): データをサード パーティに共有するには、抽出を .csv ファイルに保存します。エクスポートされた CSV ファイルは、BOM 付きの UTF-8 でエンコードされます。
Web 上での Tableau Prep Builder
出力をパブリッシュされたデータ ソースとして Tableau Server または Tableau Online にパブリッシュすることで、データのクリーニング、加工、組み合わせを行ったデータへの一元的なアクセスが可能になります。
また、フロー出力をデータベースに保存すると、クリーニングを行って準備が整ったフロー データを使ってテーブル データを作成、置換、または追加することができます。詳細については、フロー出力データを外部データベースに保存するを参照してください。
増分更新を使用してフローを実行することもできます。このオプションを使用すると、時間とリソースを節約でき、全データ セットではなく、新規データのみを更新できます。増分更新を使用して、フローを構成して実行する方法の詳細については、増分更新を使用したフロー データの更新を参照してください。
注: Tableau Prep Builder の出力を Tableau Server にパブリッシュするには、Tableau Server REST API を有効にする必要があります。詳細については、Tableau Rest API ヘルプの「REST API の要件 (英語)」(Link opens in a new window)を参照してください。セキュア ソケット レイヤー (SSL) 暗号化証明書を使用するサーバーにパブリッシュするには、Tableau Prep Builder を実行しているマシンで追加構成ステップが必要です。詳細については、Tableau Desktop および Tableau Prep Builder 導入ガイドの「インストールの前に」(Link opens in a new window)を参照してください。
抽出ファイルを作成する
注: この出力オプションは、Web 上でフローを作成または編集する場合は使用できません。
-
ステップでプラス アイコン
をクリックし、[出力の追加] を選択します。
以前にフローを実行したことがある場合は、出力ステップでフローの実行
ボタンをクリックします。そうすると、フローが実行され、出力が更新されます。
[出力] ペインが開き、データのスナップショットが表示されます。
-
左側のペインで、[Save output to (出力の保存先)] ドロップダウン リストから [ファイル] を選択します。以前のバージョンで [ファイルに保存] を選択します。
-
[参照] ボタンをクリックし、[名前を付けて抽出を保存] ダイアログでファイル名を入力して [許可] をクリックします。
-
[Output type (出力タイプ)] フィールドで、次の出力タイプから選択します。
-
Tableau データ抽出 (.hyper)
-
コンマ区切り値 (.csv)
-
-
(Tableau Prep Builder バージョン 2020.2.1 以降) [書き込みオプション] セクションで、既定の書き込みオプションを表示して、新しいデータをファイルに書き込み、必要に応じて変更します。詳細については、書き込みオプションの構成を参照してください。
-
[テーブルの作成]: このオプションでは、新しいテーブルが作成されるか、既存のテーブルが新しい出力に置き換えられます。
-
[テーブルに追加]: このオプションでは、既存のテーブルに新しいデータが追加されます。テーブルが存在しない場合は、新しいテーブルが作成され、以降の実行でこのテーブルに新しい行が追加されます。
注: [テーブルに追加] では、.csv の出力タイプには対応していません。対応している更新の組み合わせの詳細については、フロー更新オプションを参照してください。
-
- [フローの実行] をクリックしてフローを実行し、抽出ファイルを生成します。
パブリッシュされたデータ ソースを作成する
-
ステップでプラス アイコン
をクリックし、[出力の追加] を選択します。
注: Tableau Prep Builder では、以前パブリッシュされたデータ ソースが更新され、データ ソースに含まれている可能性のあるデータ モデリング (計算フィールドや番号書式など) が維持されます。データ ソースを更新できない場合は、代わりにデータ ソースが置き換えられます。
-
[出力] ペインが開き、データのスナップショットが表示されます。
-
[Save output to (出力の保存先)] ドロップダウン リストから [パブリッシュされたデータ ソース] (以前のバージョンの [データ ソースとしてパブリッシュ]) を選択します。次のフィールドを完了します。
-
サーバー(Tableau Prep Builder のみ): データ ソースとデータ抽出のパブリッシュを行うサーバーを選択します。サーバーにサインインしていない場合は、サインインするよう求められます。
注: Tableau Prep Builder バージョン 2020.1.4 以降では、ユーザーがサーバーにサインインした後、アプリケーションを閉じるときに、Tableau Prep Builder によりサーバー名と認証資格情報が記憶されます。次回アプリケーションを開くと、既にサーバーにサインインしています。
Mac では、Tableau Prep Builder が SSL 証明書を安全に使用して Tableau Server や Tableau Online 環境に接続できるよう、Mac キーチェーンへのアクセスを提供するよう求められることがあります。
Tableau Online に出力している場合は、サイトがホストされているポッドを「serverUrl」に含める必要があります。たとえば、「https://online.tableau.com」ではなく「https://eu-west-1a.online.tableau.com」となります。
-
プロジェクト: データ ソースと抽出を読み込むプロジェクトを選択します。
-
名前: ファイル名を入力します。
-
説明: データ ソースの説明を入力します。
-
-
(Tableau Prep Builder バージョン 2020.2.1 以降) [書き込みオプション] セクションで、既定の書き込みオプションを表示して、新しいデータをファイルに書き込み、必要に応じて変更します。詳細については、書き込みオプションの構成を参照してください。
-
[テーブルの作成]: このオプションでは、新しいテーブルが作成されるか、既存のテーブルが新しい出力に置き換えられます。
-
[テーブルに追加]: このオプションでは、既存のテーブルに新しいデータが追加されます。テーブルが存在しない場合は、新しいテーブルが作成され、以降の実行でこのテーブルに新しい行が追加されます。
-
- [フローの実行] をクリックしてフローを実行し、データ ソースをパブリッシュします。
フロー出力データを外部データベースに保存する
重要: この機能を使用すると、外部データベースのデータを完全に削除したり、置き換えたりできます。データベースに書き込むためのパーミッションがあることを確認してください。
データの損失を防ぐために、[カスタム SQL] オプションを使用してテーブル データのコピーを作成し、フロー データをテーブルに書き込む前にコピーを実行できます。
Tableau Prep Builder バージョン 2020.3.1 以降および Web 上では、Tableau Prep Builder または Web 上でサポートされる任意のコネクタから外部データ ベースにデータを接続し、データを出力できます。これにより、フローが実行されるたびに、フローのクリーニングされた準備済みのデータを使用して、データベース内のデータを追加または更新できます。この機能は、増分更新と完全更新の両方のオプションで使用できます。増分更新を構成する方法の詳細については、増分更新を使用したフロー データの更新を参照してください。
フロー出力を外部データベースに保存すると、Tableau Prep は次の処理を実行します。
- 行を生成し、データベースに対して SQL コマンドを実行します。
- 出力データベースの一時テーブル (または Snowflake に出力する場合はステージング領域) にデータを書き込みます。
- 操作が成功すると、データは一時テーブル (または Snowflake のステージング領域) から宛先テーブルに移動されます。
- ユーザーがデータをデータベースに書き込んだ後に実行する必要のある SQL コマンドを実行します。
SQL スクリプトが失敗すると、フローは失敗します。ただし、データはデータベース テーブルに引き続き読み込まれます。フローの実行をもう一度やり直すか、データベースで SQL スクリプトを手動で実行して適用することができます。
出力オプション
データベースにデータを書き込むときに、次のオプションを選択できます。テーブルがまだ存在しない場合は、フローが最初に実行されるときにテーブルが作成されます。
- [テーブルに追加]: このオプションでは、既存のテーブルにデータが追加されます。テーブルが存在しない場合、フローが最初に実行されるときにテーブルが作成され、後続のフローが実行されるたびにそのテーブルにデータが追加されます。
- [テーブルの作成]: このオプションでは、フローのデータで新しいテーブルが作成されます。テーブルが既に存在する場合、テーブルと、テーブルに定義されている既存のデータ構造またはプロパティは削除され、フロー データ構造を使用する新しいテーブルに置き換えられます。フローに存在するフィールドは、新しいデータベース テーブルに追加されます。
- [データの置換]: このオプションでは、既存のテーブルのデータが削除され、フローのデータに置き換えられますが、データベース テーブルの構造とプロパティは保持されます。テーブルが存在しない場合、フローが最初に実行されるときにテーブルが作成され、後続のフローが実行されるたびにテーブル データが置き換えられます。
その他のオプション
書き込みオプションに加えて、カスタム SQL スクリプトを含めるか、データベースに新しいテーブルを追加できます。
- カスタム SQL スクリプト: カスタム SQL を入力し、データがデータベース テーブルに書き込まれる前か後、または前後にスクリプトを実行するかどうかを選択します。これらのスクリプトを使用すると、フロー データがテーブルに書き込まれる前にデータベース テーブルのコピーを作成したり、インデックスを追加したり、他のテーブル プロパティを追加したりすることができます。
-
[新しいテーブルの追加]: 既存のテーブル リストからテーブルを選択するのではなく、一意の名前を持つ新しいテーブルをデータベースに追加します。既定のスキーマ (Microsoft SQL Server と PostgreSQL) 以外のスキーマを適用する場合は、構文
[schema name].[table name]
を使用してスキーマを指定できます。
サポートされるデータベースとデータベース要件
Tableau Prepでは、選択した数のデータベースのテーブルへのフロー データの書き込みをサポートしています。Tableau Online のスケジュールに従って実行されるフローは、クラウドでホストされている場合にのみ、これらのデータベースに書き込むことができます。
一部のデータベースには、データの制限や要件があります。Tableau Prep では、ピーク パフォーマンスを維持するため、サポートされているデータベースにデータを書き込む際に、いくつかの制限が設けられる場合があります。次の表に、フロー データを保存できるデータベースと、データベースの制限または要件を示します。これらの要件を満たさないデータを使用すると、フローの実行時にエラーが発生する可能性があります。
注: フィールドの文字数制限の設定はまだサポートされていません。ただし、文字制限の制約を含むテーブルをデータベースに作成し、[データの置換] オプションを使用して、データベース内のテーブル構造を維持したまま、データを置き換えることができます。
データベース | 要件または制限 |
---|---|
Amazon Redshift |
|
Microsoft SQL Server |
|
MySQL |
|
Oracle |
|
PostgreSQL |
|
Snowflake |
|
Teradata |
|
フロー データをデータベースに保存する
- ステップでプラス アイコン
をクリックし、[出力の追加] を選択します。
- [Save output to (出力の保存先)] ドロップダウン リストから [データベース テーブル] を選択します。
-
[設定]タブで、次の情報を入力します。
[接続] ドロップダウン リストで、フロー出力の書き込みに使用するデータベース コネクタを選択します。サポートされているコネクタのみが表示されます。これらのコネクタは、フロー入力に使用したコネクタと同じコネクタか、別のコネクタです。別のコネクタを選択すると、サインインを求めるメッセージが表示されます。
重要: 選択したデータベースへの書き込みパーミッションがあることを確認してください。パーミッションがないと、フローでデータが部分的にしか処理されない可能性があります。
- [データベース] ドロップダウン リストで、フローの出力データを保存するデータベースを選択します。
[テーブル] ドロップダウン リストで、フローの出力データを保存するテーブルを選択します。選択した [書き込みオプション」 に応じて、新しいテーブルが作成されたり、フロー データによってテーブル内の既存のデータが置き換えられたり、フロー データが既存のテーブルに追加されたりします。
データベースに新しいテーブルを作成するには、フィールドに一意のテーブル名を入力し、[新しいテーブルの作成] をクリックします。選択した書き込みオプションに関係なく、フローを初めて実行すると、フローと同じスキーマを使用してデータベースにテーブルが作成されます。
-
[出力] ペインには、データのスナップショットが表示されます。フィールドの比較には、テーブル内のフィールドと一致する、フローのフィールドが表示されます (テーブルが既に存在する場合)。テーブルが新規の場合は、1 対 1 のフィールド一致が表示されます。
フィールドの不一致がある場合は、ステータス メモにエラーが表示されます。
- [一致なし: フィールドは無視されます]: フィールドはフロー内に存在しますが、データベースには存在しません。[テーブルの作成] 書き込みオプションを選択して完全更新を実行しない限り、フィールドはデータベース テーブルに追加されません。完全更新を実行すると、フローのフィールドがデータベース テーブルに追加され、フロー出力スキーマが使用されます。
- [一致なし: フィールドに Null 値が含まれます]: フィールドはデータベースに存在しますが、フローには存在しません。フローは、フィールドがあるデータベース テーブルに Null 値を渡します。フローにフィールドが存在するが、フィールド名が異なるため、フィールドが一致しない場合は、クリーニング ステップに移動し、データベースのフィールド名と一致するようにフィールド名を編集できます。フィールド名を編集する方法の詳細については、クリーニング操作の適用を参照してください。
- [エラー: フィールドのデータ型が一致しません]: フローのフィールドと、出力の書き込み先のデータベース テーブルのフィールドに割り当てられるデータ型が一致する必要があります。一致しない場合、フローの実行に失敗します。クリーニング ステップに移動し、フィールドのデータ型を編集すると、この不一致を修正できます。データ型の変更の詳細については、データに割り当てられたデータ型の確認を参照してください。
- 書き込みオプションを選択します。完全更新用と増分更新用に別のオプションを選択できます。フロー実行方法を選択するとオプションが適用されます。増分更新を使用したフローの実行の詳細については、増分更新を使用したフロー データの更新を参照してください。
- [テーブルに追加]: このオプションでは、既存のテーブルにデータが追加されます。テーブルが存在しない場合、フローが最初に実行されるときにテーブルが作成され、後続のフローが実行されるたびにそのテーブルにデータが追加されます。
- [テーブルの作成]: このオプションでは、新しいテーブルが作成されます。同じ名前のテーブルが既に存在する場合は、既存のテーブルが削除され、新しいテーブルに置き換えられます。テーブルに定義されている既存のデータ構造やプロパティも削除され、フロー データ構造に置き換えられます。フローに存在するフィールドは、新しいデータベース テーブルに追加されます。
- [データの置換]: このオプションでは、既存のテーブルのデータが削除され、フローのデータに置き換えられますが、データベース テーブルの構造とプロパティは保持されます。
-
(オプション) [カスタム SQL] タブをクリックし、SQL スクリプトを入力します。データがテーブルに書き込まれる [Before (前)]と [After (後)] に、実行するスクリプトを入力できます。
- [フローの実行] をクリックしてフローを実行し、選択したデータベースにデータを書き込みます。