Tableau Prep Builder の新機能

現在サポートされているバージョンに対する新機能の概要について説明します。

: バージョン 2019.1.2 以降、Tableau Prep は Tableau Prep Builder という名称に変更されました。

バージョン 2020.3 3 での追加

Tableau Prep Builder のインストールと展開

クラッシュ後にフローを自動的に復元する

Tableau Prep Builder では、Tableau Desktop と同様にクラッシュが発生した場合にフローが自動的に保存されます。次回アプリケーションを開くと、ダイアログに復元されたフローの選択可能なリストが表示されます。復元されたフローを開いて中断した場所から続行するか、必要がない場合は復元されたフロー ファイルを削除することができます。復元されたフローは マイ Tableau Prep リポジトリ[Recovered Flows (復元されたフロー)] フォルダーに保存されます。このダイアログは、[Recovered Flows (復元されたフロー)] フォルダーにフローの下書きが保存されている場合、Tableau Prep Builder を開くたびに表示されます。

この機能は既定で有効になっていますが、インストール中またはインストール後に管理者がオフにすることができます。

詳細については、フローの保存を参照してください。

フローの構築と編成

新規ユーザーの迅速なオンボーディング

データ ソースに接続してデータをワークスペースにドラッグすると、Tableau Prep Builder ではインプット ステップの横に仮想のクリーニング ステップが表示され、次にクリーニング ステップを追加できる場所が示されます。提案されたクリーニング ステップをクリックするだけで、ステップがワンクリックで追加され、データの詳細を見ることができるため、すぐにデータを調べてクリーニングすることができます。

詳細については、フローの構築と編成を参照してください。

グループのステップ

フローを整理する際は、新しいグループ オプションを使用して、一連の接続されているステップを選択し、フォルダーに集約します。この新機能により、大規模で複雑なフローを簡単にナビゲート、調査、他のユーザーと共有することができます。他のユーザーは、フロー全体を理解する代わりに、フローに関連するステップのグループだけに集中できます。

グループの色の変更や説明の追加、フローの他の領域にグループ化されたステップをコピーして貼り付けたり、グループ化されたステップをサーバー上のファイルに保存して他のフローで再利用したりすることもできます。

グループ化する一連のステップを選択し、メニューから [グループ] を選択します。

選択したステップは、名前を付けることができるフォルダーに集約します。いつでもグループにステップを追加したり、グループからステップを削除したりすることができますが、同じグループに含めることができるのは、フロー ラインで直接相互に接続されているステップのみです。二重矢印をクリックして、いつでもグループを展開したり、折りたたんだりすることができます。

詳細については、フローの構築と編成を参照してください。

データのクリーニングと形成

日付フィールドを変換する場合は、カスタム会計年度を使用します。

会計年度が 1 月に開始しない場合は、カスタム月を設定でき、Tableau Prep Builder では日付フィールド値または日付と時刻のフィールド値を別の日付部分に変換するときに、その開始月が使用されます。フィールドの [その他のオプション] メニューで [日付の変換] > [カスタム会計年度] を選択し、カスタム会計年度の開始月と、別のフィールド値に変換する日付部分を 1 つの簡単な手順で設定します。

詳細については、クリーニング操作の適用を参照してください。

トップ メニューから Rserve とTabPy をグローバルに設定する

以前のリリースでは、フローにスクリプト ステップを含める場合、接続が含まれる各フローのそれぞれのスクリプト ステップで R または TabPy への接続を構成する必要がありました。今後は、[ヘルプ] のトップ メニューからこれらの分析拡張機能の構成を一度に設定でき、Tableau Desktop と同様に、作業するすべてのフローに対して構成を適用することができます。

[ヘルプ] > [設定とパフォーマンス] > [分析拡張機能の接続の管理] を選択し、ドロップダウン リストから [Rserve] または [Tableau Python (TabPy)] を選択し、接続情報を入力します。両方の分析拡張機能を使用する場合は、同じダイアログを使用して、各サーバーの接続情報を入力できます。

重要: スクリプト ステップが含まれている Tableau Prep Builder バージョン 2020.3.3 以降で古いフローを開く場合は、この新しいダイアログを使用してサーバー接続を再構成する必要があります。

フローでの Rserve および Tableau Python (TabPy) の使用については、フローでの R および Python スクリプトの使用を参照してください。

作業の保存と共有

増分更新構成を保存して再利用する

今後は、増分更新用にインプット ステップやアウトプット ステップを構成する場合に、その構成を保持して再利用できます。これらのステップは、コピーして貼り付けたり、後で再利用するために保存したりできます。ステップを新しいフローに適用すると、増分更新の構成情報が保持されるため、構成を最初から再設定する必要がなくなります。

増分更新を使用した設定については、増分更新を使用したフロー データの更新を参照してください。

バージョン 2020.3.1 での追加

作業の保存と共有

フロー出力データを外部データベースに保存する

サポートされているデータベースに完全フローまたは増分フローの結果を出力し、クリーニングされた準備済みのフロー データを使ってテーブル データを作成、置換、または追加できるようになりました。Tableau Prep Builderでは、フロー データを次のデータベースに保存できます。

  • Amazon Redshift
  • Microsoft SQL Server
  • MySQL
  • Oracle
  • PostgreSQL
  • Snowflake
  • Teradata

出力ステップで、[Save output to (出力の保存先)] ドロップダウン メニューから [データベース テーブル] を選択します。次に、フロー出力を保存するデータベースとテーブルを選択します。また、テーブル名を入力して、データベースに新しいテーブルを作成するすることもできます。フィールドの比較プレビューには、フロー内のフィールドとテーブル内のフィールド間で一致するステータスが表示されます。ステータス フィールドには、一致しないフィールドの詳細が表示されます。

データがデータベース テーブルに読み込まれる前後に実行できる SQL スクリプトを追加することもできます。フローを実行する前に、これらのスクリプトを使用して、テーブル データのコピーを作成したり、インデックスを追加したり、データベース テーブルにデータベース制約を追加したりできます。

フロー出力をテーブルに保存する方法の詳細については、フロー出力データを外部データベースに保存する (バージョン 2020.3.1 以降)を参照してください。

Tableau データ抽出 (.tde) ファイルはサポートされなくなった

バージョン 2020.3.1 以降では、フロー出力用に Tableau データ抽出 (.tde) ファイルを使用できなくなりました。Server バージョン 2020.3 以降にパブリッシュされ、Tableau データ抽出 (.tde) ファイル形式として出力されるフローは、Hyper 抽出 (.hyper) ファイルに変換する必要があります。変換しないと、フローの実行に失敗します。フロー入力に対しては、Tableau データ抽出 (.tde) ファイルを引き続き使用できます。

データ抽出の作成とパブリッシュに関する詳細については、データ抽出とデータ ソースの作成とパブリッシュを参照してください。

コマンド ラインからフローを実行するための .json 認証資格情報ファイルの作成が簡単になった

コマンド ラインを使用してフローを実行し、サーバーまたはデータベースに接続または出力する場合、.json 認証資格情報ファイルを作成するときに、より簡単な構文を使用できるようになりました。以前のバージョンでは、接続認証資格情報を使用して、"inputConnection" 配列 と "outputConnection" 配列を別々に指定する必要がありました。バージョン 2020.3.1 以降では、"inputConnection" と "outputConnection" を区別する必要がなくなりました。代わりに、新しい "tableauServerConnections" 配列または "databaseConenctions" 配列を使用すれば、サーバー接続またはデータベース接続の認証資格情報を入力するだけで済みます。

"inputConnection" 配列と "outputConnection" 配列を使用する従来の .json 認証資格情報ファイルは、引き続きサポートされています。

詳細については、コマンド ラインからフロー出力ファイルを更新を参照してください。

バージョン 2020.2.3 での追加

データへの接続

OAuth 認証を使用した Snowflake のデータへの接続

Snowflake を使用してデータに接続する場合は、Tableau Desktop と同様に、次のいずれかの認証方法を使用できます。

  • ユーザー名とパスワード

  • SAML IdP

  • OAuth

このコネクタを使用したデータ ソースへの接続の詳細については、Tableau Desktop ヘルプの「Snowflake」(Link opens in a new window)を参照してください。

バージョン 2020.2.2 で追加

データへの接続

Tableau Server や Tableau Online を使用したデータへの接続

以前のバージョンでは、Tableau Server や Tableau Online に保管されているパブリッシュされたデータ ソースに接続できました。今後は、Tableau Catalog が有効になっている Data Management アドオン(Link opens in a new window)を使用している場合、Tableau Server や Tableau Online に保存されているデータベースやテーブルも検索して接続することができます。

[接続] ペインの新しい [データの検索] セクションで [Tableau Server] を選択して、サーバーにサインインするだけで実行できます。[データの検索] ダイアログでデータ ソースを検索して、選別された中からデータ ソース選択できます。

データ ソースの説明、データ品質の警告、証明書などの追加のメタ データにより、Tableau Prep Builder を利用しながら、探しているデータ ソースを見つけることができます。右上隅のフィルター オプションを使用して、接続タイプ、データ品質の警告、証明書などで結果をフィルター処理することもできます。

Tableau Catalog が有効になっている Data Management アドオンを使用していない場合、パブリッシュされたデータ ソースのみが表示され、メタ データは表示できません。

データへの接続の詳細については、パブリッシュされたデータ ソースへの接続 (バージョン 2019.3.1 以降)を参照してください。

Alibaba MaxCompute を使用したデータへの接続

データをデータ ウェアハウスに保管している場合は、Alibaba MaxCompute を使用してこのデータ ソースに接続できるようになりました。このコネクタを使用したデータ ソースへの接続の詳細については、Tableau Desktop ヘルプの「Alibaba MaxCompute」(Link opens in a new window)を参照してください。

バージョン 2020.2.1 で追加

データへの接続

Salesforce.com データへの接続

Tableau Prep Builder で Salesforce データに接続できるようになったため、データのクリーニングと準備を行ってから Tableau で分析できます。カスタム SOQL の使用と標準接続の作成にはまだ対応していません。

詳細については、Salesforce データへの接続 (バージョン 2020.2.1 以降)を参照してください。

フロー データを最新に維持する

増分更新を使用して最新のデータのみを処理する

フロー データが常に変化している場合、増分更新を使用して、フローの最後の実行以降に最新のデータ行のみを取得して処理することにより、時間とリソースを節約できます。この操作は、フローの増分更新パラメーターを構成して、入力データから新しい行を検出して取得する方法を Tableau Prep Builder に通知するだけで行えます。出力ステップでフローを実行したときに、出力テーブルを更新する方法を構成することもできます。

出力ステップの新しいオプションを使用すると、既存のテーブルに新しいデータを追加したり、Tableau Prep Builder の既存の機能を使って、テーブル データを新しいデータに置き換えたりできます。このオプションは、増分更新と完全更新の両方のタイプで使用できます。

Tableau Prep Conductor を使用して、フローを設定し、スケジュールに従ってフローを実行するか、Tableau Prep Builder かコマンド ライン インターフェイスで個々のフローを徐々に実行します。

: 増分更新を使用してフローをスケジュールするには、Tableau Server バージョン 2020.2 以降が必要です (Tableau Prep Conductor を有効にした状態で)。

増分更新を使用したフローの設定と実行の詳細については、増分更新を使用したフロー データの更新を参照してください。

バージョン 2020.1.4 での追加

データへの接続

Impala を使用したデータへの接続

Tableau Desktop と同様、Impala を使用して、より大きなデータ セットに簡単に接続できるようになりました。

Impala を使用したデータ ソースへの接続の詳細については、Tableau Desktop ヘルプの「Impala」(Link opens in a new window)を参照してください。

データのクリーニングと加工

シングル クリックで日付の値を変換する

データ クリーニングをさらに簡単にするために、Tableau Prep Builder には日付用の別のクイック クリーニング メニューが追加されました。年、月、日などの DATEPART を表示するために日付の値を変換する必要がある場合は、複雑なフィールド計算を記述するのではなく、新しい [日付の変換] メニューから次のメニュー オプションのいずれかを選択できます。

日付へのクリーニング操作の適用の詳細については、クリーニング操作の適用を参照してください。

作業の保存と共有

サーバーへの接続状態を維持する

Prep Builder を開くたびに Tableau Server または Tableau Online にサインインする必要はなくなりました。今後、Tableau Prep Builder はアプリケーションを閉じるときにサーバー名とログイン情報を記憶するので、次回アプリケーションを開いたときには既にサーバーにログインした状態になります。

このオプションを使用すると時間の節約になり、データ ソースのパブリッシュや保存したフロー ステップの挿入を行うためにシームレスに接続するのに役立ちます。また、特定の機能がサーバー バージョンと互換性があるかどうかを知る必要がある場合には、最初にサーバーにサインインしなくても互換性に関する警告がすぐに表示されます。

詳細については、データ ソースとしてパブリッシュを参照してください。

バージョン 2020.1.3 での追加

Tableau Prep Builder のインストールと展開

ログインベースのライセンス管理のサポート

ログインベースのライセンス管理 は、Tableau ServerTableau Online で Creator ロールを持つユーザーのライセンス管理に役立ちます。Explorer または Viewer ビューアーのロールを持つユーザーは、この機能を使用できません。Tableau Server または Tableau Online で役割ベースのサブスクリプションを使用している場合は、ログインベースのライセンス管理 を使用してライセンス管理を簡略化し、個別の Tableau Desktop および Tableau Prep Builder プロダクト キーを削減できます。オンプレミスの Tableau Server では、1 つまたは複数のプロダクト キーの管理のみが必要となります。Tableau Online の場合は、プロダクト キーをまったく管理する必要がありません。

データへの接続

初期 SQL を使用してデータ ソースにパラメーターを渡す

初期 SQL を使用してデータ ソースにパラメーターを渡して、Tableau Prep アプリケーション、バージョン、およびフロー名に関するより多くの詳細情報を提供できるようになりました。Tableau Prep Builder では、次のパラメーターがサポートされます。

  • TableauApp - データ ソースへのアクセスに使用されているアプリケーション (Prep Builder または Prep Conductor) を返します。

  • TableauVersion - アプリケーションのバージョン番号を返します。Tableau Prep Builder の場合、2020.1.1 などの正確なバージョン番号が返されます。Tableau Prep Conductor の場合、Tableau Prep Conductor が有効になっているメジャー サーバー バージョン (2020.1 など) が返されます。

  • FlowName - .tfl ファイルの名前を返します。

初期 SQL を使用してデータ ソースに接続する際のパラメーターの使用の詳細については、初期 SQL ステートメントにパラメーターを含める (バージョン 2020.1.3 以降)を参照してください。

データのクリーニングと加工

詳細レベル (LOD)、ランク、行番号の計算を使用してデータをクリーニングする

データが必要とは異なるレベルで集計される場合、または一連の行に対して計算を実行する必要がある場合は、FIXED 詳細レベル (LOD) と RANK および ROW_NUMBER 分析関数計算を使用して、データ セットに必要なデータを作成できるようになりました。

たとえば、FIXED LOD 計算を追加して、表のフィールドの粒度を変更できます。新しい ROW_NUMBER () 分析関数を使用して、重複行をすばやく検索したり、新しい RANK () 関数のいずれかを使用して、類似したデータを持つ選択行の上位 N 個または下位 N 個の値を検索したりできます。

これらのタイプの式を作成する際に、より詳しいガイド付きの操作を行いたい場合は、新しいビジュアル計算エディターを使用できます。

これらの計算フィールドを使用してデータをクリーニングする方法の詳細については、詳細レベルとランク計算の作成を参照してください。

バージョン 2020.1.1 での追加

データへの接続

フロー入力をマップして元の接続に戻す

複数の入力を使用してフローを構築すると、接続の更新や切り替えが必要となったときに、異なる入力に使用した個々のテーブルまたはデータ ソースを見つけようとしても、はっきりとわからないことがあります。フロー入力やテーブルを簡単に検出できるように、[接続] ペインで選択した入力のコネクタとテーブルをハイライトする新しい機能が追加されました。

[フロー] ペインで 1 つ以上のインプット ステップを選択するだけで、関連するコネクタとテーブルが [接続] ペインにハイライトされます。

フローを構築するためのデータへの接続方法に関する詳細については、データへの接続(Link opens in a new window)を参照してください。

データのクリーニングと加工

パフォーマンス向上のためデータの更新を一時停止する

データにクリーニング操作を適用するたびに Tableau Prep Builder でビューが更新されるため、変更の結果を即座に確認できます。新しいフローを構築する際は、この定期的なフィードバックによって次に実行する手順をすばやく把握することができますが、これらの変更の適用には時間がかかることがあります。パフォーマンスを向上させ、データへの変更をより迅速に適用するために、こうした定期的なデータ更新を一時停止し、変更を一括で適用できるようになりました。

トップ メニューの [データ更新の一時停止] ボタンを選択するだけで、Tableau Prep Builder でデータの更新が一時停止され、[プロファイル] ペインのビューが [リスト] ビューに切り替わります。これにより、変更をすばやく適用できます。

変更を加えるたびに毎回ビューが更新されるのではなく、フィールド メタデータのみが表示されます。変更の完了時にフィールド値の結果を確認する場合は、[データ更新の再開] ボタンをクリックして、標準のデータ更新モードに戻します。

: タスクの実行にデータ値を必要とするクリーニング操作は、データの更新が一時停止している間は無効になります。

データの更新を一時停止してクリーニング操作を一括で適用する方法の詳細については、パフォーマンス向上のためデータの更新を一時停止するを参照してください。

Tableau Prep とのバージョン互換性

互換性のない機能を検出して有効にする

Tableau Prep Builder バージョン 2019.3.1 では、警告アイコンとツールヒントを追加しました。これにより、フローをパブリッシュし、スケジュールに従って実行する場合に、フローに含める機能に関する判断ができるようにフローを構築し、これにお使いの Tableau Server のバージョンと互換性のない機能を簡単に確認できるようになりました。

このリリースでは、お使いのサーバー バージョンと互換性のない新機能を使用して作業する際の透明性がさらに向上しました。

これで、サーバーにサインインした後、Tableau Prep Builder でお使いの Tableau Server バージョンと互換性のない機能を検出し、それらの機能を無効にできます。これにより、フローをパブリッシュし、スケジュールに従って実行する場合に含めることができる機能を推測しないで済みます。

この機能を引き続き使用して、Tableau Prep Builder でフローを手動で実行するか、コマンド ラインから実行する場合は、メニューから有効にできます。[機能を使用する] ボタンをクリックするだけで機能がフローに適用され、互換性のないすべての機能が有効になり、使用できるようになります。

Tableau Prep Builder バージョン 2019.3.1 で導入された警告オプションでサーバーと互換性のない機能を引き続き識別できるため、Tableau Server でスケジュールを使用してフローを実行する場合は、それらの機能を簡単に見つけて削除できます。

互換性のない機能の使用に関する詳細については、Tableau Prep とのバージョン互換性を参照してください。

フロー データを最新に維持する

フローのパブリッシュ時にクラウド コネクタの認証資格情報を追加または埋め込む

以前のバージョンでは、クラウド コネクタを含むフローをパブリッシュおよびスケジュールする場合は、事前に Tableau Server または Tableau Online で認証資格情報を構成する必要がありました。構成しないと、Tableau Prep Conductor で認証資格情報を検出できず、フローの実行に失敗していました。いくつかの簡単な手順で、Tableau Prep Builder の [パブリッシュ] ダイアログからクラウド コネクタの認証資格情報を直接追加したり埋め込んだりできるようになりました。

手順は、サーバーにサインインし、[サーバー] > [フローのパブリッシュ] を選択するだけです。これで、[フローのパブリッシュ] ダイアログに新しい警告テキストが表示され、認証を必要とする入力接続があることが表示されるようになります。メッセージの [接続の編集] リンクをクリックするか、[接続] セクションの [編集] リンクをクリックし、[認証] ドロップダウンで [認証資格情報の追加] を選択します。

選択内容を確認するセカンダリ メッセージが表示されます。[続行] をクリックして Tableau Server または Tableau Online[アカウント設定] ページに移動し、認証資格情報を追加します。

完了したら、Tableau Prep Builder に戻って [完了] をクリックすると、新しい認証資格情報がフローに自動的に埋め込まれます。

パブリッシュ時にクラウド コネクタの認証資格情報を追加する方法の詳細については、フローのパブリッシュを参照してください。

バージョン 2019.4.2 での追加

データへの接続

新しいコネクタを使用してさらに多くのデータに接続する

今回のリリースでは、以下の新しいデータ コネクタが追加されています。

  • Alibaba AnalyticDB for MySQL
  • Alibaba Data Lake Analytics
  • Databricks
  • Kyvos
  • Qubole Presto

上記のコネクタを使用してデータへ接続する方法の詳細については、「Tableau Desktop と Web 作成のヘルプ」の「サポートされるコネクタ」(Link opens in a new window)を参照してください。フローを構築するためのデータへの接続の詳細については、データへの接続(Link opens in a new window)を参照してください。

データのクリーニングと加工

列から行へのピボット処理の簡易化

列から行にデータをピボットする必要がある場合、プロファイル ペインでフィールドを手動で選択してピボットすることができます。また、ピボットするフィールドを推奨する Tableau Prep Builder の機能を使用してピボットを作成することもできます。どちらのオプションでも [ピボット] ステップが自動的に生成されるため、ピボット処理されたフィールドの名前変更や追加フィールドのピボット処理といったピボット操作を迅速に実行できます。

[プロファイル] ペインで列から行へ手動でピボット処理するには、ピボット処理するフィールドを選択し、右クリックまたは Ctrl を押しながらクリック (MacOS) して、メニューの [列から行へピボット処理する] を選択します。これにより新しいピボット ステップが作成され、フィールドのピボット処理が実行されます。

Tableau Prep Builder でピボット処理が可能なフィールドが検出されると、[プロファイル] ペイン ツール バーに推奨オプションが表示されます。ツールバーにある電球 アイコンをクリックして、ピボットの推奨事項を選択します。推奨事項に、ピボット処理するフィールドが表示されます。[適用] をクリックすると [ピボット] ステップが生成され、フィールドのピボット処理が実行されます。

データのピボット処理に関する詳細については、データのピボット処理を参照してください。データのクリーニングに推奨事項を使用する方法の詳細については、推奨を使用したクリーニング操作の適用 (バージョン 2018.3.2 以降)を参照してください。

拡張機能

実行時間の長い操作に関するフィードバックを表示する

大きなデータ セットやフローを処理する際の可視性を高めるために、[フロー] ペインの上部に進捗状況インジケーターを追加しました。これにより、Tableau Prep Builder でデータを処理中に最新状況を確認できるようになりました。バックグラウンドで実行している Tableau Prep Builder の状況を確認できるようになったので、データがまだ処理中であることや、問題が発生したことがわかるようになりました。

ログインベースのライセンス管理のサポート

ログインベースのライセンス管理 は、Tableau ServerTableau Online で Creator ロールを持つユーザーのライセンス管理に役立ちます。Explorer または Viewer ビューアーのロールを持つユーザーは、この機能を使用できません。Tableau Server または Tableau Online で役割ベースのサブスクリプションを使用している場合は、ログインベースのライセンス管理 を使用してライセンス管理を簡略化し、個別の Tableau Desktop および Tableau Prep Builder プロダクト キーを削減できます。オンプレミスの Tableau Server では、1 つまたは複数のプロダクト キーの管理のみが必要となります。Tableau Online の場合は、プロダクト キーをまったく管理する必要がありません。

バージョン 2019.4.1 での追加

データへの接続

クラウド内でより多くのデータに接続する

今回のリリースでは、以下のクラウド コネクタが追加されています。

  • Box
  • DropBox
  • Google Drive
  • OneDrive

フローを Tableau Server または Tableau Online にパブリッシュする場合は、設定を追加して上記コネクタの認証資格情報を保存しておく必要が生じる場合があります。クラウド データ コネクタへの接続に関する詳細については、クラウド データ ソースへの接続を参照してください。

拡張機能

利用状況データを Tableau と共有する

Tableau では、既存の機能改善と新機能の開発に向けて、製品の利用状況を把握するのに役立つデータを収集しています。利用状況データは、すべて Tableau プライバシー ポリシー(Link opens in a new window)に従って収集と処理が行われます。ただし、参加したくない場合はオプト アウトできます。

オプト アウト オプションが変更されました。利用状況データの収集は、既定で有効になっています。参加したくない場合は、標準またはカスタマイズ (MacOS) のインストーラーで [製品使用状況データを送信しない] チェック ボックスをオンにします。インストール後は、[ヘルプ] メニューでこのチェック ボックスをオンにしてください。

詳細については、Tableau Desktop および Tableau Prep 導入ガイドの「利用状況レポートをオフにする」(Link opens in a new window)を参照してください。

MacOS 用の既定のデータベース ドライバーの自動インストール終了

Mac に Tableau Prep Builder をインストールする場合は、PostgreSQL データベース ドライバーのみが自動的にインストールされます。データへの接続にその他のドライバーが必要な場合は、[ドライバーのダウンロード](Link opens in a new window) ページからインストールできます。

バージョン 2019.3.2 での追加

フローの構築と編成

ワン クリックで必要な場所にステップを挿入する

以前のバージョンでは、フロー内の既存のステップの後にクリーニング ステップを挿入することができ、フローは新しいステップのためのスペースを作るために右方向に拡張されていました。ただし、既存のステップの後に他のステップのタイプを追加するとフローに分岐が作成されてしまうため、フロー線を削除または追加して再接続しなければなりませんでした。

このリリースでは新しい挿入メニューが追加され、既存のステップの間に任意のステップのタイプ (コピーされたステップを含む) をワン クリックで挿入できるようになりました。ステップを挿入する場所のフロー線にカーソルを合わせて新しい [挿入] メニューを使用すれば、適切な場所で必要なステップのタイプを選択して挿入できます。

: [ステップの挿入] メニュー項目が、[追加] メニューからこの新しいメニューに移動されました。このオプションは、インプット ステップ タイプや出力ステップ タイプでは利用できません。

フローにステップを追加および挿入する方法の詳細については、ステップの追加または挿入を参照してください。

フロー ナビゲータを使用して大規模なフローを簡単に確認する

大規模なフローを使用しているときに、前後にスクロールしてステップの検索や変更を行ったり変更したりするのは困難な場合があります。新しいフロー ナビゲータ ツールが、[フロー] ペインの右下隅に表示されます。このツールは、フロー全体の縮小版イメージです。これを使用して拡大/縮小を行ったり、イメージの一部をクリックしてフローのその部分に直接移動したり、フロー サイズを調整したりすることができます。ツールを表示したくない場合は最小化でき、1 回クリックすれば復元できます。

データへの接続およびフローの構築に関する詳細については、フロー ナビゲータ ツールの使用を参照してください。

データの検証とフィルタリング

カスタム データの役割を使用して類似の値をグループ化する

Tableau Prep Builder バージョン 2019.3.1 で、データ セット内のフィールド値を使用して独自のカスタム データの役割を作成する機能が導入されました。このリリースでは、これらのカスタム データの役割を使用して、読み方と発音に基づいてフィールド内の値をグループ化し、無効な値を照合して最も近い有効な値に置き換えることで、自動的に修正できるようになりました。

フィールドにカスタム データの役割を適用すると、標準値と一致しない値が赤い感嘆符でマークされます。

無効な値を修正するには、フィールドの [推奨事項] アイコンをクリックして推奨事項を適用し、無効な値をグループ化して有効な値に置き換えるか、[グループ化と置換] > [スペル] または [その他のオプション] メニューから [読み方 + スペル] を選択して、無効な値を修正する方法を選択します。

カスタム データの役割を作成および使用する方法の詳細については、類似の値をデータの役割でグループ化するを参照してください。

データのクリーニングと加工

新しいリスト ビューを使用してフィールドにクリーニング操作を適用する

現在、[プロファイル] ペイン、[結果] ペイン、またはデータ グリッドでクリーニング操作を適用できます。ただし、一度に表示できるフィールドの数は、画面のサイズによって制限されます。すべてのフィールドをスキャンして簡単に操作できるようにするために、[プロファイル] ペインまたは [結果] ペインをリストに変換できる新しいリスト ビューが追加されました。このオプションを選択すると、このビューの状態がフロー内のすべてのステップで保持されますが、いつでも変更できます。

このビューでは、[削除][保持] などの複数のフィールドに操作を適用したり、[フィールド名の変更][フィールドの重複] などのクリーニング操作をすばやく適用したりできます。[その他のオプション] メニューから他のクリーニング操作を適用することもできますが、[グループ化と置換][フィルター][値の分割] などの操作では、[プロファイル] ペインまたは [結果] ペインのビューに戻ってアクションを完了できます。

リスト ビューのクリーニングに関するフィールドの詳細については、ビューの選択を参照してください。

再利用可能なステップを自分や他のユーザーの仕事に活用する

データを使用して同じアクションを何度も繰り返し実行することが多い場合は、フロー ステップやその関連するアクションを 1 つ以上選択するか、またはフロー全体を選択して保存し、作成および管理する他のフローで再利用することができます。ステップをローカルに保存したり、Tableau ServerTableau Online にパブリッシュして他のユーザーと共有したりできます。

再利用可能なステップを作成するには、保存するステップを選択し、右クリックして [ステップをフローとして保存] を選択します。次にステップをローカル ファイルに保存するかサーバーに保存するかを選択します。フロー ステップをサーバーにパブリッシュするときに [保存されたステップ] タグが自動的に追加され、後でフロー ステップを簡単に見つけられるようになります。

フローを保存した後は、任意のフローを開いて挿入できます。[フロー] ペイン キャンバス内の任意の場所で右クリックまたは Ctrl を押しながらクリック (MacOS) し、[フローの挿入] を選択するか、トップ メニューから [編集] > [フローの挿入] を選択します。[フローの追加] ダイアログで、ファイルまたはサーバーに保存されたフロー ステップを選択して挿入できます。このダイアログが自動的にフィルタを適用して、すべてのフローを [保存されたステップ] タグを付けて表示しますが、フィルタを変更して、アクセス許可を持つ任意のフローを挿入できます。

選択したフローが [フロー] ペインに追加され、フロー内で必要となる場所にステップを移動して接続できるようになります。再利用可能なフロー ステップを作成および使用する方法の詳細については、データのクリーニングと加工を参照してください。

作業の保存と共有

コマンド ラインからフローを実行する場合に、Mac OS のキーチェーン ダイアログを無効にする

MacOS 上のコマンド ラインからフローを実行するときに、ユーザーが毎回 MacOS にキーチェーン認証資格情報を手動で入力する必要がなくなりました。

詳細については、コマンド ラインからフロー出力ファイルを更新の「SSL 検証の無効化 (MacOS)」コマンド オプションを参照してください。

バージョン 2019.3.1 での追加

データへの接続

Google BigQuery を使用したデータへの接続

Google BigQuery を使用して、クラウド内のより多くのデータに接続します。Tableau Desktop と同様に、Google OAuth 接続が構成されていれば、Google BigQuery に格納されているデータに接続してフローを Tableau Server および Tableau Online にパブリッシュできるようになりました。

: Tableau Prep Builder では、Google BigQuery のカスタマイズ属性の使用は現在サポートされていません。また、Google BigQuery コネクタを含むフローは、コマンド ラインから実行できません。代わりに、手動でフローを実行するか、Tableau Server または Tableau Online のスケジュールに基づいてフローを実行します。

Google BigQuery への接続方法の詳細については、Tableau Desktop ヘルプの「Google BigQuery」(Link opens in a new window)を参照してください。データへの接続の詳細については、データへの接続(Link opens in a new window)を参照してください。

フロー入力でパブリッシュされたデータ ソースに接続する

パブリッシュされたデータ ソースを Tableau Desktop から生成するか、Tableau Prep Builder からの出力として生成し、Tableau Server または Tableau Online にパブリッシュして、パブリッシュされたデータ ソースに接続し、それらをフローの入力データ ソースとして使用できるようになりました。

[接続] ペインから [Tableau Server] を選択し、サーバーまたはサイトにサインインします。

サインインすると、利用可能なデータ ソースの一覧が表示されます。データ ソースを選択するか、検索オプションを使用してデータ ソースを検索し、フロー ペインにドラッグしてフローを開始します。

: ユーザー フィルターを含むパブリッシュ済みデータ ソースは、現在サポートされていません。

データへの接続およびフローの構築に関する詳細については、データへの接続(Link opens in a new window)を参照してください。

データの検証とフィルタリング

カスタムのデータの役割を作成する

データの役割を使用してフィールド値を識別し、検証できます。以前のリリースでは、Tableau Prep Builder によりフィールドに適用できる一連の標準的なデータの役割が提供され、無効な値をすばやく識別していました。このリリースでは、データ セット内のフィールド値を使用してカスタムで独自のデータの役割を作成し、それらを Tableau Server または Tableau Online にパブリッシュしてフロー内で使用するか、他のユーザーとデータの役割を共有し、無効な値をこれまで以上に簡単に特定し、クリーニングできるようになりました。

使用するフィールドを選択し、[その他のオプション] メニューの [データの役割としてパブリッシュ] を選択するだけです。

カスタムのデータの役割がパブリッシュされた後に、パブリッシュされたサイトまたはサーバーにサインインしたら、その役割を新しい [カスタム] メニュー オプションから選択してフィールドに適用できます。

Tableau Server および Tableau Online でパブリッシュされたカスタムのデータの役割を表示および管理できます。サイトまたはサーバーにパブリッシュされたすべてのカスタムのデータの役割を表示し、別のプロジェクトに移動して、パーミッションを変更するか、削除します。

カスタムのデータの役割を作成および使用する方法の詳細については、カスタム データの役割を作成する (バージョン 2019.3.1 以降)(Link opens in a new window)を参照してください。

データのクリーニングと加工

フローでの R および Python スクリプトの使用

R および Python スクリプトを使用して、より複雑なクリーニング操作を実行したり、予測モデリング データをフローに組み込んだりできるようになりました。R または Python スクリプトの手順に従い、Rserve または TabPy を使用してデータがフローからインプットとして渡されます。次に、Tableau Prep Builder の機能および関数を使用してクリーニングを継続できる出力データとして返されます。

フローにスクリプトを含める方法の詳細については、フローでの R および Python スクリプトの使用(Link opens in a new window)を参照してください。

作業の保存と共有

フローの構築時に互換性のない機能を検出する

Tableau Prep Builder では、毎月新しいバージョンがリリースされます。新しいバージョンで新機能または新しいコネクタが導入されたにもかかわらず、以前のバージョンの Tableau Server または Tableau Online にフローをパブリッシュしようとすると、互換性に問題が生じる可能性があります。現在のところフローのパブリッシュ時に互換性のない機能があるかどうかを確認することができますが、その時点で既にフローが構築されている場合は、戻って互換性のない機能を削除するのに時間がかかる可能性があります。

このリリースでは、互換性に関するアラートがよりわかりやすくなりました。フローの構築時に互換性のない機能があるかどうかが表示されるため、情報を得たうえで追加する機能を瞬時に判断できるようになりました。

Tableau Server にサインインしておけば、フローの構築時にお使いの Tableau Server バージョンでサポートされていない機能を選択すると、アラートが表示されます。キャンバスの右上隅にある [アラート] をクリックしてすべてのアラートとエラーを表示するか、フロー ペインの手順または注釈上にあるアラートにカーソルを合わせて、アラートの詳細を表示します。

[View in Flow (フローに表示)] リンクをクリックして警告が関連付けられているステップ、注釈、フィールド、または変更にすばやく移動します。ステップ、フィールド、および変更がすべてアラート アイコンでマークされハイライトされるため、問題をすばやく見つけて対処し、フローを続行することができます。

互換性の問題を解決する方法の詳細については、Tableau Prep とのバージョン互換性(Link opens in a new window)を参照してください。

フロー データを最新に維持する

Tableau の Data Management アドオンに含まれる Tableau Prep Conductor

Tableau Prep Conductor は、Tableau Server または Tableau Online で個別にライセンス認証された Data Management アドオンに含まれています。詳細については、Tableau Prep Conductor のライセンス発行を参照してください。

Tableau Online へのフローのパブリッシュ

フローを Tableau Server または Tableau Online のいずれかにパブリッシュし、スケジュールに従って実行することで、データを最新の状態に保つことができるようになりました。Tableau Online では、オンプレミス データ ソースへの直接接続はサポートされていません。フローをオンプレミス データ ソースに接続する Tableau Online へパブリッシュする場合は、接続を編集して、パブリッシュされたデータ ソースへ自動的に変換できます。

Tableau Online へのフローのパブリッシュに関する詳細については、Tableau Server または Tableau Online へのフローのパブリッシュ(Link opens in a new window)を参照してください。

拡張機能

Tableau Prep Builder でイタリア語が使用可能に

ユーザー インターフェイス (メニュー、メッセージなど) を 11 の異なる言語で設定できるようになりました。表示言語設定の詳細については、Tableau Desktop および Tableau Prep Builder 導入ガイドの「表示言語の設定」(Link opens in a new window)を参照してください。

バージョン 2019.2.3 での追加

データの検証とフィルタリング

フィルター処理する特定の値を選択する

新しい [選択した値] フィルターを使用して、サンプルに含まれていない値も含め、フィールドで保持または除外する値を選択できるようになりました。[プロファイル] ペイン、[結果] ペイン、またはデータ グリッドで、[その他のオプション] ボタンをクリックしてから [フィルター] > [選択した値] を選択します。

この新しい視覚的なインジケーターによって、保持または除外する値を選択し、選択した内容を視覚的に表示できるようになります。データのサンプルを使用していて、使用中のサンプルにない値を含めるか除外する場合は、必要な値を追加するだけで、Tableau Prep Builder でこれらの新しい値を保持または除外するオプションが適用されます。

フィールド値のフィルタリングに関する詳細については、データの検証(Link opens in a new window)を参照してください。

ワンクリックでフィールドを複製する

これまで、フィールドでクリーニング操作を試行する際に元のデータは変更したくない場合は、計算を書き込んでフィールドを複製する必要がありました。このフィールドの複製が、ワンクリックで簡単に実行できるようになりました。複製するフィールドを選択してから、[その他のオプション] メニューで [フィールドの複製] を選択します。

新しいフィールドが同じ名前に修飾語句を加えた形式で作成され、[プロファイル] ペイン、データ グリッド、または [結果] ペインの一番左に配置されます。たとえば、"Ship Date-1" のようになります。

フィールドの複製およびその他のクリーニングに関するオプションの詳細については、データのクリーニングと加工(Link opens in a new window)を参照してくださいクリーニング操作の適用(Link opens in a new window)

データのクリーニングと加工

あいまい一致とクリーニングの推奨事項を使用して無効なデータの役割の値を修正する

データの役割を使用すると、有効でないフィールド値をすばやく特定できます。データの役割を割り当てたら、[スペル] または [読み方 + スペル] のあいまい一致アルゴリズムのいずれかを使用して、データの役割の無効な値とそのデータの役割に類似する標準値をすばやくグループ化および一致させます。

さらに、フィールドに対してデータの役割を提案します。Tableau Prep Builder では、[スペル] および [読み方 + スペル] のアルゴリズムを使用して、データの役割に割り当てられたフィールドの無効な値を自動的に修正する方法についても提案できるようになりました。提案される修正が検出されると、プロファイル カードに電球 アイコンが表示されます。アイコンをクリックすると提案された変更が適用され、無効な値を自動的にグループ化してそのデータの役割に類似する標準値に置き換えます。

この機能は、次のデータの役割にのみ使用できます。

  • 空港
  • 市区町村
  • 国/地域
  • 都道府県/州

フィールドにデータの役割を適用し、グループ化と置換を使用してデータの役割の無効な値を修正する方法の詳細については、データの役割を使用したデータの検証(Link opens in a new window)を参照してください。

バージョン 2019.2.2 での追加

データへの接続

その他のデータベース (ODBC) コネクタを使用してさらに多くのデータに接続する

[接続] ペインにリストされていないデータ ソースへ接続する必要がある場合は、SQL 標準をサポートするその他のデータベース (ODBC) コネクタを使用して任意のデータ ソースに接続し、ODBC API を実装できます。その他のデータベース (ODBC) コネクタを使用したデータへの接続は、Tableau Desktop での使用方法に似ていますが、いくつかの相違点があります。

  • 接続できるのは、DSN (データ ソース名) オプションを使用する場合のみです。
  • Tableau Server でフローをパブリッシュして実行するには、サーバーが一致する DSN を使用して構成されている必要があります。
  • Windows と MacOS の両方に単一の接続エクスペリエンスがあります。ODBC ドライバー (Windows) の接続属性の確認を求める機能はサポートされていません。
  • Tableau Prep Builder で対応しているのは 64 ビット ドライバーのみです。

その他のデータベース (ODBC) コネクタを使用したデータへの接続に関する詳細については、データへの接続(Link opens in a new window)を参照してください。

データへの接続時に初期 SQL コマンドを指定する

対応するデータベースへの接続時に初期 SQL コマンドを指定できるようになりました。このコマンドは、データベースへの接続時に実行されます。たとえば、Amazon Redshift に接続する場合、データベースへの接続時に、インプット ステップでフィルターを追加するときのように、SQL ステートメントを入力してフィルターを適用できます。SQL コマンドは、データがサンプリングされ Tableau Prep Builder に読み込まれる前に適用されます。

初期 SQL コマンドを変更してインプット ステップを更新すると、初期 SQL コマンドが再度実行され、インプット ステップが更新されます。フローを実行すると、すべてのデータを処理する前に初期 SQL コマンドが実行されます。また、Tableau Server でフローをスケジュールすると、データの読み込み操作の一部として初期 SQL が毎回実行されます。

詳細については、データへの接続(Link opens in a new window)を参照してください。

: Tableau Prep Builder の初期 SQL では、パラメーターがまだサポートされていません。

データの検証とフィルタリング

データのクリーニング中に必要なフィールドのみの保持

以前のリリースでは、データへの接続後にチェック ボックスをオフにすることでインプット ステップの不要なフィールドを削除できました。クリーニングまたはアクション ステップでは、1 つ以上のフィールドを選択して右クリックするだけで不要なフィールドを削除できました。[プロファイル] ペインまたはデータ グリッドで 1 つ以上のフィールドを選択し、右クリックすると、選択したフィールドのみを保持して他のすべてのフィールドが削除されるようになりました。

詳細については、フィールドの保持または削除(Link opens in a new window)を参照してください。

データのクリーニングと加工

フローの再配置ステップ

大規模で複雑なフローを構築したものの、Tableau Prep Builder を使用した既定のレイアウトでは、このフローを把握するのが難しかったことはありますか。キャンバス内のステップを選択して移動することで、フローをわかりやすく再編成できるようになりました。たとえば、交差するフロー線を修正したり、フローのステップを移動して余分な空白を除去したりできるほか、フローのステップを再配置して一連のイベントを明確に表示することもできます。

次のようなフローは紛らわしく把握することが困難です。

この新機能を使用すると、フロー内の 1 つ以上のステップを選択し、それらを上下左右にドラッグして適切な場所にドロップできます。

: いくつかの制約が適用され、左から右へと移動するプロセスのフローを妨害するような位置にフローのステップを移動することはできません。許可された場所にフローのステップをドラッグすると、オレンジ色のボックスが表示されます。許可されていない場所ではオレンジ色のボックスが表示されず、ステップをドロップしようとしても元の場所に戻ってしまいます。

詳細については、フローの構築と編成(Link opens in a new window)を参照してください。

バージョン 2019.2.1 での追加

データへの接続

新しいデータベース コネクタを使用してさらに多くのデータに接続する

データへの接続やデータのクリーニングに役立つコネクタがさらに追加されました。以下のデータベースに格納されているデータに接続できるようになりました。

  • Amazon Athena
  • その他のデータベース (JDBC)

特定のコネクタへの接続に関する詳細については、「Tableau Desktop と Web 作成のヘルプ」の「サポートされるコネクタ」(Link opens in a new window)を参照してください。フローを構築するためのデータへの接続の詳細については、データへの接続(Link opens in a new window)を参照してください。

フロー データを最新に維持する

フローをパブリッシュするときにファイルのセーフ リストの場所を表示する

Tableau Server にフローをパブリッシュし、Tableau Prep Conductor を使用してフローが自動的に実行されるスケジュールを設定したり、フローの入力または出力を更新したりします。フローにネットワーク共有への接続を使用したインプットまたは出力ステップが含まれている場合、システム管理者はファイルの場所を事前に組織のセーフ リスト内に追加しておく必要があります。追加しない場合、Tableau Server でフローの実行を試行すると失敗します。

Tableau Prep Builder のバージョン 2019.2.1 以降でネットワーク共有への接続を使用したインプットまたは出力ステップを含むフローをパブリッシュすると、パブリッシュ時にファイルを組織のセーフ リストに含める必要があるかどうかの通知を受けます。セーフ リストに記載された場所を確認するには、警告メッセージ内のリンクをクリックして、表示された場所のいずれかにファイルを移動します。

フローのパブリッシュの詳細については、Tableau Server または Tableau Online へのフローのパブリッシュ(Link opens in a new window)を参照してください。組織のセーフ リストにファイルの場所を追加する方法の詳細については、手順 4 - 入力場所と出力場所をセーフ リストに登録する(Link opens in a new window)を参照してください。

その他の機能拡張

ユーザー インターフェイスに使用する言語が 10 種類の中から選択可能に

ユーザー インターフェイス (メニュー、メッセージなど) の構成に選択できる言語に、以下の 2 言語が追加されました。

  • en_GB (イギリス英語)

  • zh_TW (繁体字中国語)

表示言語設定の詳細については、Tableau Desktop および Tableau Prep Builder 導入ガイドの「表示言語の設定」(Link opens in a new window)を参照してください。

フローのサムネイル ビューを使用して Tableau Server のフローを簡単に検索可能

フローを Tableau Server にパブリッシュする場合に、サムネイル ビューに切り替えてフローのレイアウトをグラフィック表示し、フローを一目で簡単に確認することができるようになりました。

バージョン 2019.1.4 での追加

データへの接続

新しいデータベース コネクタを使用してさらに多くのデータに接続する

データへの接続やデータのクリーニングに役立つ新しいコネクタがさらに追加されました。以下のデータベースに格納されているデータに接続できるようになりました。

  • SAP HANA
  • Azure SQL Data Warehouse
  • MariaDB

: SAP HANA を使用したデータへの接続では、フローを開くとき、および初期 SQL を使用して接続のクエリを実行するときに変数とパラメーターを求める機能はサポートされていません。

特定のコネクタへの接続については、Tableau Desktop および Web 作成のヘルプの「サポートされているコネクタ」(Link opens in a new window)セクションで接続の詳細を参照してください。フローを構築するためのデータへの接続の詳細については、データへの接続(Link opens in a new window)を参照してください。

データのクリーニングと加工

フィールドの類似の値をデータの役割でグループ化する

Tableau Prep Builder のバージョン 2018.2.3 でデータの役割が導入されたことで、フィールド値を標準化し、有効でない値をすばやく見つけることができるようになりました。このリリースでは、データの役割をフィールドに割り当て、そのデータの役割を使用して、データの役割で定義した標準値との値のマッチングやグループ化ができます。データの役割をフィールドに割り当て、[グループ化と置換] メニューから [データの役割の一致] を選択するだけです。その後、この新しいオプションは、無効な値と最も類似する有効な値をスペリングと読み方に基づいてマッチングします。

たとえば、"Saint Martin" や "Saint Maarten" などの国/地域を一覧表示するフィールドがある場合、このフィールドに [国/地域] というデータの役割を割り当てると、新しい [データの役割の一致] オプションを使用してフィールドをグループ化し、これらの値をデータの役割の標準値である "Saint-Martin" にマッピングできます。値の標準的なスペリングがデータ セットにない場合、Tableau Prep Builder は自動的にこの値をグループに追加し、この標準値を使用して一致する値をグループ化します。

この機能は、次のデータの役割に適用され、現在は、米国の英語版でのみサポートされています。

  • 空港
  • 市区町村
  • 国/地域
  • 都道府県/州

フィールドにデータの役割を割り当てたり、データの役割を使用して値をグループ化したりする方法の詳細については、データの役割を使用したデータの検証(Link opens in a new window)を参照してください。

フィールド値のグループ化の際に結果を調整する

[グループ化と置換] クリーニング オプションを使用し、スペリング読み方で類似した値をグループ化する場合に、フィールド上でシンプルなスライダーを使用してグループ化のパラメーターの強さを調整することで、結果をより細かく制御できるようになりました。

5 種類のしきい値の設定から選択して、グループに含める値の数と作成するグループの数を制御することができます。

あいまい一致を使用したフィールドのグループ化に関する詳細については、フィールド値の編集(Link opens in a new window)を参照してください。

バージョン 2019.1.3 での追加

データへの接続

表のリレーションシップに基づいてデータをすばやく結合する

Vertica や Microsoft SQL Server など、表のリレーションシップが定義されている表を含むデータベースに接続する場合、 Tableau Prep Builder はこの情報を検出して表示できるようになりました。

たとえば、表内のどのフィールドが一意の識別子で、どのフィールドが関連フィールド (外部キー) かを表示できるようになったほか、これらのフィールドの関連する表の名前も表示できるようになりました

[リンクされているキー] と呼ばれる新しい列が [入力] ペインに表示され、一意の識別子、関連フィールド、または両方の組み合わせであるフィールドの隣にはアイコンが表示されます。

[リンクされているキー] フィールドでは、関連するフィールドまたは組み合わせのフィールドをクリックすると関連する表が表示され、ワンクリックで関連する表のフローへの追加や結合の作成が行われます。

結合を作成すると、Tableau Prep Builder は定義済みのフィールドのリレーションシップを使用して表を結合し、結合句を定義するフィールドのプレビューを表示します。ここから新しい結合ステップをクリックし、必要に応じて結合条件のクリーニングと編集を行うことができます。

関連フィールドを含む表の場合、すべての関連する表のリストを表示し、[フロー] ペインのメニューから結合を作成することもできます。[結合の追加] メニュー オプションでリストより結合する表を選択すると、2 つの表の間のリレーションシップを構成するフィールドに基づき、Tableau Prep Builder により結合が作成されます。

この機能は、表のリレーションシップが定義されているサポートされる任意のデータベース コネクタで使用できます。[リンクされているキー] を使用して表を追加または結合する方法の詳細については、インプット ステップでのデータの結合 (バージョン 2019.1.3 以降)(Link opens in a new window)を参照してください。

データのクリーニングと加工

ツールバーでのすべてのクリーニングの推奨事項の表示

Tableau Prep Builder によってフィールドに関するクリーニングの推奨事項が検出され提供されると、フィールドの [プロファイル] カードに電球 アイコンが表示されます。選択したステップのツールバーより、任意のフィールドのクリーニングの推奨事項を 1 つの便利なリストにすべて表示できるようになりました。

リスト内のアイテムをクリックするだけで、Tableau Prep Builder がユーザーを、提案された変更を適用可能なフィールドに移動させます。クリーニングの推奨事項の詳細については、推奨を使用したクリーニング操作の適用 (バージョン 2018.3.2 以降)(Link opens in a new window)を参照してください。

注: このオプションは、結合ステップ、インプット ステップ、出力ステップ タイプでは利用できません。

その他の機能拡張

フローで特定の変更を見つける

[フロー] ペインのステップで変更アイコンを、または [プロファイル] ペインや [結果] ペインのプロファイル カードをクリックすると、フローに対して行われた特定の変更をすばやく見つけることができるようになりました。探している変更を示すアイコンをクリックし、変更の一覧から注釈を選択するだけです。変更は、[変更内容] ペイン、[プロファイル] ペインまたは [結果] ペイン、および該当する場合にはデータ グリッドでハイライトされます。

変更の表示の詳細については、変更内容の表示(Link opens in a new window)を参照してください。

最近表示したフローをスタート ページから管理する

フローを保存して Tableau Prep Builder を閉じると、最もよく使用するフローをすばやく見つけることができるよう、フローのサムネイルがスタート ページに保存されます。とはいえ、データ準備を頻繁に使用していると、スタート ページの表示数はすぐに多くなります。必要なフローをすばやく見つけ、フローの操作が完了してもすっきりした状態になるよう、スタート ページにいくつかの新機能を追加しました。

  • フローのサムネイルでグラフィックが強化され、フローをひと目で見つけられるようにフロー レイアウトの表示がさらに正確になりました。

  • グラフィックで十分な情報が得られない場合には、フローのサムネイルにカーソルを合わせると、そのフローの入力と出力の詳細や最後に開いた時期がすぐに表示されます。

  • スタート ページから、最近表示したものの必要でなくなったフローを削除するとすっきりします。このオプションでは、[最近のフロー] ビューからのみフローが削除されますが、フローは削除されません。

バージョン 2019.1.2 での追加

フロー データを最新に維持する

フローを自動的に実行するスケジュールを Tableau Server で設定する

Tableau Server バージョン 2019.1 に新しい Data Management アドオンを追加すると、フローを実行するスケジュールと管理を Tableau Prep Conductor を使用して行うことができます。Tableau Server にフローをパブリッシュしてから、フローを実行してフローの入力や出力を自動的に更新するタスクのスケジュールを設定します。エラーやアラートのオプション、さらに [管理] ビューを使用すると、フロー処理の進捗状況を追跡および管理することができます。

詳細については、フロー データを最新に維持する(Link opens in a new window)を参照してください。

ヘルプのデザイン

コンテンツのナビゲーションに役立つ更新が行われ、新しい右クリック メニューが加わりました。これにより、1 つのページ上でさまざまなトピックをすばやく検索し、選択することができます。

バージョン 2019.1.1 での追加

データのクリーニングと加工

行から列へのピボット処理

クロス集計やスプレッドシートでデータを操作する場合、Tableau で簡単に分析できない形式が使用されていることがあります。行に変換する必要のあるデータの列が多くあったり、列は少ないがデータ値に複数の項目が含まれていたりする場合があります。

適切なピボット オプションを選択して、データをこれまで以上に簡単に加工できるようになりました。ピボット ステップで、以下のいずれかのオプションを選択できるようになりました。

  • 列から行: 1 つ以上のフィールドを [ピボットされたフィールド] ペインにドラッグして列から行へピボット処理を実行します。

  • 行から列: フィールドを [ピボットされたフィールド] ペインにドラッグし、フィールド値を使用して新しい列を作成します。次に、これらの列の入力に使用するフィールドにドラッグして集計方法を選択します。

詳細については、データのピボット処理(Link opens in a new window)を参照してください。

ワイルドカード検索を使用したフィールドのピボット処理

フィールド数の多いデータ セットがある場合や、フィールドが長期にわたって頻繁に追加または削除されている場合は、列から行へのピボット処理にワイルドカード検索を使用して、ワイルドカード パターン マッチに基づきデータを瞬時にピボット処理することができます。パターンに一致する新規フィールドが追加または削除される場合は、フローの実行時に Tableau Prep Builder でスキーマの変更が検出され、ピボットの結果が自動的に更新されます。

ワイルドカード検索を使用してデータをピボット処理するには、ピボット ステップを追加してから [ここをクリックしてワイルドカード ピボットを作成する] リンクをクリックし、ワイルドカード検索フィールドを開きます。ワイルドカード検索パターンを入力し、入力した値と一致する名前のフィールドを検索します。[検索オプション...] ボタンをクリックして、入力したパターンが含まれるフィールド、またはこのパターンで開始あるいは終了するフィールドを追加するかどうかを選択します。

Enter を押してパターンを適用します。Tableau Prep Builder によりフィールドが自動的にピボット処理されます。

詳細については、データのピボット処理(Link opens in a new window)を参照してください。

説明を使用してコンテキストを変更内容に追加する

[変更内容] ペインの変更項目に説明を追加して、クリーニング操作にコンテキストを追加します。[変更内容] ペインを開き、リストの変更項目を右クリックまたは Ctrl を押しながらクリック (Mac) して [説明の追加] を選択します。次に、表示されるテキスト フィールドに説明を入力します。

説明は、変更項目で生成されたテキストの下にコメント アイコンとともに表示されます。

詳細については、フロー ステップとクリーニング操作への説明の追加(Link opens in a new window)を参照してください。

クリーニングの推奨事項を使用して固定幅のテキスト ファイルのデータをすばやく分割する

以前のリリースでは、固定幅のテキスト ファイルや単一列に固定された文字数に制限されたデータ値の文字列が含まれるファイルに格納されたデータを操作する場合に、ファイル上でいくつかのクリーニング前操作を実行するか、複雑な計算を使用して値を複数の列に分割する必要がありました。

このリリースでは、こうしたタイプのデータ ソースに接続する場合にクリーニングの推奨事項機能でこの種の列を検出し、分割オプションを提案してくれるようになりました。データ ソースに接続し、クリーニング ステップを追加します。[プロファイル] ペインで、プロファイル カードの推奨事項アイコンをクリックします。

[適用] をクリックしてフィールドを分割し、結果を確認して新しいフィールドをそれぞれ必要に応じてクリーニングまたは名前変更します。

詳細については、推奨を使用したクリーニング操作の適用 (バージョン 2018.3.2 以降)(Link opens in a new window)を参照してください。

バージョン 2018.3.3 での追加

データへの接続

新規ファイル追加時のインプット ユニオンの自動的な更新

インプット ステップで Microsoft Excel やテキスト (.csv) ファイルを検索してユニオンを作成するためにワイルドカード パターンを使用する場合、そのパターンに一致し、同じフォルダーに追加される新しいファイルは、次にフローを開いた際、またはコマンド ラインから実行する際にユニオンに自動的に含められます。

注: パッケージド フロー ファイル (.tflx) では、新しいファイルは既にフローと一緒にパッケージされているため自動的には取得しません。新しいファイルを含めるには、フロー ファイル (.tfl) を開いて新しいファイルを取得してから、フローを再パッケージして新しいファイル データを含めます。

インプット ステップでのファイルのユニオン作成に関する詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成(Link opens in a new window)を参照してください。

データのクリーニングと加工

クリーニング操作の再利用

データのクリーニングを行う際、フロー全体で何度も同じクリーニング操作やアクションを行うことがよくあります。データのクリーニングや加工をさらに効率的に行えるよう、これらの操作やアクションをフロー全体でコピーして貼り付けする機能が追加されました。これにより、クリーニング操作やアクションを一度に実行し、必要な場合には再利用することができます。

  • フローの別の場所で使用するために 1 つ以上のステップをコピーします。このオプションは、ワイルドカード ユニオンを含むインプット ステップには利用できません。

  • あるステップの [変更内容] ペインで操作をコピーし、別のステップの [変更内容] ペインに貼り付けしてそのステップに同じ操作を適用します。

  • [変更内容] ペインから [プロファイル] ペインのフィールドに操作をドラッグ アンド ドロップし、その操作を別のフィールドに適用します。[変更内容] ペインの操作をコピーし、ステップ内の他のフィールドにドラッグ アンド ドロップしてその操作を複数のフィールドに適用することもできます。このオプションは、計算フィールドなど複数のフィールドに影響する操作には利用できません。

詳細については、データのクリーニングと加工(Link opens in a new window)を参照してください。

余分な空白の削除

フィールド値の余分な空白を削除できるよう、簡単な 2 つの新しいクリーニング操作を追加しました。

  • 余分なスペースの削除: テキスト フィールド値でこのオプションを使用すると、先頭と末尾の空白を削除し、文字間の余分な空白を単一スペースで置き換えます。

  • すべてのスペースの削除: このオプションを使用すると、先頭と末尾の空白や文字間の空白を含め、テキスト値にあるすべての空白を削除します。

詳細については、フィールド値の編集(Link opens in a new window)を参照してください。

データの検証とフィルタリング

フィールドがフロー内のどこで使用されているかを簡単に検索する

フローの作成時に想定されるすべてのフィールド値が表示されていない場合、フィールドが使用されているすべての場所を簡単に追跡でき、フィールドがどこに由来するかも確認できるようになりました。ステップの [プロファイル] ペインまたは [結果] ペインでフィールドを選択するだけで、フロー ペインのステップがハイライトされます。これにより、フィールドが由来するフローのパスが示されるので、以前より簡単にフローのトラブルシューティングを行うことができます。

詳細については、フロー内のフィールドの追跡(Link opens in a new window)を参照してください。

その他の機能拡張

一度に Tableau Prep Builder の複数のウィンドウを開く

Windows または Mac で、[ファイル] > [新規] をクリックし、現在作業しているウィンドウを置き換えるのではなくフローの新しいウィンドウを開きます。フロー ファイル (.tfl または .tflx) を開く際に新しいウィンドウも開くので、複数のフローを簡単かつ同時に操作したり、比較したりすることができます。

インストール後に利用状況レポートをオフにする

Tableau Prep Builder の向上に役立つよう、当社に利用状況パターンのデータを共有することができます。特定のユーザー データを収集することは決してなく、匿名の使用状況データのみを収集します。たとえば、データ ソースの接続タイプ (.csv、sql、Amazon Redshift など)、大きなデータ セットか小さなデータ セットか、フローに含まれる手順の数または使用する操作の種類 (手順の名前や使用する式などのデータ詳細は含まない) などです。

データは機密情報であり、この情報を他社に共有することは決してありません。ただし、インストール後にこのオプションをオフにすることを望まれる場合はそうすることが可能です。[ヘルプ] > [設定とパフォーマンス] に移動し、[使用状況データを共有して Tableau Prep Builder を改善する] をクリックしてチェック マークを外します。詳細については、Tableau Desktop および Tableau Prep Builder 導入ガイドの「利用状況レポート」(Link opens in a new window)を参照してください。

バージョン 2018.3.2 での追加

データのクリーニングと加工

クリーニングの推奨事項を使用した迅速なデータ品質の向上

データの問題を迅速に発見して修正できるよう、Tableau Prep ではデータ フィールドを調べ、問題を修正するために行える変更を提案できるようになりました。Tableau Prep はデータ フィールドを調べ、推奨される変更が識別されると、電球アイコンがフィールドの [プロファイル] カードに表示されます。

推奨される変更を表示するには電球アイコンをクリックし、[推奨事項] カードにカーソルを合わせてから [適用] をクリックすると、それがフィールドに自動的に適用されます。変更は [変更内容] ペインに記録されますが、いつでも削除可能です。

以下の例では、Tableau Prep がフィールド値を URL と識別しており、有効でない値を識別するためにフィールドにデータの役割を適用することを推奨しています。

この機能は、インプット、出力、結合のステップ タイプを除くすべてのステップ タイプで利用可能です。今回のリリースでは、推奨タイプには以下が含まれます。

  • データの役割
  • フィルター
  • 無効な値の Null 値での置換
  • フィールドの削除
  • スペースのトリミング

詳細については、推奨を使用したクリーニング操作の適用 (バージョン 2018.3.2 以降)を参照してください。

その他の機能拡張

コマンド ラインからのフロー実行時の柔軟性追加

コマンド ラインからフローを実行しており、データベースに接続する、または出力ファイルをサーバーにパブリッシュする場合、必要なすべての認証資格情報を含む、認証資格情報の .json ファイルが必要です。過去のリリースでは、データベースに接続するのみ、またはフローの出力をサーバーにパブリッシュするのみの場合、空白の配列を認証資格情報の .json ファイルに含めないと、プロセスが失敗していました。

今後、認証資格情報の .json ファイルに空白の配列を含める必要はなくなりました。たとえば、データベースに接続するのみの場合、outputConnection 配列を .json ファイルに含める必要はありません。

コマンド ラインからのフロー実行の詳細については、コマンド ラインからフロー出力ファイルを更新を参照してください。

パフォーマンスの向上

フローの操作が迅速かつ効率的になるように、以下の強化が適用されました。

  • 製品のシャットダウンにより、Tableau Prep が使用していたメモリ容量がすぐに返されます。

  • 予期しないエラーが表示される場合には、アクションやプロセスを再試行し、フロー内にユーザーが留まれるようになりました。

  • 処理時間を短縮するために、データの読み込みまたはフロー内のデータの確認を行っているときのパフォーマンスが向上しました。

  • 以下のコネクタに接続する場合、スキーマを迅速に見つけるために検索フィールドを使用できるようになりました。
    • Amazon EMR Hadoop Hive
    • Cloudera Hadoop
    • Hortonworks Hadoop Hive
    • MapR Hadoop Hive
    • Presto
    • Spark SQL

以前のバージョンでの追加

バージョン 2018.3.1 での追加

Tableau Prep のインストールと展開

既定のリポジトリ場所を変更する

既定では、Tableau Prep のインストール時に、マイ Tableau Prep リポジトリはコンピューターの Documents フォルダーに自動的にインストールされます。しかし、フローやデータ ソースを保存できる場所に関して制限がある場合は、Tableau Prep のインストール後にマイ Tableau リポジトリを別のディレクトリに移動することができます。

ディレクトリを移動するには、Tableau Prep を開き、トップ メニューから [ファイル] > [リポジトリの場所] を選択します。リポジトリを移動するフォルダーを選択します。

詳細については、Tableau Desktop および Tableau Prep 導入ガイドの「マイ Tableau Prep リポジトリの場所の変更 (英語)」(Link opens in a new window)を参照してください。

データへの接続

PDF ファイルに保存されているデータをクリーニングする

PDF ファイルに保存されているデータの分析は簡単に処理できない可能性があります。今後は、Tableau Prep で PDF ファイルに直接接続してデータをクリーニングすることができます。

PDF ファイル内のデータへの接続方法の詳細については、Tableau Desktop ヘルプの「PDF ファイル」(Link opens in a new window)を参照してください。

: データ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データベース表用のワイルドカード ユニオン

単一データ ソースに保存されているデータベース表を操作する場合、今後はインプット ステップでワイルドカード検索を使用して表をユニオンすることができます。その後、インプット ステップで複数のファイルをユニオンするのに使用するのと同じプロセスを使用して、インプット ステップで選択した表のデータをすべて含めることができます。

このタイプのユニオンを使用するには、表が同じデータ ソースにある必要があります。また、ワイルドカード ユニオンがサポートされているデータ ソースに接続する必要があります。

次のデータ ソースでこのタイプのユニオンがサポートされています。

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

詳細については、インプット ステップでのファイルおよびデータベース表のユニオン作成(Link opens in a new window)を参照してください。

データのクリーニングと加工

フィールド値を NULL で置換する

データ行を分析に含める場合、その中にある特定のフィールド値を除外するには、そのフィールド値を NULL 値に変更することができます。置換するフィールド値を選択した後、選択した値を右クリック (Mac では Control を押しながらクリック) してメニューから [NULL で置換する] を選択します。

フィールド値の置換の詳細については、フィールド値の編集を参照してください。

任意のステップでクリーニング操作を適用する

フロー内の問題をより効率的に修正できるようになりました。今後は、結合、ユニオン、ピボット、集計の際にデータで問題を検出した場合、追加のクリーニング ステップを追加する必要はなく、その問題を当該のステップで直接修正することができます。

操作の順序が重要であるため、クリーニング操作はその結合、ユニオン、ピボット、または集計の前または後に配置され、その情報は当該のステップの [変更内容] ペインで追跡できます。

また、その変更に関する注釈がフロー ペインでそのステップに追加されます。インプット ステップの場合は、注釈がそのステップの左に表示されるとともにインプット フィールド リストに追加されるため、変更が適用されたフィールドを容易に知ることができます。他のすべてのタイプのステップの場合、注釈はフロー ペインでそのステップの上に表示されます。

一部のクリーニング操作は引き続きクリーニング ステップで実行する必要があり、インプット ステップおよび出力ステップでのみ使用できるクリーニング操作もあります。下の表は各タイプのステップで使用できるクリーニング操作を示しています。

  インプット クリーニング 集計 ピボット処理 結合 ユニオン 出力
フィルター X X X X X X  
グループ化と置換   X X X X X  
クリーニング   X X X X X  
値の分割   X X X X X  
フィールド名の変更 X X X X X X  
値の編集   X X X X X  
データ型の変更 X X X X X X  
計算フィールドの作成   X X X X X  
フィールドの削除 X X X X X X  

詳細については、クリーニング操作についてを参照してください。

バージョン 2018.2.3 での追加

データへの接続

MongoDB Business Intelligence (BI) に保管されているデータに接続

Mongo DB Business Intelligence にデータを保管すると、Tableau Prep でこのデータに接続してクリーニングできます。

Mongo DB Business Intelligence を使用するデータへの接続方法の詳細については、Tableau Desktop ヘルプの「MongoDB BI コネクタ」(Link opens in a new window)を参照してください。

: データ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データの検証とフィルタリング

データの役割をフィールド値に指定

データの役割をフィールド値に割り当てて、Tableau Prep でデータ セットの不一致や外れ値を検索できるようになりました。

データの役割は、メール アドレスや地理的役割 (市区町村や郵便番号) など、フィールド値の意味や値が示す内容を Tableau Prep に伝えるためのものです。フィールドにデータの役割が割り当てられると、Tableau Prep はこのフィールド値を検証して一致しない値にフラグを立てるため、さらに詳しく検討することができます。

有効またはそうでない値のみを表示するには、ドロップダウン メニューから、新しいフィルター オプションを使用します。

今回のリリースでは、以下のデータの役割がサポートされています。

  • メール

  • URL

  • 地理的役割 (現在の地理的データに基づく、Tableau Desktop で使用されるのと同じデータ)

    • 空港
    • 市外局番 (米国)
    • コアベース統計地域/大都市統計地域
    • 市区町村
    • 下院議員選挙区 (米国)
    • 国/地域
    • 欧州地域統計分類単位
    • 都道府県/州
    • 郵便番号

詳細については、データの役割を使用したデータの検証(Link opens in a new window)を参照してください。

データの結合またはユニオン

不一致のフィールドを結合句で直接修正

2 つのデータ表の結合では、互いのフィールドの値は同一でも、データ入力エラーのためにフィールドが不一致になる場合がしばしばあります。Tableau Prep では、不一致のフィールド値を赤色で表示することで、不一致を結合句で特定することができます。しかし、このフィールド値を結合句で直接修正できればさらに良いと思いませんか? 今回のリリースではこの機能が追加されています。

2 つのデータ セットを結合する際、結合するフィールド値を編集し、結合句内で修正することができるようになりました。フィールド値をダブルクリックするだけで編集できます。

フィールドを選択して インラインでの編集に変更

データ セットを適切に結合するために、以前のフローのクリーニング ステップにクリーニングのアクションが自動的に戻されます。

結合ステップの前にクリーニング ステップはないのでしょうか? 大丈夫です。Tableau Prep では、クリーニング操作をキャプチャするステップが自動的に結合で追加されます。

フィールド値を結合句で直接クリーニングする方法の詳細については、データの集計、結合またはユニオン(Link opens in a new window)を参照してください。

バージョン 2018.2.2 での追加

Tableau Prep のインストールと展開

表示言語の設定

Tableau Prep を起動する際、ユーザーのコンピューターに設定されているロケールを検知し、適切な言語でユーザーインターフェイス、日付、数値形式を表示できるようになりました。サポートされている言語をトップメニューの [ヘルプ] > [言語選択] で選択すれば、ユーザーインターフェイスの表示言語を変更できます。

詳細については、Tableau Desktop および Tableau Prep 導入ガイドの「表示言語の設定」を参照してください。

データへの接続

Microsoft Access に保存されているデータに接続

Microsoft Access を使ってデータの入力やデータ表の保存を行っている場合、ファイル ブラウザを使ってアクセス ファイルに接続 (バージョン 2007 以降) し、データをクリーニングできるようになりました。

このコネクタでは 64 ビット ドライバーが必要になります。

Tableau Prep をデータに接続する詳細な方法については、Tableau Desktop ヘルプの「Access」(Link opens in a new window)を参照してください。

: データ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データのクリーニングと加工

フローの各ステップのカラースキーマを変更

フローを構築する際にデータに加えた変更を追跡しやすくするために、Tableau Prep は初期状態でフローの各ステップに対して単一の色を割り当てます。しかし、このカラースキーマを任意で変更できます。

カラーパレットから色を選択し、1 つまたは複数のステップのカラースキーマを変更できるようになっています。変更したいステップを [フロー] ペインで選択し、選択したステップを右クリックし、さらにコンテキストメニューで [ステップの色を編集] を選ぶだけです。

見た目が気になりますか?トップメニューで [元に戻す] をクリックするか、カラーパレット メニューで [ステップの色をリセット] を選択します。

詳細については、フローで使用するカラー スキーマの変更(Link opens in a new window)を参照してください。

各ステップに説明を追加

フローを他の人と共有する際、変更の内容や理由を伝えるのがわずらわしくなることもあります。フローの各ステップに短い説明を追加できるようになったため、作業をスムーズに進めることができます。この説明は右側のフローペインに表示されます。

フロー ステップに説明を加える方法の詳細については、フロー ステップとクリーニング操作への説明の追加(Link opens in a new window)を参照してください。

あいまい一致を使用してスペルミスを発見・修正

スペルミスにより同じ値にばらつきがある際、それを素早く特定して整理できるよう、あいまい一致のクリーニング機能という別のオプションを追加しました。新しいスペリング オプションを使えば、文字が余分にあったり不足していたりする差分を持つテキストの値を見つけてグループ化することができます。このオプションは、サポートされているすべての言語で機能します。

スペリング オプションはレーベンシュタイン距離アルゴリズムを利用して 2 つのテキストの値の編集距離を計算してから、編集距離が既定のしきい値より小さい場合にそれらをグループ化します。

詳細については、フィールド値の編集を参照してください。

作業の保存と共有

コマンドラインからフローを実行

Tableau Prep でデータを最新に保つために、フローを実行することになります。しかし、フローを実行したい時に毎回 Tableau Prep を開くのは時間がかかります。このプロセスを合理化するために、Tableau Prep を開かずにコマンドラインからフローを実行できるようになりました。

コマンドラインからフローを実行するためには、次のものが必要になります。

  • 実行したいフロー (.tfl) ファイルのパス。

  • フローが入力ステップで接続するデータベースの認証資格情報、および出力がパブリッシュされるサーバーの認証資格情報を含む .json ファイル。

    フローが入力または出力で接続したりパブリッシュしたりするのがローカル ファイルやネットワーク共有上のファイルの場合は、このファイルは必要ありません。

    : ネットワーク共有上に保管されているファイルに接続またはパブリッシュする場合、パスワード保護はサポートされません。

  • フローを実行するマシンの管理者パーミッション。

このオプションは、Windows マシン (タスク スケジューラ対応) と Mac マシンのどちらでも利用できます。このプロセスを使用するには、ライセンス認証された Tableau Prep バージョンが必要で、Prep がインストールされたマシンでプロセスを実行する必要があります。

コマンド ラインからフローを実行する方法については、コマンド ラインからフロー出力ファイルを更新を参照してください。

バージョン 2018.2.1 での追加

Tableau Prep のインストールと展開

コマンド ラインから Tableau Prep のライセンス認証を解除

Tableau Prep をコンピューター上に置いておく必要がなくなったら、Tableau Desktop の場合と同じように -return オプションを使ってコマンド ラインからライセンス認証を解除できるようになりました。

詳細については、「プロダクト キーのライセンス認証を解除」(Link opens in a new window)を参照してください。Tableau Prep でコマンドラインから利用できる他のインストーラーのプロパティの詳細については、「インストーラー オプション」と「Tableau Desktop の導入」(Link opens in a new window)の関連セクションを参照してください。

仮想デスクトップ サポートを使用して Tableau Prep のインストールを最適化

Tableau Desktop の場合と同様に、仮想デスクトップ サポートの設定を行い、非永続的な仮想デスクトップや定期的にイメージをとるコンピューターで使用する Tableau Desktop のインストールを最適化できるようになりました。仮想デスクトップ サポートを使えば、Tableau がホストする「Authorization to Run」(ATR) サービスを使って事前に指定した期間が過ぎた後に自動的に Tableau Prep のライセンス認証を解除できるため、プロダクト キーのライセンス認証を手動で解除する手間が省けます。

このオプションを設定する詳細な方法については、Tableau Desktop および Tableau Prep の導入ガイドにある「仮想デスクトップ サポートの設定」(Link opens in a new window)を参照してください。

データへの接続

クラウドデータ ソースおよび Hadoop Hive に接続

クラウドデータや Hadoop に保存されているデータに接続できるよう、次のコネクタのサポートを追加しました。

  • Snowflake

  • Amazon EMR Hadoop Hive

  • Cloudera Hadoop (Hive および Impala)

  • Hortonworks Hadoop Hive

  • MapR Hadoop Hive

  • Apache Drill

  • SparkSQL

Tableau Prep をデータに接続する詳細な方法については、Tableau Desktop ヘルプの「サポートされているコネクタ」(Link opens in a new window)のところで、お使いのコネクタのトピックを参照してください。

これらのデータ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開けますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

データの探索

必要なデータのみ保持するための新しいフィルターオプション

Null 値を保持・除外する際やテキスト値に対するワイルドカード一致を設定する際に、複雑な計算式を記述する必要がなくなりました。まずは計算式を記述し、適切な結果が得られなかったら変更を元に戻すという作業を行うことなく、任意のフィールドに対して新しいフィルターオプションのいずれかを選択するだけで、変更による影響を即座に確認できるようになっています。

詳細については、データの検証を参照してください。

データのクリーニングと加工

計算フィールドで ISO-8601 の日付規格を使用

グレゴリオ暦をサポートするために計算フィールドを作るのが簡単になりました。次の日付の構成要素において、Tableau Prep が ISO-8601 国際日付規格をサポートするようになりました。

  • "iso-year"

  • "iso-quarter"

  • "iso-week"

  • "iso-weekday"

これらの日付の構成要素は DATEPART、DATETRUNC、DATENAME、DATEDIFF、および DATEADD 関数で使用します。

例: Week Number = STR(DATEPART('iso-year', [Week Date])) + "-" + STR(DATEPART('iso-week', [Week Date]))

計算フィールドで日付関数を使用する詳細な方法については、Tableau Desktop ヘルプの「日付関数」(Link opens in a new window)を参照してください。

データグリッドにクリーニング操作を適用

以前のバージョンではデータのプレビューがデータグリッドによって表示されましたが、クリーニングのオプションはほとんど利用できませんでした。今後はどこからでもデータを操作できるようになります。データグリッドで詳細な値を操作したり、プロファイルペインを折りたたんだり、プロファイルペインで利用できるものと同じクリーニング操作をデータグリッドで行えます。

詳細については、データのクリーニングと加工を参照してください。

プロファイルペインで値を複数選択してグループ化

プロファイル カードで複数の値を選択してから右クリックしてメニューを開き、[グループ化] を選択することで、単一のフィールドの一連の値を素早くグループ化できるようになりました。右クリックしてメニューを開く際、選択したフィールド値のもとで値がグループ化されます。グループ化された値の隣にクリップのアイコンが表示されます。

グループ化された値を右クリックすると再びメニューが開き、値のグループ化を解除したり、値を編集したりできます。

値のグループ化の詳細については、フィールド値の編集(Link opens in a new window)を参照してください。

その他の機能拡張

操作性を向上させるため、以下の機能拡張も行いました。

  • フローにステップを追加する際にメニュー上に新たなアイコンが表示され、見た目に分かりやすくなるとともに、Tableau Prep の視覚的言語を理解しやすくなります。

  • また、プロファイルペインにアニメーションが加わり、変更による影響を視覚的に把握しやすくなっています。

     

データの結合またはユニオン

ユニオンの推奨事項を使用して一致しないフィールドをクリーニング

複数のファイルにユニオンを実行した後、一致しないフィールドを修正しやすくなりました。[ユニオンのサマリー] ペインに追加された [一致しないフィールド] セクションに、一致しないフィールドとそのデータ ソースが一覧表示されます。次のオプションのいずれかを使用し、このセクションで一致しないフィールドを直接マージすることができます。

  • リストから単一のフィールドを選択します。データ型、フィールド名の類似性に基づいて Tableau Prep が同様の特性を持つと判断したフィールドが黄色くハイライト表示されるため、一致したことが分かります。一致したとして提案されたフィールドにカーソルを合わせるとプラス ボタンが表示され、クリックすれば 2 つのフィールドをマージできます。

  • リストで複数のフィールドを選択し、いずれかを右クリックして [フィールドのマージ] を選択します。

    データのユニオン、および一致しないフィールドを解決する詳細な方法については、データのユニオン作成 を参照してください。

一致しないフィールドをすべての結合タイプについて特定

どのような方法でテーブルを結合しても、一致しないフィールドを簡単に識別できるようになりました。以前のバージョンでは [結合句] の表に、単一のフィールドが別のフィールドと同じである場合にのみ除外されるフィールド値が表示されていました。しかし今後は、結合句で一致させる際に、"End Date >= Modified Date" のようにどの演算子を使う場合でも、このデータが表示されます。

詳細については、データの結合(Link opens in a new window)を参照してください。

バージョン 2018.1.2 での追加

Tableau Prep のインストールと展開

コマンド ラインからの Tableau Prep のライセンス認証と登録 (Windows)

Tableau Desktop と同様、コマンド ラインを以下のプロパティと一緒に含めることにより、コマンド ラインから Tableau Prep をライセンス認証して登録できるようになりました:

  • ACTIVATE_KEY="<key>"。インストーラーで -activate を実行してプロダクト キーを適用します。

  • REGISTER=“1”。インストール プロセスの際、インストーラーは -register プロセスを実行し、登録情報を追加します。

これらのインストーラーのプロパティや、コマンド ラインから Tableau Prep のライセンス認証と登録を行う方法の詳細については、「インストーラー オプション」と「Tableau Desktop の配置」(Link opens in a new window)の関連セクションを参照してください。

データへの接続

統計ファイルまたは Presto に保存されているデータへの接続

さらに多くの場所のデータに接続するのに役立つ新しいコネクタを 2 つ追加しました。

  • 統計ファイル。SAS (*.sas7bdat)、SPSS (*.sav)、および R (*.rdata) データ ファイルに接続します。

  • Presto。Presto への接続の構成方法の詳細については、Tableau Desktop ヘルプの「Presto」(Link opens in a new window)を参照してください。

これらのデータ コネクタには下位互換性がありません。これらのコネクタを含むフローは以前のバージョンの Tableau Prep で開きますが、データ接続を削除しない限りエラーが発生したり実行できなかったりします。

インプット ステップで Data Interpreter が見つけたサブテーブルでのユニオン作成

Data Interpreter を使用して Microsoft Excel データをクリーニングしており、これから結果のサブテーブルのユニオンを作成したいと考えていますか。ワイルドカード ユニオンを使用し、インプット ステップで見つかったすべてのサブテーブルのユニオンを作成できるようになりました。

サブテーブルのいずれかを [フロー] ペインにドラッグしてから、ワイルドカード検索条件を使用してデータのユニオンを作成する残りのサブテーブルを選択し、インプット ステップにすべてのサブテーブルのデータを含めるだけです。

詳細については、データへの接続を参照してください。

テーブルを読み込んでいる場合のより良いフィードバック

初めてデータベースに接続する場合、何も起こらなかったように見えることがあります。新しいインジケーターにより、データが読み込み中であることが分かるようになりました。

データの探索

プロファイル ペインとデータ グリッドでのフィールドの並べ替え

ドラッグ アンド ドロップにより [プロファイル] ペインと [データ] グリッドの両方でフィールドを並べ替えできるようになりました。2 つのペインの同期状態は維持されます。また、フィールド名を変更してもフィールドの順序は維持されます。フィールドの並べ替えは自動で行われなくなります。

データのクリーニングと加工

ドラッグと選択によるフローの複数ステップの削除

フローのセクション全体を簡単に削除できるようになりました。[フロー] ペインをクリックし、削除するフローのセクションをマウスでドラッグして選択できるようになりました。その後、右クリックし、選択したすべてのステップを一度に削除してください。詳細については、データのクリーニングと加工(Link opens in a new window)を参照してください。

フィールドの複数グループに対する単一アクションでのピボット処理

Tableau Prep のピボット オプションが、さらに複雑なスプレッドシートやテキスト ファイルを十分にサポートするように拡張されました。単一ピボット処理を実行するか、ピボット処理するフィールドのグループを選択できるようになりました。

たとえば、スプレッドシートをピボット処理し、月および年別に売上、税額、合計を表示するには、フィールドの各グループのピボット処理を行い、必要な結果を得ることができます。詳細については、データのクリーニングと加工(Link opens in a new window)を参照してください。

元のスプレッドシート フィールドの複数グループに対するピボット処理後

フィールドをマージする際のフィールド命名の向上

フィールドをマージする場合、フィールド名が連結されなくなりました。代わりに、ターゲット フィールドのフィールド名が維持されます。詳細については、フィールドのマージ(Link opens in a new window)を参照してください。

連結されたフィールドの命名 簡素化されたフィールドの命名

その他の機能拡張

有用性とパフォーマンスを向上させるため、以下の機能拡張も行いました。

  • 新しい編集アイコンが [変更内容] ペインのエントリーにカーソルを合わせると表示され、どのアイテムが編集可能かを迅速に確認するのに役立ちます。

  • ステップ名を変更してもフローが自動的に実行されなくなったため、作成エクスペリエンスはシームレスです。

  • 複数のシートを含む Microsoft Excel ファイルに接続する場合、[接続] ペインが自動的に開き、データを迅速に取得するのに役立ちます。

 

ありがとうございます! フィードバックの送信中にエラが発生しました。もう一度やり直すか、メッセージをお送りください