Tableau Desktop での 2 番目の日付を使用した分析

これはチュートリアルの 2 つ目のステージで、最初のステージであるTableau Prep で 2 番目の日付を検索するは完了しているものと想定しています。

最初のステージでは、元のデータ セットを使用し、それを加工して以下の質問に答えました。

  1. 各ドライバーでの 1 回目の違反から 2 回目の違反までの日数の長さはどれほどか。

  2. 1 回目の違反と 2 回目の違反の罰金額を比較する。相関しているか。

  3. 支払額が全体で最も多いのはどのドライバーか。支払額が最も少ないのは誰か。

  4. 違反の種類が複数あるドライバーは何名いるか。

  5. 交通違反者講習会に参加したことのないドライバーでの平均罰金額がいくらか。

これらの質問についてこれから考えていくと、作成した最初のデータ構造にはいくらかの長所と短所があることがはっきりとします。Tableau Prep Builder に戻って追加の整形を行い、Tableau Desktop で同じような分析をするとどのような違いが出るか確認します。最後に、元のデータで詳細レベル (LOD) 表現を使用して分析する Tableau Desktop のみのアプローチを見ていきます。

このチュートリアルの目的は、最適な方法を規定して確立することではなく、現実のシナリオを背景にさまざまな概念を提示し、オプションを確認していくことです。終えるころには、データ構造による計算や分析への影響について理解が深まるだけでなく、Tableau Prep のさまざまな側面や Tableau Desktop での計算について習熟度が増しているに違いありません。

: このチュートリアルのタスクを完了するには、Tableau Prep Builder と Tableau Desktop (オプション) をインストールし、データをダウンロードする必要があります。

このチュートリアルを続行する前に Tableau Prep と Tableau Desktop をインストールするには、「Tableau Desktop および Tableau Prep 導入ガイドの概要」(新しいウィンドウでリンクが開く)を参照してください。または、Tableau Prep(新しいウィンドウでリンクが開く)Tableau Desktop(新しいウィンドウでリンクが開く) の無料トライアル版をダウンロードすることもできます。

データ セットには、最初のステージで作成した Driver Infractions.tflx からの出力を使用します。

Tableau Desktop での分析

データの構成が完了したので、データを Tableau Desktop へと移します。簡単に答えられる質問もありますが、少しの (または多くの) 計算が関係している質問もあります。以下の質問に挑戦してみてください。それぞれ展開すると、行き詰まった場合にどのように続行するか基本的な情報が得られます。

: ソリューションを背景と合わせて確認するには、Driver Infractions.twbx(新しいウィンドウでリンクが開く) のワークブックをダウンロードできます。分析を解釈する、または解答を求める他の方法もある可能性があることに留意してください。

1.各ドライバーでの 1 回目の違反から 2 回目の違反までの日数の長さはどれほどか。
2.1 回目の違反と 2 回目の違反の罰金額を比較する。相関しているか。
3.支払額が全体で最も多いのはどのドライバーか。支払額が最も少ないのは誰か。
4.違反の種類が複数あるドライバーは何名いるか。
5.交通違反者講習会に参加したことのないドライバーでの平均罰金額がいくらか。

詳しく—ピボット処理されたデータ

操作しているデータは特に 1 回目と 2 回目の違反に関する質問に対応できるように十分に構成されていますが、Tableau Desktop での使用に推奨されている標準的な構造ではありません。分析が違反日に関する基本的な質問から外れるほど、計算で関連情報を使用可能な形に組み合わせるのは複雑になります。

通常、同じ種類のデータに対して複数の列を使用してデータを保存し (日付に 2 列、罰金額に 2 列など)、フィールド名に一意の情報を保存する場合 (1 回目の違反か 2 回目の違反かどうかなど)、データをピボット処理する目安となります。

Tableau Prep Builder で複数のピボットを実行すれば、これを上手く処理できます。前のチュートリアル 2 番目の日付を検索する で作成した Tableau Prep のTableau Prep で 2 番目の日付を検索するフローの終わりの部分から作業できます。

ヒント: これらのステップに進めるように Tableau Prep に戻っていることを確認してください。

  1. 最終的なクリーニング ステップより、複製されたすべてのフィールド別にピボット処理するピボット ステップを追加します。[ピボットされたフィールド] エリアの右上隅にあるプラス アイコンを使用し、さらに [ピボット値] を追加します。各セットのフィールド (1 回目の罰金額と 2 回目の罰金額) は一緒にピボット処理する必要があります。

    ピボット処理の詳細については、データのクリーニングと加工を参照してください。

  2. [ピボットされたフィールド] エリアの [Pivot1 Names (Pivot1 名)] 列で、各値をダブルクリックし、名前を 1 番目と 2 番目に変更します。

    5 つのピボットを示す Tableau Prep のピボット 1 構成ペイン

結果は、NULL の日付の削除、フィールド名の変更、フィールドの並べ替えにより整理することができます。

  1. ピボット後にクリーニング ステップを追加します。[Infraction Date (違反日)] 列で NULL のバーを右クリックし、[除外] を選択します。

  2. フィールド名 [Pivot1 Names (ピボット1 の名前)] をダブルクリックし、名前を「Infraction Number (違反数)」に変更します。

  3. フィールドを以下のようにドラッグし、適宜並べ替えします。

    ピボット処理およびクリーニングされたデータのプレビュー

  1. ピボット処理された新しいデータより、"Pivoted Driver Infractions (ピボット処理したドライバー違反)" という名前を付けた出力を作成し、Tableau Desktop に移動します(フローの実行は、出力ステップを追加した後にしてください)。

ここでもう一度、ピボット処理されたデータ構造を使用し、5 つの質問を見ていきましょう。それぞれ展開すると、行き詰まった場合にどのように続行するか基本的な情報が得られます。

: 完了したフロー ファイルである Pivoted Driver Infractions.tflx をダウンロードして作業を確認するか、ワークブックの Pivoted Driver Infractions.twbx をダウンロードしてソリューションを背景と合わせて確認できます。分析を解釈する、または解答を求める他の方法もある可能性があることに留意してください。

1.各ドライバーでの 1 回目の違反から 2 回目の違反までの日数の長さはどれほどか。
2.1 回目の違反と 2 回目の違反の罰金額を比較する。相関しているか。
3.支払額が全体で最も多いのはどのドライバーか。支払額が最も少ないのは誰か。
4.違反の種類が複数あるドライバーは何名いるか。
5.交通違反者講習会に参加したことのないドライバーでの平均罰金額がいくらか。

ピボット処理したデータのメリット

その構造で簡単に解答できる質問に答えさえすればよいのであれば、チュートリアルの元のデータ構造のままで問題ありません。しかし、ピボット処理されたデータの形式にはさらに柔軟性があります。いくらかの計算は必要ですが、一度設定すると、結果のデータ セットはより幅広い質問に解答できるように調整されます。

さらに詳しく—計算のみ

Tableau Prep Builder にアクセスできない場合はどうすればよいでしょうか。元のデータで行き詰まっているなら、完全に運が尽きたということでしょうか。そんなことはありません。

Tableau Desktop と LOD 表現を使用すると、分析に関する質問すべてに解答することができます。元の Traffic Violations.xlsx(新しいウィンドウでリンクが開く) に接続すると、ピボット処理されたデータ セットにとてもよく似ています。とても大切な [Infraction Number (違反数)] フィールドがないだけです。LOD 表現を使用して集計ステップの結果を真似る必要があります。

: ソリューションを背景と合わせて確認するには、LOD Driver Infractions.twbx(新しいウィンドウでリンクが開く) のワークブックをダウンロードできます。分析を解釈する、または解答を求める他の方法もある可能性があることに留意してください。

1.各ドライバーでの 1 回目の違反から 2 回目の違反までの日数の長さはどれほどか。
2.1 回目の違反と 2 回目の違反の罰金額を比較する。相関しているか。
3.支払額が全体で最も多いのはどのドライバーか。支払額が最も少ないのは誰か。
4.違反の種類が複数あるドライバーは何名いるか。
5.交通違反者講習会に参加したことのないドライバーでの平均罰金額がいくらか。

このソリューションには多数の入れ子の計算と LOD 表現があることに留意することが重要です。データ セットのサイズやデータの複雑さによっては、パフォーマンスが問題となることがあります。

方法への反映

では、どの方法を採用すべきでしょうか。すべてはユーザーやユーザー使用可能なツールにかかっています。

  • LOD を使用しない場合にはデータを加工するソリューションがありますが、分析によっては計算が必要となることがあります (Tableau Desktop での分析)。

  • データを加工することができ、計算 (LOD を含む) に精通しているのであれば、無難なオプションを使用することで最適な柔軟性が得られます (詳しく—ピボット処理されたデータ)。

  • LOD に精通しているのであれば、パフォーマンスへの影響は最小限です。Tableau Prep を使用しなくしても、LOD 単独でこれを解決するというオプションもあります (さらに詳しく—計算のみ)。

少くとも、Tableau Prep での集計や Tableau Desktop での詳細レベル表現がどのように相互に関係しているかを理解し、データ分析に影響するかを理解することは重要です。Tableau での多くの場合と同様、何をするにも方法は 1 つではありません。さまざまなオプションをすべて調べると、概念を取り合わせ、自分に最適なソリューションを選択することができます。

使用した計算は以下の通りです。

: Ann Jackson の Workout Wednesday のトピック「顧客の購入額は 1 回目と 2 回目のどちらが多いか」(英語)(新しいウィンドウでリンクが開く) および Andy Kriebel の Tableau Prep のヒント「1 回目と 2 回目の購入日を求める」(英語)(新しいウィンドウでリンクが開く) は今回のチュートリアルに関し、最初の着想を与えるものとなりました。深く感謝申し上げます。これらのリンクをクリックすると、Tableau Web サイトから離れます。Tableau は外部プロバイダーによって管理されているページの正確さや最新度に関して責任を負いかねます。コンテンツに関するご質問はサイトの所有者にお問い合わせください。