Tableau データ ストーリーの設定: 分析
Tableau データ ストーリーの重要な変更
Tableau データ ストーリーは、2025 年 1 月 (2025.1) の Tableau Desktop、Tableau Cloud、Tableau Server で廃止されます。自然言語技術の進歩に伴い、Tableau は、データに関する質問や変更点の把握をより簡単に行えるように、インターフェイスの改善に取り組んでいます。詳細については、「Tableau AI を搭載した Tableau Pulse がデータ エクスペリエンスを刷新」(新しいウィンドウでリンクが開く)を参照してください。
Tableau データ ストーリー内で、どの分析について記述するのか、いつの分析について記述するかを選択できます。ストーリーのタイプと、ストーリーに含まれるディメンションとメジャーの数に応じて、様々なタイプの分析を利用できます。ただし、散布図のストーリー タイプに対する分析は現在サポートされていません。詳細については、「自分の Tableau データス トーリーに合った適切なストーリー タイプを選択する」を参照してください。
ストーリー用に分析を設定する
- ダッシュボードに Tableau データ ストーリーを追加する。
- ダッシュボードで、データ ストーリー オブジェクトの左上隅にある [設定] アイコンをクリックします。
- [データ ストーリー] ダイアログ ボックスで [分析] タブをクリックします。
- スイッチをクリックして、様々なタイプの分析を有効にします。
- [セグメント] と [傾向線] については [設定] を展開し、分析を行うしきい値を設定します。
- [保存] をクリックします。
様々なタイプの分析を理解する
相関性
相関姓を使用すると、2 つの系列間で真の統計的相関姓を特定できます。系列が 3 つ以上ある場合は、すべての組み合わせについて相関姓を分析します。たとえば、相関姓をオンにすると、2 つの製品が一緒に購入されることが多い時期を特定できます。
クラスタリング
クラスタリングを使用すると、性質が異なるデータ ポイントのグループ (クラスター) を単一の統計分析を使用して特定できます。たとえば、クラスタリングをオンにすると、ある製品が特定の地域で非常に人気が出る時期を特定できます。
分布
分布を使用すると、平均、中央値、歪みなどの非統計的観測値を使用してデータ ポイントを相互にランク付けできます。たとえば、分布をオンにすると、利益率が最も高い製品を特定できます。
セグメント
セグメントを使用すると、系列内のデータ ポイントに対する注目すべき変化を強調表示できます。まず、記述したいセグメント内の変化の最小割合を設定します。定義したしきい値を下回る変化については記述されません。たとえば、60% を超える変化をセグメントのしきい値として設定した場合、時系列上で 30% の減少が見られる谷間の期間があってもストーリーは記述しません。
しきい値を設定したら、フォーマットを適用するかどうかを選択し、フォーマットしたい変化の最小割合を設定します。
傾向線
傾向線を使用すると、線形最適線を計算し、定義された信頼度の範囲内にあるデータを特定できます。変動性の高いデータは、一貫性のあるデータに比べて信頼レベルが低く、その信頼レベルは傾向線が記述されるかどうかに影響します。傾向線は、ディメンションが 1 つでメジャーが 1 つのストーリーで使用することも、ドリルダウンで使用することもできます。ドリルダウンの詳細については、「Tableau データ ストーリー設定の構成: ナラティブ」を参照してください。
傾向線の信頼度の最小割合を設定します。しきい値を 95% に設定すると、90% の信頼度で傾向線を描画できる場合でも、ストーリーは傾向線について記述しません。しきい値を設定したら、フォーマットを適用するかどうかを選択します。次に、フォーマットする変化の最小割合を設定します。
傾向線に関するTableau データ ストーリーは、ある期間にわたる絶対的な変化を伝えます。傾向線について記述されたストーリーは、ストーリーに設定した冗長性のレベルによって異なります。ストーリーが高い冗長性を使用している場合、ストーリーは R 二乗値について記述します。これは、データが傾向線にどの程度適合しているかを定量化する統計的概念です。冗長性設定の詳細については、「Tableau データ ストーリー設定の構成: ナラティブ」を参照してください。
傾向線の設定では、ストーリーに予測を記述する将来の期間を選択することもできます。予測を使用する場合、ストーリーは傾向線の傾きと切片を使用して、将来の期間の予測値を計算します。予測の信頼度に応じて、傾向線に設定した信頼度のしきい値に上限と下限を追加します。予測は、ストーリーにデータポイントが少なくとも 30 あり、それらが線形である場合に使用できます。
変動性
変動性を使用すると、時間の経過に伴う標準偏差を分析できます。たとえば、データの平均的な範囲から外れた値についてストーリーに記述させたい場合、変動性を使用します。
ストーリー生成のために分析を使用する方法
この時点で、様々なタイプのストーリー用の分析が、どのように行われるのか気になるところでしょう。各タイプのストーリーの例を見て、ストーリーの各文を分解してみましょう。
非連続的なストーリーのための分析を理解する
連続的なストーリーでは時間の経過に伴う傾向を測定するため、データ ストーリー は、パフォーマンス、進行、平均、合計、傾向、変動性、セグメント、予測について記述します。
次の連続的なストーリーの例は、月々の売上に関するものです。
ストーリーの例 | ストーリーの内容 |
| 最初の 2 つの文は、平均関数と範囲関数を使用して、分析期間の平均値、最大値、最小値について記述しています。 |
| 3 番目の文は、期間中のメジャーの全体的なパフォーマンスに関するものです。たとえば、特定の期間に売上が増加したか、減少したか、傾向が変わったか、といった文が考えられます。 |
| 4 番目の文は、進行分析を使用します。この文は、割合ベースと絶対数ベースの両方で、そのメジャーに基づく期間中の最大の増減について記述しています。 |
| この文は、相関関係のインサイトです。このタイプの分析インサイトは、データ内の異なる系列間の顕著な相関関係について記述しています。 |
| この文は、セグメントのインサイトです。このタイプの分析インサイトは、時間の経過とともに注目すべき増減について記述しています。 |
| この文は、傾向線のインサイトです。このタイプのインサイトは、傾向線がデータにどの程度適合しているかを一定の信頼度で記述しています。傾向線を使用すると、過去の傾向に基づいて予測を立てることができます。 |
非連続的なストーリーのための分析を理解する
非連続的なストーリーでは値を比較してデータの分布を把握できるため、ストーリーは、分布、平均、合計、データのグルーピングやクラスターについて記述しています。
次の非連続的なストーリーの例は、製品ごとの売上に関するものです。
ストーリーの例 | ストーリーの内容 |
| 最初の文は、メジャーの合計値を計算しています。 |
| 2 番目の文は、ディメンションのドライバーについて記述しています。この例では、ディメンションのドライバーは、総売上に最も貢献した製品です。 |
| 3 番目と 4 番目の文は、データの分布を分析しています。平均、中央値、データの集中度 (存在する場合)、およびデータがどのように歪んでいるかを分析します。これらのグループ化された変数が互いにどの程度バランスが取れているかを特定するのに役立ちます。 |
| この文では、クラスタリングを使用して、グループ化できるメジャーについて記述しています。データの中に目立つ明確なグループがあるかどうかを特定するのに役立ちます。 |
| 最後の文は、注目すべき外れ値について記述しています。 |
散布図ストーリー用に分析を理解する
散布図のタイプのストーリーは、2 つのメジャー間の関係を理解するために最もよく使用されます。そのため、散布図ストーリーには 2 ~ 3 のメジャーが必要です。散布図分析は、2 つのメジャー間の関係 (回帰) について記述し、データ内にグループ (クラスター) が存在する場合はそれについて記述しています。
次の散布図ストーリーの例は、ディメンション全体の利益と売上に関するものです。
ストーリーの例 | ストーリーの内容 |
| 最初の 2 つの文は、回帰分析に基づいています。回帰は、あるメジャーが別のメジャーにどのように影響するかを示します。最初の文で、ストーリーが利益と売上の関係を特定していることに注意してください。 |
| 3 番目の文は、クラスタリングから導出しています。クラスタリング分析は、データ内のすべての変数にまたがって、主要なグループやクラスターの特定を試みます。 |
| 4 番目の文は、平均を大幅に上回ったり下回ったりする外れ値について記述しています。 |
| 散布図ストーリーの残りの文は、範囲と平均の分析を使用してインサイトを記述しています。 |
ストーリー全体の割合のための分析を理解する
ストーリー タイプ全体で割合を示すと、ディメンションやメジャーが全体のどれだけを占めるかをよく把握できます。
次の全体の割合の例は、セグメント別の売上に関するものです。
ストーリーの例 | ストーリーの内容 |
| 最初の文は、メジャーの合計値を計算しています。 |
| 2 番目の文は、ドライバーについて記述しています。この例では、ドライバーは総売上に最も貢献したセグメントです。 |
| 最後の文は、データの分布を分析しています。 |