データ操作のヒント
データはさまざまな方法で整理できます。Tableau Desktop を活用するため、Tableau では、分析用に書式設定されているデータに接続することをお勧めします。具体的には次のようなデータが該当します。
集計ではなく可能な限り粒度が細かい (月平均ではなく毎日の気候データなど)
データベース表のように整理されている (クロス集計など列指向の表ではない)
関係のない情報が除外されている (データやヘッダーではない一切の情報)
データが分析用に構造化されていると、質問やその回答がはるかに簡単になります。Tableau では、データに既に含まれる集計により制限されることなく、生データを必要なレベルで集計することができます。グループと階層を必要に応じて作成し、計算を分析フローの中で実行することができます。
Tableau Desktop には基本的なクリーニング オプションとデータ インタープリターがあります。さらに複雑な書式設定の問題には、Tableau Prep が必要となる場合があります。
次の Tableau Desktop に固有のセクションでは、データの分析が困難になる可能性のある一般的な書式設定や問題に焦点を当て、それを解決するための提案を行います。
クロスタブ形式でのデータのピボット
データをクロス集計形式として書式設定すると、表は列指向となります。列指向の表では、変数は列見出しとして保存されます。ただし、Tableau Desktop は行指向データ用に最適化されています。行指向データでは、変数は行の値に保存されます。
たとえば、学生の数学、理科、および社会の点数を示す行指向の表があるとします。
Tableau Desktop は、行指向の表に接続するよう最適化されています。そのため、数学、理科、および歴史の値は "教科" という列の下に整理され、各生徒の点数は "点数" という列の下に整理されます。Excel データを手動で編集することにより、行の列をピボットできます。または、Desktop から Excel データに接続してから、ピボット オプションを使用します。ピボット オプションの詳細については、ピボット データ ([列] から [行])を参照してください。
事前集計データの削除
データは多くの場合、事前に集計されていることがあります。つまり、データに合計や平均、中央値などが含めることができます。事前集計されたデータの例として一般的なものは、小計と総計の形で出現します。小計および総計データは未加工データから計算されますが、未加工データ自体の一部ではありません。
たとえば、小計情報の行を含む表があるとします。
この場合、事前集計されたデータを削除する必要があります。分析で小計や総計を使用するには、手動で表からこのタイプの情報を削除します。次に、Desktop から Excel データに接続し、合計オプションを使用して小計と合計を計算します。詳細については、ビジュアライゼーションでの合計の表示を参照してください。または、Desktop から Excel データに接続してから、Data Interpreter をオンにして合計オプションを使用します。詳細については、Excel、CSV、PDF、および Google スプレッドシートからのデータ インタープリターを使用するデータのクリーニングを参照してください。
冒頭部分のテキストの削除または除外
レポートとして配信される Excel データには、タイトルや導入部テキストのブロックを含めることができます。Desktop は表計算の最初の行に列見出しまたは行の値が入ることを予測しているため、この情報により分析中に問題が発生する可能性があります。
たとえば、レポートのタイトルと日付を含む表があるとします。
この場合、タイトルと日付情報を削除する必要があります。レポートでタイトルと日付を使用するには、次のいずれかを実行します。
- Excel データからこの情報を手動で削除します。次に、Desktop から Excel データに接続し、タイトル オプションを使用してレポートのタイトルを追加します。詳細については、ビューの各部分の書式設定を参照してください。
- Desktop から Excel データに接続してから、Data Interpreter をオンにしてタイトル オプションを使用します。詳細については、Excel、CSV、PDF、および Google スプレッドシートからのデータ インタープリターを使用するデータのクリーニングを参照してください。
- Excel データからこの情報を削除できない場合は、名前付きの範囲を作成して、Desktop から名前付きの範囲に接続します。詳細については、Excelを参照してください。
階層ヘッダーを平坦化して 1 つの行にする
一般的に、Tableau Desktop は Excel データの 1 行目にのみ列見出しが含まれることを予測します。列見出しの複数のレイヤーを含むデータにより、分析中に問題が発生する可能性があります。
たとえば、1 つのメジャー ヘッダーと複数のサブヘッダーを含む表があるとします。
この場合、ヘッダーの階層を平坦化するか削除する必要があります。これを行うため、Excel データの階層の各ヘッダーに、手動で直接新しい列を作成できます。または、Tableau Desktop から Excel データに接続してから、Data Interpreter をオンにします。見出しが正しく平坦化されていることを検証してください。Data Interpreter の詳細については、Excel、CSV、PDF、および Google スプレッドシートからのデータ インタープリターを使用するデータのクリーニングを参照してください。
空白セルがないことを確認してください
階層ヘッダー用に新しい列を作成する場合は、新しい列の各セルに値が含まれていることを確認してください。
各行に同じ値を繰り返す場合もありますが、階層ヘッダーに保存されたデータと関連付けられたデータが各行に含まれていることが重要です。Excel データから空白セルを手動で削除する必要があります。
空白行の削除
データに空白行がないことを確認してください。空白行を修正するには、Excel データから空白行を削除する必要があります。
欠落したヘッダーの追加
欠落している列見出しがないことを確認してください。欠落しているヘッダーを修正するには、Excel データに直接、欠落しているヘッダーを手動で追加する必要があります。