データの抽出

データ抽出は、元のデータセットとは別に保存される情報のサブセットです。これには 2 つの目的があります。1 つはパフォーマンスの向上、もう 1 つは元のデータでは利用できないかサポートされていない可能性がある Tableau 機能を利用することです。データ抽出を作成すると、フィルターを適用したり、その他の制限を設定したりして、全体のデータ量を効果的に削減できます。

データ抽出が作成されると、元のソースからの最新データでデータ抽出を更新できます。更新プロセス中に、抽出のすべての既存のコンテンツを置換する完全更新と、前回の更新以降の新しい行のみを含める増分更新のどちらかを柔軟に選択することができます。

注: バージョン 2024.1 以降の Tableau には、ユーザーが非一意のキー列を使用して抽出に対して増分更新を実行できる機能が導入されています。

抽出のメリット

  • 大規模なデータセットの処理: 抽出では、数十億行に達する大量のデータを処理できます。これにより、ユーザーは広範なデータセットを効率的に操作できるようになります。

  • パフォーマンスの向上: 抽出データ ソースを利用するビューの操作では、元のデータに直接接続されているビューよりもパフォーマンスが向上します。抽出によりクエリのパフォーマンスが最適化され、データ分析とビジュアライゼーションが高速化されます。

  • 機能の強化: 抽出では、元のデータ ソースでは利用できない、またはサポートされていない可能性がある追加の Tableau 機能へのアクセスが提供されます。

    たとえば、ユーザーは抽出を利用して個別カウントを計算できるため、より高度な計算と分析を行うことができます。

  • オフライン データ アクセス (Tableau Desktop): 抽出により、データへのオフライン アクセスが可能になります。これは、元のデータ ソースが利用できない場合でも、ユーザーはローカルでデータを保存、操作、利用できることを意味します。

抽出の作成

Tableau ワークフロー内で抽出を作成するために使用できるオプションは複数ありますが、主なアプローチは次のとおりです。

  1. [データ ソース] ページで、データに接続してデータ ソースをセットアップした後、右上隅にある [抽出] を選択してから、[編集] リンクを選択して [データの抽出] ダイアログ ボックスを開きます。

  2. [データ ストレージ] で、[論理テーブル] または [物理テーブル] を選択します。このステップのサポートについては、「「データ ストレージ」セクションを参照してください。

  3. [フィルター] を展開して、フィルターを設定し、フィールドとその値に基づいて、抽出するデータ量を制限します。

  4. [表示可能なディメンションのデータの集計] を選択し、既定の集計を使用してメジャーを集計します。

  5. (オプション) 年や月などの指定した日付レベルに対して [日付のロールアップ] を選択します。

  6. 抽出する行数を選択します。すべての行、サンプル、または上位 N 行を抽出できます。

  7. [増分更新] のボックスをオンにして、更新するテーブルを指定し、新しい行を識別するデータベース内の列を選択し、必要に応じて更新の最小日付範囲を設定します。

  8. 完了したら、[設定の保存] を選択します。

  9. シート タブを選択します。これにより、抽出の作成が開始されます。

  10. 次に、抽出を保存する場所を選択します。

  11. 抽出ファイル名を入力します。

  12. [保存] を選択します。[保存] ダイアログ ボックスが表示されない場合は、「抽出のトラブルシューティング」セクションを参照してください。

抽出のフィールドの説明

抽出を作成するときに、多数のフィールドを構成できます。このセクションでは、各フィールドについて説明します。

データ ストレージ

[データ ストレージ] では、論理テーブルまたは物理テーブルを選択できます。論理テーブルの場合、データ ソース内の各論理テーブルに対して 1 つの抽出テーブルを使用してデータを格納します。一方、物理テーブルの場合、データ ソース内の各物理テーブルに対して 1 つの抽出テーブルを使用してデータを格納します。

論理テーブル

抽出内のデータ量を制限し、フィルター、集計、上位 N などの追加の抽出プロパティを使用する場合は、[論理テーブル] を選択する必要があります。

  • このオプションは、データにパススルー関数 (RAWSQL) が含まれている場合にも機能します。

  • Tableau は、抽出データを保存するための既定の構造として論理テーブルを使用します。

  • このオプションを選択したときに、抽出に結合が含まれている場合は、抽出の作成時に結合が適用されます。

物理テーブル

抽出が、等価結合と結合されたテーブルで構成されており、[物理テーブル] オプションを使用するための条件を満たしている場合は、[物理テーブル] を選択する必要があります。このオプションにより、クエリ時に結合が実行され、パフォーマンスが向上し、抽出ファイルのサイズが小さくなる可能性があります。

[物理テーブル] オプションを使用する際の考慮事項。[物理テーブル] オプションを使用する抽出を保存するには、抽出に含まれるデータが以下のすべての条件を満たしている必要があります。

  • 物理テーブルの結合がすべて等価 (=) 結合である

  • 関係または結合に使用される列のデータ型が同一である。

  • パススルー関数 (RAWSQL) が使用されていない

  • 増分更新が構成されていない

  • 抽出フィルターが構成されていない

  • 上位 N やサンプリングが構成されていない

  • 抽出が [物理テーブル] として保存される場合、それにデータを追加することはできない

  • 論理テーブルでは、複数の論理テーブルが含まれる抽出にデータを追加することはできない。

[物理テーブル] オプションを使用する条件

Tableau では通常、抽出を使用して設定および操作を行う場合は、既定のデータストレージオプションである [論理テーブル] の使用を推奨しています。多くの場合において、抽出フィルターなど抽出に必要な機能の一部は [論理テーブル]オプションを使用する場合にのみ使用可能となります。

想像以上に大きい抽出に対する [物理テーブル]オプション

[物理テーブル] オプションの使用は控えめにして、データ ソースが [物理テーブル] オプションを使用する条件を満たす場合や、抽出サイズが想像以上に大きい場合など、特定の状況に役立てる必要があります。抽出が必要以上に大きいかどうかを判断するには、[論理テーブル]オプションを使用した抽出の合計行数が、抽出を作成する前にすべての表を組み合わせた合計行数よりも多くなる必要があります。このシナリオが発生した場合は、代わりに [物理テーブル] オプションを使用してみてください。

[物理テーブル] オプションを使用する場合の代替的なフィルタリングの提案

[物理テーブル] オプションを使用する場合、抽出データを減らすために役立つその他のオプション (抽出フィルター、集計、上位 N、サンプリングなど) が無効になります。[物理テーブル] オプションを使用する抽出でデータを減らす必要がある場合は、データをフィルタリングしてから、次の提案のいずれかを使用して Tableau Desktop に取り込むことを検討してください。

データに接続し、カスタム SQL を使用してフィルターを定義する

データベース テーブルに接続する代わりに、カスタム SQL を使用してデータに接続します。カスタム SQL クエリを作成する場合は、抽出でデータを減らす際に必要となる適切なレベルのフィルタリングを必ず含めるようにしてください。Tableau Desktop のカスタム SQL の詳細については、「カスタム SQL クエリへの接続」を参照してください。

データベースのビューを定義する

データベースへの書き込みアクセス権がある場合は、抽出に必要なデータのみが含まれるデータベース ビューを定義してから、Tableau Desktop でデータベース ビューに接続することを検討してください。

抽出を使用した行レベルのセキュリティ

行レベルで抽出データを保護する場合は、[物理テーブル] オプションを使用することがこのシナリオを達成するために推奨される方法です。Tableau での行レベルのセキュリティに関する詳細は、「データ行レベルでのアクセスの制限」を参照してください。

テーブルに関する一般的な考慮事項

[論理テーブル] オプションと [物理テーブル] オプションのどちらも、抽出のデータの保存方法のみに影響を及ぼします。このオプションを使用しても、[データ ソース] ページでの抽出が表示される方法には影響しません。

たとえば、抽出が 3 つの物理テーブルを含む 1 つの論理テーブルで構成されているとします。

既定のオプションである [論理テーブル] を使用するように構成されている抽出 (.hyper) ファイルを直接開く場合、データソースページには 1 つの表が記載されます。

しかし、パッケージド データ ソース (.tdsx) ファイルまたはデータ ソース (.tdsx) ファイルを使用し、対応する抽出 (.hyper) ファイルと共に抽出を開く場合は、データ ソース ページには抽出を構成する 3 つの表すべてが表示されます。

フィルター

[フィルター] を使用して、フィルターを設定し、フィールドとその値に基づいて、抽出するデータ量を制限します。

集計

集計を使用すると、メジャーを集計できます。年や月などの指定した日付レベルに対して [日付のロールアップ] を選択することもできます。以下の例は選択できる各集計オプションでどのようにデータが抽出されるかを示しています。

 

元のデータ各レコードは別々の行として表示されます。データには 7 行が含まれます。
表示可能なディメンションのデータの集計

(ロールアップなし)

同じ日付と地域のレコードが 1 行に集計されています。抽出には 5 行が含まれます。
表示可能なディメンションのデータの集計
(日付を月にロールアップ)
日付は月レベルにロールアップされ、同じ地域のレコードが 1 行に集計されています。抽出には 3 行が含まれます。

行数

すべての行または上位 N 行を抽出できます。Tableau では、最初にフィルターと集計が適用され、次にフィルターおよび集計の結果から指定の行数が抽出されます。行数のオプションは、抽出元のデータ ソースのタイプによって異なります。一部のデータ ソースではサンプリングがサポートされていないため、[データの抽出] ダイアログ ボックスに [サンプリング] オプションが表示されない場合があります。

注: [データ ソース] ページまたはシート タブで最初に非表示にしたフィールドはすべて抽出から除外されます。非表示のフィールドを抽出から削除するには、[使用していないフィールドをすべて非表示] ボタンをクリックします。

増分更新

ほとんどのデータ ソースで増分更新がサポートされています。抽出全体を更新する代わりに、前回データを抽出して以降の新しい行のみを追加するように抽出を構成することができます。

たとえば、新しい販売トランザクションで毎日更新されるデータ ソースがあるとします。その場合、抽出全体を毎日再構築する代わりに、その日に発生した新しいトランザクションのみを追加できます。

増分更新と詳細設定に関するヒント

このセクションでは、これらの機能を設定するときに発生する可能性のあるエラーを防ぐためのヒントについて説明します。

増分更新:

  • [行数] では、[すべての行] を選択する必要があります。

  • 集計を有効にしている場合、増分更新は使用できません。

詳細設定:

  • 詳細設定はフィルターと互換性がありません。

抽出に関するヒント

抽出への接続を維持するためワークブックを保存する

抽出を作成した後、ワークブックはデータの抽出されたバージョンを使用し始めます。しかし、データの抽出バージョンへの接続は、ワークブックを保存するまで保存されません。つまり、ワークブックを閉じる前に保存しなかった場合、次回そのワークブックを開いたときは元のデータ ソースに接続されます。

サンプリングされたデータと抽出全体を切り替える

大規模な抽出を扱う場合は、データの小さいサンプルを作成すると役立つ場合があります。これにより、分析にフィールドを追加するたびに長いクエリを実行することなく、ビューを設定できます。[データ] メニューで適切なオプションを選択することで、サンプル データと完全なデータ ソースの使用を簡単に切り替えることができます。

抽出に直接接続しない

抽出をコンピューターに保存すると、新しい Tableau Desktop を使用して抽出に直接接続できます。ただし、これは、以下のいくつかの理由で推奨されていません。

テーブルの名前が異なる場合がある

抽出では、各テーブルに一意の名前を付けるために特別な命名方法が使用されますが、これは理解しにくい場合があります。

抽出を更新またはリフレッシュすることはできない

抽出に直接接続すると、Tableau は抽出を、コピーではなく、元のデータ ソースとみなします。これは、元のデータ ソースにリンクし直すことができないことを意味します。

テーブル間の構造と関係が失われる

テーブル間の配置と接続は、.hyper ファイルではなく、.tds ファイルに保存されます。したがって、.hyper ファイルに直接接続すると、この情報が失われます。抽出に論理テーブル ストレージを使用する場合、元の物理テーブルへの参照は表示されません。

ワークブックから抽出を削除する

[データ] メニューで抽出データ ソースを選択し、[抽出][削除] の順に選択すると、いつでも抽出を削除できます。抽出を削除するときは、[ワークブックからのみ抽出を削除する] または [抽出ファイルを削除する] のいずれかから選択できます。後者を選択すると、抽出がハード ドライブから削除されます。

抽出履歴の参照 (Tableau Desktop)

[データ] メニューでデータ ソースを選択し、[抽出] > [履歴] を選択すると、抽出の最終更新日時やその他の詳細を表示できます。

抽出と共に保存されたワークブックを開いたときに Tableau が抽出を見つけられない場合は、[Extract Not Found (抽出が見つかりません)] ダイアログ ボックスで要求されたときに次のオプションの 1 つを選択してください。

  • 抽出の検索: 抽出が、Tableau が最初に保存した以外の場所に存在する場合、このオプションを選択します。[OK] をクリックすると、[ファイルを開く] ダイアログ ボックスが開き、そこから抽出ファイル用に新しい場所を指定できます。

  • 抽出の削除: 抽出が必要なくなった場合はこのオプションを選択します。これはデータ ソースの終了に相当します。そのデータ ソースを参照する、開いているすべてのワークシートは削除されます。

  • 抽出の無効化: 抽出が作成された元のデータ ソースを抽出の代わりに使用します。

  • 抽出の再生成: 抽出を再度作成します。抽出を最初に作成したときに指定したすべてのフィルターとその他のカスタマイズが自動的に適用されます。

抽出のトラブルシューティング

  • 抽出の作成に時間がかかる: データ セットのサイズによっては、データの抽出に時間がかかる場合があります。ただし、データを抽出してコンピューターに保存すると、パフォーマンスが向上します。

  • 抽出が作成されない: データ セットに多数 (数千単位) の列が含まれている場合、Tableau は、抽出を作成できない場合があります。問題が発生した場合は、抽出する列の数を減らすか、元となるデータの再構築を検討してください。

  • [保存] ダイアログが表示されない、または抽出が .twbx から作成されない: この前の手順に従ってパッケージ化されたワークブックからデータを抽出した場合、[保存] ダイアログは表示されません。パッケージ化されたワークブック (.twbx) から抽出が作成されると、抽出ファイルはパッケージド ワークブックに関連付られたファイルのパッケージに自動的に保存されます。パッケージ化されたワークブックから作成した抽出ファイルにアクセスするには、ワークブックをアンパッケージする必要があります。詳細については、パッケージド ワークブックを参照してください。

抽出の機能更新

日付範囲 (サブ範囲)

バージョン 2024.2 以降の Tableau では、増分更新のサブ範囲更新という新しい機能が追加されました。この機能により、ユーザーは抽出を更新するための最小の日付範囲を指定できます。たとえば、ユーザーは更新日から過去 14 日間のデータを更新することを選択できます。この機能を利用することで、ユーザーは抽出の更新を高速化し、不要な完全抽出に関連するコストを節約できます。

増分更新

バージョン 2024.1 以降の Tableau には、ユーザーが非一意のキー列を使用して抽出に対して増分更新を実行できる機能が導入されています。これらの詳細設定に対応した新しい UI があります。

この更新では、プロセスに追加のステップが導入されています。Tableau では、増分更新中に、以前に記録された最大値に一致する行が抽出から削除されます。その後、以前の最大値以上の値を持つすべての行がクエリされます。このアプローチにより、削除された行と新しく追加された行が確実に考慮されるようになります。

Web 内の抽出

バージョン 2020.4 以降では、抽出は Web 作成とコンテンツ サーバーで使用できます。これにより、Tableau Desktop を使用してデータ ソースを抽出する必要がなくなりました。詳細については、「Web 上での抽出の作成」を参照してください。

論理テーブルと物理テーブルの抽出

バージョン 2020.2 で Tableau データ モデルに論理テーブルと物理テーブルが導入された結果、抽出ストレージ オプションが [単一テーブル] と [複数テーブル] から [論理テーブル] と [物理テーブル] に変更されました。これらのオプションでは、抽出の格納方法がより詳しく説明されています。詳細については、データの抽出を参照してください。

.tde 形式の非推奨化

注: 2023 年 3 月以降、Tableau Cloud、Tableau Public、Tableau Server (バージョン 2023.1.0) では、.tde 形式を使用する抽出は非推奨になりました。バージョン 2024.2 は、.tde 形式のファイルを開くことができる最後のバージョンです。詳細については、「.hyper 形式への抽出のアップグレード」を参照してください。

バージョン 10.5 以降、抽出を作成するときに新しい .hyper 形式が使用されます。.hyper 形式の抽出では、大規模データ セットでより迅速な分析およびクエリ パフォーマンスをサポートする、改善されたデータ エンジンを活用します。

同様に、バージョン 10.5 以降を使用して抽出関連タスクが .tde の抽出ファイルに実行されると、その抽出は .hyper 抽出に更新されます。.tde 抽出が .hyper 抽出に更新された後は、.tde 抽出に戻すことはできません。詳細については、.hyper 形式への抽出のアップグレードを参照してください。

ビュー内の値とマークの変更

抽出の効率とスケーラビリティを改善するために、バージョン 10.4 以前と比較してバージョン 10.5 以降では抽出の値を異なる方法で計算できます。値の計算方法を変更すると、ビューのマークを入力する方法に影響を与えます。一部の稀なケースでは、この変更によって、ビューの形状の変化や空白化を引き起こすことがあります。これらの変更は、複数接続データ ソース、ライブ接続をファイルベースのデータに使用するデータ ソース、Google スプレッドシートのデータに接続するデータ ソース、クラウドベースのデータ ソース、抽出のみのデータ ソース、WDC データ ソースにも適用できます。

バージョン 2022.4 を使用してビューで現れる可能性のあるいくつかの違いを把握するには、以降のセクションを参考にしてください。

日付と日時の値の書式

バージョン 10.5 以降では、DATE、DATETIME、DATEPARSE 関数を使用して日付文字列がどのように解釈されるかについて、抽出がより一貫した厳密なルールに従います。これにより、日付の解析方法、またはこれらの関数で許可される日付形式やパターンに影響が出ます。具体的には、ルールは次のように一般化できます。

  1. 日付が評価され、行ではなく列ごとに解析される。
  2. 日付が評価され、ワークブックを開いているコンピューターのロケールではなく、ワークブックが作成された場所のロケールに基づいて解析が行われる。

これらの新しいルールによって、抽出がより効率化され、商用データベースと調和した結果を生成できます。

これらのルールの結果として、特に、ワークブックを開いているロケールまたはワークブックがパブリッシュされるサーバーとは異なるロケールでワークブックが作成される国際的なシナリオでは、1.) 日付値と日付時刻値の別の日付値および日付時刻値への変化、または 2.) 日付値と日付時刻値の NULL への変化を目にすることがあります。日付値と日付時刻値を別の日付値および日付時刻値へ変更したり、日付値が NULL になったりする場合は、参照元データに問題があることを示している可能性が高いです。

バージョン 10.5 以降を使用した抽出データ ソースで日付値および日付時刻値に変化が見られるのには、いくつかの共通の理由があります。

日付値/日付時刻値に変化が見られる一般的な理由

NULL 値に対する一般的な理由

  • 関数を使用して、単一列内で複数の日付形式を解決する必要がある場合。日付があいまいでいくつかの異なる方法で解釈できる場合、日付は Tableau がその列に対して決定する形式に基づいて解釈されます。一部の例については、以下の日付のシナリオ 1 および日付のシナリオ 2 を参照してください。
  • 関数で YYYY-MM-DD (ISO) 形式を解析する必要がある場合。たとえば、日付のシナリオ 3を参照してください。
  • 関数に時間を算出するための十分な情報がない場合。時間、分、秒、ミリ秒に "0" を使用して、値を "00:00:00.0" で解釈できます。
  • 関数に日付を算出するための十分な情報がない場合。月に対する値を "1" または "January"で解釈できます。
  • 関数が年を解析するとき、次のように解釈します。
    • "07" は "2007" と解釈できます。
    • "17" は "2017" と解釈できます。
    • "30" は "2030" と解釈できます。
    • "69" は "2069" と解釈できます。
    • "70" は "1970" と解釈できます。
  • 関数を使用して、単一列内で複数の日付形式を解決する必要がある場合。Tableau で日付形式を決定したら、その形式から外れる列のその他すべての日付が NULL 値になります。一部の例については、以下の日付のシナリオ 1 および日付のシナリオ 2 を参照してください。
  • 関数で YYYY-MM-DD (ISO) 形式を解析する必要がある場合。"YYYY"、"MM"、または "DD" で許可されている値を超過する値のために NULL 値となる場合。たとえば、日付のシナリオ 3を参照してください。
  • 関数で、末尾の文字を含む日付値を解析する必要がある場合。たとえば、タイム ゾーンや夏時間を表すサフィックス、および "midnight" などのキーワードによって NULL 値になる可能性があります。
  • 関数で無効な日付や時刻を解析する必要がある場合。たとえば、32/3/2012 によって NULL 値になる可能性があります。他にも、25:01:61 は NULL 値の原因となります。
  • 関数で矛盾する入力値を解析する必要がある場合。たとえば、パターンが 'dd.MM (MMMM) y' で入力文字列が '1.09 (August) 2017' ("9" と "August" は月) の場合が想定されます。月の値が一致しないため、結果は NULL 値となります。
  • 関数で矛盾するパターンを解析する必要がある場合。たとえば、グレゴリオ暦 (y) と ISO 週 (ww) を混在させて指定したパターンでは NULL 値となります。
日付のシナリオ 1

英語のロケールで .tde 抽出データ ソースを使用するワークブックを作成したとします。以下の表は、抽出データ ソースに含まれている文字列データの列を示しています。

10/31/2018
31/10/2018

12/10/2018

特定の英語のロケールに基づいて、日付列の書式は MDY (月、日、年) 書式に従うように決められていました。次の表は、DATE 関数を使用して文字列値を日付値に変換する場合に、このロケールに基づいて Tableau で表示される内容を示しています。

October 31, 2018
October 31, 2018
December 10, 2018

抽出がドイツ語のロケールで開かれると、次のように表示されます。

31 Oktober 2018
31 Oktober 2018
12 Oktober 2018

ただし、抽出をバージョン 10.5 以降を使用してドイツのロケールで開くと、ドイツのロケールの DMY (日、月、年) 書式が厳密に適用され、値のうちの 1 つが DMY 書式に従っていないため NULL 値となります。

Null
October 31, 2018
October 12, 2018
日付のシナリオ 2

英語のロケールで .tde 抽出データ ソースを使用する別のワークブックを作成したとします。以下の表は、抽出データ ソースに含まれている日付数値データの列を示しています。

1112018
1212018
1312018
1412018

特定の英語のロケールに基づいて、日付列の書式は MDY (月、日、年) 書式に従うように決められていました。次の表は、DATE 関数を使用して数値を日付値に変換する場合のこのロケールに基づいて Tableau で表示される内容を示しています。

11/1/2018
12/1/2018
Null
Null
日付のシナリオ 3

.tde 抽出データ ソースを使用するワークブックを作成したとします。以下の表は、抽出データ ソースに含まれている文字列データの列を示しています。

2018-10-31
2018-31-10

2018-12-10

2018-10-12

この日付は ISO 形式を使用するため、日付列は常に YYYY-MM-DD 形式に従います。次の表は、DATE 関数を使用して文字列値を日付値に変換する場合に、Tableau で表示される内容を示しています。

October 10, 2018
Null
December 10, 2018
October 12, 2018

注: バージョン 10.4 (およびそれ以前) で、ISO 形式とその他の日付形式では、ワークブックの作成場所のロケールによって結果が異なることがあります。たとえば、英語ロケールでは、2018-12-10 と 2018/12/10 はいずれも December 12, 2018 となります。ですが、ドイツ語ロケールでは 2018-12-10 は December 12, 2018 となり、2018/12/10 は October 12, 2018 となることがあります。

並べ替え順序と大文字/小文字の区別

抽出が照合順序に対応しているため、アクセントや大文字小文字が異なる文字列値をより適切に並べ替えることができます。

たとえば、文字列値の表があるとします。並べ替え順序に関しては、Égypte などの文字列値が、今では適切に Estonie の後で、Fidji の前に一覧されるようになっています。

Excel データについて 

ケーシングに関して、ここでは、Tableau での値の保存方法がバージョン 10.4 (およびそれ以前) とバージョン 10.5 (およびそれ以降) で変わったことを意味しています。ただし、値の並べ替えおよび比較に関するルールに変更はありません。バージョン 10.4 (およびそれ以前) では、"House"、"HOUSE"、"houSe" のような文字列値が同一と見なされ、1 つの代表的な値で保存されます。バージョン 10.5 (およびそれ以降) では、これらの文字列値が一意と見なされ、個別の値として保存されます。詳細については、値の計算方法の変更を参照してください。

上位 N 個のクエリで同数を破棄する

抽出時に上位 N 個のクエリの特定のランク位置に重複する値が生成された場合、バージョン 10.5 以降を使用すると同数を破棄する位置を変更できます。たとえば、上位 3 個のフィルターを作成するとします。3、4、5 番目の値が同じです。バージョン 10.4 以前では、上位フィルターで 1、2、3 番目の値を返すことができました。しかし、バージョン 10.5 以降を使用すると、上位フィルターで 1、2、5 番目の値を返すようになります。

浮動小数点値の精度

抽出は、コンピューターの使用可能なハードウェア リソースをより効率的に利用するため、高度な並列方式で数学的演算を実行できます。このため、.hyper 抽出では実数を異なる順序で集計できます。数値が異なる順序で集計されると、ビューでは、集計が完了するたびに小数点の後に異なる値が表示される場合があります。これは、浮動小数点の加算と乗算が必ずしも結合的ではないためです。つまり、(a + b) + c は必ずしも a + (b + c) と同じではありません。また、浮動小数点乗算は必ずしも配分的ではないため、実数が異なる順序で集計されることがあります。つまり、(a x b) x c は必ずしも a x b x c と同じではありません。.hyper 抽出のこのタイプの浮動小数点丸め動作は、商用データベースの浮動小数点丸め動作に類似しています。

たとえば、ワークブックに浮動小数点値で構成される集計フィールドのスライダー フィルターが含まれているとします。浮動小数点値の精度は変化するため、フィルターではフィルターの範囲の上限または下限を定義するマークが除外されるようになりました。これらの数値が欠落している部分は、空白で表示されます。この問題を解決するには、フィルターでスライダーを移動するか、フィルターを削除して再度追加します。

集計の精度

抽出は、コンピューターの使用可能なハードウェア リソースを利用することでサイズの大きいデータセットを最適化するため、高度な並列方式で集計を計算できます。このため、.hyper 抽出によって実行される集計は、統計計算に特化したソフトウェアからの結果より、商用データベースからの結果に類似している場合があります。サイズの小さいデータ セットで作業している場合、または高度な精度が必要な場合は、リファレンス ライン、サマリー カード統計、または分散、標準偏差、相関、母共分散などの表計算関数を介して集計を実行することを検討してください。

抽出の [今すぐ計算] オプションについて

以前のバージョンの Tableau Desktop を使用している .tde 抽出で [今すぐ計算] オプションが使用された場合は、特定の計算フィールドがマテリアライズされているため、事前に計算されてから抽出に保存されています。抽出を .tde 抽出から .hyper 抽出にアップグレードすると、以前に抽出でマテリアライズされた計算は含まれません。もう一度 [今すぐ計算] オプションを使用して、マテリアライズされた計算がアップグレード後の抽出に含まれていることを確認する必要があります。詳細については、抽出での計算のマテリアライズを参照してください。

新しい抽出 API

抽出 API 2.0 を使用して .hyper 抽出を作成できます。抽出のパブリッシュなど、これまで Tableau SDK を使用して実行していたタスクでは、Tableau Server REST API または Tableau Server クライアント ライブラリ (Python) を使用できます。更新タスクでも Tableau Server REST API を使用できます。詳細については、Tableau Hyper APIを参照してください。

フィードバックをお送りいただき、ありがとうございます。フィードバックは正常に送信されました。ありがとうございます!