抽出の更新

元のデータが変更された場合、[データ] メニューでデータ ソースを選択し、[抽出][更新] を選択すると、Desktop を使用して抽出を更新できます。抽出は、完全更新と増分更新の 2 つの方法で設定できます。

完全更新では、抽出内のすべてのデータが元のデータ ソースの最新情報に置き換えられます。増分更新には、2 つのバリエーションがあります。1 つは、前回の更新以降の新しい行のみを追加し、もう 1 つは、更新日から更新までの期間を定義します。オプションの 2 番目のアプローチは、データ ソース内で既に抽出されたデータが変更されている可能性がある場合に、抽出を更新する必要があるときに適用できます。データを抽出する方法の詳細については、「データの抽出」を参照してください。

注: Tableau データ抽出コマンド ライン ユーティリティを使用して、抽出の更新を自動化することもできます。

抽出を更新する前に

抽出を更新したい場合、抽出の更新を実行する前に抽出のファイル形式をメモに取っておきます。バージョン 2022.4 以降を使用して .tde 抽出の更新を実行した場合、その抽出は .hyper 抽出に自動的にアップグレードされます。.hyper 抽出へのアップグレードには多くの利点がありますが、以前のバージョンの Tableau Desktop では抽出を開けなくなります。詳細については、.hyper 形式への抽出のアップグレードを参照してください。

: .tde ファイルは、Tableau バージョン 2024.2 を最後にどのような形式でもサポートされなくなり、使用するには .hyper 形式にアップグレードする必要があります。

抽出の完全更新を構成する

既定では、抽出は完全に更新されるよう構成されています。これは、抽出を更新するたびに、参照元データ ソース内のデータによってすべての行が置換されることを意味します。この種の更新は、元のデータに入っているものとまったく同じ複製を所持できるようにしますが、抽出のサイズによっては、完全抽出に長い時間がかかり、データベース上でのコストが高くなる場合があります。抽出が増分抽出に設定されていない場合、抽出の更新を選択すると、抽出の完全更新が実行されます。

Tableau Server へのパブリッシュ

抽出をデータ ソースとして Tableau Server にパブリッシュする予定の場合、パブリッシュ中に抽出更新のスケジュールを指定できます。

データの更新をスケジュールするためのダイアログ ボックス。

同様に、ワークブック内の抽出を Tableau Server にパブリッシュする場合でも、パブリッシュ中に抽出更新のスケジュールを指定できます。詳細については、ワークブックをパブリッシュする際に抽出の更新をスケジュールするを参照してください。

Tableau Cloud へのパブリッシュ

抽出をデータ ソースとして Tableau Cloud にパブリッシュする予定の場合、データの更新オプションはデータ ソースの特徴によって決まります。特定のデータ ソースのデータの更新に関する詳細については、「データ ソース別の抽出更新オプション」を参照してください。

抽出の増分更新を構成する

ほとんどのデータ ソースで増分更新がサポートされています。抽出全体を更新する代わりに、前回データを抽出して以降の新しい行のみを追加するように抽出を構成することができます。

たとえば、新しい販売トランザクションで毎日更新されるデータ ソースがあるとします。その場合、抽出全体を毎日再構築する代わりに、その日に発生した新しいトランザクションのみを追加できます。そして、念のため完全更新を週 1 回実行し、最新データが確実に手元に残るようにすることもできます。

オプションで増分設定を構成して、時間のサブ範囲を定義し、既存の抽出からすべての関連データを削除して完全に更新することにより、その時間範囲内の最後の更新以降の変更や追加を取得することもできます。

一意でない列

バージョン 2024.1 以降の Tableau には、ユーザーが非一意のキー列を使用して抽出に対して増分更新を実行できる機能が導入されています。この更新では、プロセスに追加のステップが導入されています。

増分抽出のサブ範囲更新

Tableau バージョン 2024.2 以降では、追加の期間を指定して、以前に抽出したデータを再抽出し、発生した可能性のある変更をキャプチャできます。これは、[更新する最小日付範囲] フィールドで行うことができます。この機能は、(たとえば) 定義された期間内で挿入や遡及的な変更を行うことをデータ ソースが許可する場合に役立ちます。設定が完了すると、増分抽出によって、新しいデータに加えて、設定された時間範囲から以前に抽出されたデータが取得されます。

数値 (2 など) と期間 (月など) を選択すると、下にあるヘルパー テキストが更新され、選択内容が反映されます (「更新日から過去 2 か月間のデータが常に更新されます」)。時間範囲が入力されていない場合は、既存の抽出内容よりも新しいコンテンツのみが取得されます。

サブ範囲更新の理解

予定している抽出の更新頻度、データ ソースが更新される頻度、および各期間中に通常更新されるデータの量に基づいて、サブ範囲更新が最適に機能するように構成します。Tableau が抽出構成の選択をどのように解釈するかを理解して、抽出に期待どおりのデータが含まれるようにすることが重要です。

  • 複数の時間単位を入力すると、Tableau では、既存の時間単位からのすべてのデータに加えて、追加の X 単位分のデータを取得する必要があると解釈されます。たとえば、時間単位を 3 か月に設定すると、現在の月のすべてのデータに加えて、過去 3 か月分のデータが取得されます。現在の日付が 4 月 1 日の場合、4 月のすべてのデータ (この場合は 1 日) に加えて、1 月、2 月、3 月のすべてのデータ、つまり約 91 日分のデータが取得されます。4 月 28 日に同じ更新を実行すると、4 月の 28 日間のデータに加えて、その前の 3 か月間のデータ、つまり約 118 日分のデータが取得されます。
  • 最もきめ細かい制御と一貫性を実現するには、データに適した最小の適用可能な時間単位 (日など) を使用するのがベスト プラクティスです。過去 90 日間と更新日のデータを常に更新するには、数値として [90] を、期間として [日] を選択します。
  • レコードが入力された日付/時刻を反映する日付/時刻フィールドに基づいて抽出を行うことをお勧めします。抽出を決定するために使用されている日付フィールドに将来の日付 (「予定されている注文配送日」など) が含まれている場合、サブ範囲更新機能を使用した結果は期待どおりにならない可能性があります。たとえば、増分更新は、更新日から過去 2 か月分のデータを抽出するように設定されます。現在は 4 月 1 日ですが、データベースには、この日付フィールドに最大 6 か月後の 9 月 1 日までの値が含まれているレコードがあります。この例では、更新が発生すると、4 月 (現在の更新月) のデータとその前の 2 か月分のデータのみが抽出されます。4 月以降の将来の日付に関連付けられた行のデータ ソースに変更が発生した場合、それらの変更は更新されません。
  • 設定された期間よりも多くの新しいデータがデータ ソースで更新される場合、新しいデータが利用可能になった時点で追加データの取得が開始されます。たとえば、サブ範囲を過去 2 日間のみに設定したが、最後の更新が 10 日前に行われた場合、10 日間の新しいデータすべてに加えて、以前に抽出された 2 日間のデータが抽出されます。

注: ソース データのデータ構造が変更された場合 (たとえば、新しい列が追加された場合)、増分更新を再び開始する前に、抽出の完全更新を実行する必要があります。

次の手順に従って、抽出を増分更新するように設定するか、既存の完全抽出を編集して増分更新を行います。

  1. [データ] メニューでデータ ソースを選択し、[データの抽出] を選択します。

  2. [データの抽出] ダイアログ ボックスで、抽出する行の数として [すべての行] を選択します。増分更新は、データベースのすべての行を抽出する場合にのみ定義できます。

    注: サンプル抽出は増分できません。

  3. [増分更新] セクションを展開して、[増分更新] をオンにします。

  4. 注: 集計を有効にしている場合、増分更新は使用できません。

  5. 新しい行の識別に使用するデータベース内の列を指定します。

    たとえば、データベースに行が追加されるにしたがって単調に増える日付フィールドや ID 列を選択できます。

  6. (オプション) Tableau で日付または日時列を選択した場合は、特定の日付範囲を指定して抽出データの部分的な更新を実行できます。日数を決定し、日付/時刻スケールを指定して、更新の最小日付範囲を確立します (たとえば、更新日から 14 日間)。

  7. (オプション) 最小更新範囲が設定されていない場合は、[詳細設定] を展開して、新しい行を取得する方法を設定します。最後に記録された値以上の値を更新することによって、最後に追加された行を置き換えたり、最後に記録された値よりも大きい値を含む抽出のみを更新することによって、最後に追加された行を保持したりすることができます。

  8. 注: フィルターを追加すると、増分更新の [詳細設定] がグレー表示され、「最後に追加された行を置き換えない」という既定の設定が適用されます。その目的は、特定のフィルター条件と、「最後に追加された行を置き換える」高度な増分更新ロジックとの間で発生する可能性のある競合を回避することです。

  9. 終了するには、[設定の保存] を選択します。

抽出更新時の考慮事項

抽出の編集

既存の抽出を編集する場合は、前回の更新が表示されるため、正しいデータで抽出を更新していることを確認できます。

完全更新

完全更新では、抽出を更新するたびに、すべての行が元のデータ ソースのデータに置き換えられます。完全更新には時間がかかるため、データベースにかかるコストが高くなる可能性があります。

時刻/日付の精度と抽出

データ エンジンは、Tableau が抽出を作成するために使用する基本的なメカニズムであり、時刻値を小数点以下 3 桁までの精度で保存します。[列を利用して新しい行を識別] に日時またはタイムスタンプ列を指定し、データベースが Tableau よりも高い精度を使用している場合は、増分更新の後に行が重複する場合があります。たとえば、データベースに日時の値として 2015-03-13 17:30:56.5023522015-03-13 17:30:56.502852 という 2 つの行がある場合、Tableau は 2015-03-13 17:30:56.502 という一時の値で両方の行を保存するので、重複行が作成されます。

抽出履歴の参照 (Tableau Desktop)

[データ] メニューでデータ ソースを選択し、[抽出] > [履歴] を選択すると、抽出の更新履歴を表示できます。

[抽出履歴] ダイアログ ボックスには、各更新の日付と時刻、完全更新と増分更新の区別、追加された行数が表示されます。更新がファイルから行われた場合は、ソース ファイル名も表示されます。

履歴をクリアしたり、テーブルを閉じたりするオプションが含まれた [履歴の抽出] テーブル。