抽出の更新

元のデータが変更された場合、[データ] メニューでデータ ソースを選択し、[抽出][更新] を選択すると、Desktop を使用して抽出を更新できます。抽出は、完全更新と増分更新の 2 つの方法で設定できます。

完全更新では、抽出内のすべてのデータが元のデータ ソースの最新情報に置き換えられます。増分更新では、最後の更新以降の新しい行のみが追加されます。データを抽出する方法の詳細については、データの抽出のページをご覧ください。

注: Tableau データ抽出コマンド ライン ユーティリティを使用して、抽出の更新を自動化することもできます。詳細については、Tableau データ抽出コマンド ライン ユーティリティを参照してください。

抽出を更新する前に

抽出を更新したい場合、抽出の更新を実行する前に抽出のファイル形式をメモに取っておきます。バージョン 2022.4 を使用して .tde 抽出の更新を実行した場合、その抽出は自動的に .hyper 抽出にアップグレードされます。.hyper 抽出へのアップグレードには多くの利点がありますが、以前のバージョンの Tableau Desktop では抽出を開けなくなります。詳細については、.hyper 形式への抽出のアップグレードを参照してください。

抽出の完全更新を構成する

既定では、抽出は完全に更新されるよう構成されています。これは、抽出を更新するたびに、参照元データ ソース内のデータによってすべての行が置換されることを意味します。この種の更新は、元のデータに入っているものとまったく同じ複製を所持できるようにしますが、抽出のサイズによっては、完全抽出に長い時間がかかり、データベース上でのコストが高くなる場合があります。抽出で増分抽出に構成されていない場合、抽出の更新を選択すると、抽出の完全更新が実行されます。

Tableau Server へのパブリッシュ

抽出をデータ ソースとして Tableau Server にパブリッシュする予定の場合、パブリッシュ中に抽出更新のスケジュールを指定できます。

同様に、ワークブックの抽出を Tableau Server にパブリッシュする場合でも、パブリッシュ中に抽出更新にスケジュールを指定できます。詳細については、ワークブックをパブリッシュする際に抽出の更新をスケジュールするを参照してください。

Tableau Cloud へのパブリッシュ

抽出をデータ ソースとして Tableau Cloud にパブリッシュする予定の場合、データの更新オプションはデータ ソースの特徴によって決まります。特定のデータ ソースのデータの更新に関する詳細については、「データ ソース別の抽出更新オプション」を参照してください。

抽出の増分更新を構成する

ほとんどのデータ ソースで増分更新がサポートされています。抽出全体を更新する代わりに、前回データを抽出して以降の新しい行のみを追加するように抽出を構成することができます。

たとえば、新しい販売トランザクションで毎日更新されるデータ ソースがあるとします。その場合、抽出全体を毎日再構築する代わりに、その日に発生した新しいトランザクションのみを追加できます。そして、念のため完全更新を週 1 回実行し、最新データが確実に手元に残るようにすることもできます。

バージョン 2024.1 以降の Tableau には、ユーザーが非一意のキー列を使用して抽出に対して増分更新を実行できる機能が導入されています。この更新では、プロセスに追加のステップが導入されています。Tableau では、増分更新中に、以前に記録された最大値に一致する行が抽出から削除されます。その後、以前の最大値以上の値を持つすべての行がクエリされます。このアプローチにより、削除された行と新しく追加された行が確実に考慮されるようになります。

詳細設定機能には、データ更新を管理するための 2 つのオプションが用意されています。最後に記録された値以上の値を更新することで、最後に追加された行を置き換えることができます。または、最後に記録された値より大きい値で抽出を更新するだけで、最後に追加された行を保持することができます。詳細については、「抽出の増分更新を構成する」を参照してください。

注: ソース データのデータ構造が変更された場合 (たとえば、新しい列が追加された場合)、増分更新を再び開始する前に、完全な抽出更新を実行する必要があります。

抽出が増分更新されるように設定するには、次の手順を行います。

  1. [データ] メニューでデータ ソースを選択し、[データの抽出] を選択します。

  2. [データの抽出] ダイアログ ボックスで、抽出する行の数として [すべての行] を選択します。増分更新は、データベースのすべての行を抽出する場合にのみ定義できます。

    注: サンプル抽出は増分できません。

  3. [増分更新] を選択します。

  4. 注: 集計を有効にしている場合、増分更新は使用できません。

  5. 新しい行の識別に使用するデータベース内の列を指定します。

    たとえば、データベースに行が追加されるにしたがって単調に増える日付フィールドや ID 列を選択できます。

  6. [詳細設定] を展開して、新しい行を取得する方法を設定します。最後に記録された値以上の値を更新することで、最後に追加された行を置き換えることができます。または、最後に記録された値より大きい値で抽出を更新するだけで、最後に追加された行を保持することができます。

  7. 逆に、最後に追加された行を置き換えずに、最後に記録された値より大きい値を持つ行だけを追加することもできます。

    注: フィルターを追加すると、増分更新の [詳細設定] がグレー表示され、「最後に追加された行を置き換えない」という既定の設定が適用されます。その目的は、特定のフィルター条件と、「最後に追加された行を置き換える」高度な増分更新ロジックとの間で発生する可能性のある競合を回避することです。

  8. 終了するには、[設定の保存] を選択します。

上記の手順は、増分更新のための新しい抽出の定義または既存の抽出の編集に使用できます。

増分更新を実行する際の考慮事項

抽出の編集

既存の抽出を編集する場合は、前回の更新が表示されるため、正しいデータで抽出が更新されていることを確認できます。

完全更新

完全更新では、抽出を更新するたびに、すべての行が元のデータ ソースのデータに置き換えられます。完全更新には時間がかかるため、データベースにかかるコストが高くなる可能性があります。

データ エンジン

データ エンジンは、Tableau が抽出を作成するために使用する基本的なメカニズムであり、時刻値を小数点以下 3 桁までの精度で保存します。[列を利用して新しい行を識別] に日時またはタイムスタンプ列を指定し、データベースが Tableau よりも高い精度を使用している場合は、増分更新の後に行が重複する場合があります。たとえば、データベースに日時の値として 2015-03-13 17:30:56.5023522015-03-13 17:30:56.502852 という 2 つの行がある場合、Tableau は 2015-03-13 17:30:56.502 という一時の値で両方の行を保存するので、重複行が作成されます。

抽出履歴の参照 (Tableau Desktop)

[データ] メニューでデータ ソースを選択し、[抽出] > [履歴] を選択すると、抽出の更新履歴を表示できます。

[抽出履歴] ダイアログ ボックスには、各更新の日付と時刻、完全更新と増分更新の区別、追加された行数が表示されます。更新がファイルから行われた場合は、ソース ファイル名も表示されます。

フィードバックをありがとうございます。フィードバックは正常に送信されました。ありがとうございます!