抽出の更新
元のデータが変更された場合、[データ] メニューでデータ ソースを選択し、 を選択すると、Desktop を使用して抽出を更新できます。抽出は、完全更新と増分更新の 2 つの方法で設定できます。
完全更新では、抽出内のすべてのデータが元のデータ ソースの最新情報に置き換えられます。増分更新では、最後の更新以降の新しい行のみが追加されます。データを抽出する方法の詳細については、データの抽出のページをご覧ください。
注: Tableau データ抽出コマンドライン ユーティリティを使用して、抽出の更新を自動化することもできます。詳細については、Tableau データ抽出コマンド ライン ユーティリティを参照してください。
抽出を更新する前に
抽出を更新したい場合、抽出の更新を実行する前に抽出のファイル形式をメモに取っておきます。バージョン 2022.4 を使用して .tde
抽出の更新を実行した場合、その抽出は自動的に .hyper
抽出にアップグレードされます。.hyper
抽出へのアップグレードには多くの利点がありますが、以前のバージョンの Tableau Desktop では抽出を開けなくなります。詳細については、.hyper 形式への抽出のアップグレードを参照してください。
注: .tde ファイルは、Tableau バージョン 2024.2 を最後にどのような形式でもサポートされなくなり、使用するには .hyper 形式にアップグレードする必要があります。
抽出の完全更新を構成する
既定では、抽出は完全に更新されるよう構成されています。これは、抽出を更新するたびに、参照元データ ソース内のデータによってすべての行が置換されることを意味します。この種の更新は、元のデータに入っているものとまったく同じ複製を所持できるようにしますが、抽出のサイズによっては、完全抽出に長い時間がかかり、データベース上でのコストが高くなる場合があります。抽出が増分抽出に設定されていない場合、抽出の更新を選択すると、抽出の完全更新が実行されます。
Tableau Server へのパブリッシュ
抽出をデータ ソースとして Tableau Server にパブリッシュする予定の場合、パブリッシュ中に抽出更新のスケジュールを指定できます。
同様に、ワークブック内の抽出を Tableau Server にパブリッシュする場合でも、パブリッシュ中に抽出更新のスケジュールを指定できます。詳細については、ワークブックをパブリッシュする際に抽出の更新をスケジュールするを参照してください。
Tableau Cloud へのパブリッシュ
抽出をデータ ソースとして Tableau Cloud にパブリッシュする予定の場合、データの更新オプションはデータ ソースの特徴によって決まります。特定のデータ ソースのデータの更新に関する詳細については、「データ ソース別の抽出更新オプション」を参照してください。
抽出の増分更新を構成する
ほとんどのデータ ソースで増分更新がサポートされています。抽出全体を更新する代わりに、前回データを抽出して以降の新しい行のみを追加するように抽出を構成することができます。
たとえば、新しい販売トランザクションで毎日更新されるデータ ソースがあるとします。その場合、抽出全体を毎日再構築する代わりに、その日に発生した新しいトランザクションのみを追加できます。そして、念のため完全更新を週 1 回実行し、最新データが確実に手元に残るようにすることもできます。
一意でない列
バージョン 2024.1 以降の Tableau には、ユーザーが非一意のキー列を使用して抽出に対して増分更新を実行できる機能が導入されています。この更新では、プロセスに追加のステップが導入されています。
日付範囲 (サブ範囲) の更新
バージョン 2024.2 以降の Tableau では、ユーザーがソースからデータを更新するための特定の時間範囲を指定できる新しい機能が導入されました。ユーザーは、抽出を設定するときに増分更新を選択し、更新の最小日付範囲を設定できます。たとえば、更新日から過去 14 日間のデータを更新することを選択できます。この機能は、定義された期間内に挿入や遡及的な変更を許可するデータ ソースに役立ち、増分抽出更新中に変更や新しいデータが確実にキャプチャされます。
「更新する最小日付範囲」が設定されていない適格な増分更新 (つまり、サブ範囲更新) では、Tableau は最初に、以前に記録された最高値と一致する抽出から行を削除します。その後、以前の最大値以上の値を持つすべての行がクエリされます。このアプローチにより、削除された行と新しく追加された行が確実に考慮されるようになります。
詳細設定機能には、データ更新を管理するための 2 つのオプションが用意されています。最後に記録された値以上の値を更新することで、最後に追加された行を置き換えることができます。または、最後に記録された値より大きい値で抽出を更新するだけで、最後に追加された行を保持することができます。
注: ソース データのデータ構造が変更された場合 (たとえば、新しい列が追加された場合)、増分更新を再び開始する前に、抽出の完全更新を実行する必要があります。
抽出が増分更新されるように設定するには、次の手順を行います。
[データ] メニューでデータ ソースを選択し、[データの抽出] を選択します。
[データの抽出] ダイアログ ボックスで、抽出する行の数として [すべての行] を選択します。増分更新は、データベースのすべての行を抽出する場合にのみ定義できます。
注: サンプル抽出は増分できません。
[増分更新] を選択します。
新しい行の識別に使用するデータベース内の列を指定します。
たとえば、データベースに行が追加されるにしたがって単調に増える日付フィールドや ID 列を選択できます。
(オプション) Tableau で日付または日時列を選択した場合は、特定の日付範囲を指定して抽出データの部分的な更新を実行できます。日数を決定し、日付/時刻スケールを指定して、更新の最小日付範囲を確立します (たとえば、更新日から 14 日間)。
(オプション) 最小更新範囲が設定されていない場合は、詳細設定を展開して、新しい行を取得する方法を設定します。最後に記録された値以上の値を更新することで、最後に追加された行を置き換えることができます。または、最後に記録された値より大きい値で抽出を更新するだけで、最後に追加された行を保持することができます。
終了するには、[設定の保存] を選択します。
注: 集計を有効にしている場合、増分更新は使用できません。
注: フィルターを追加すると、増分更新の [詳細設定] がグレー表示され、「最後に追加された行を置き換えない」という既定の設定が適用されます。その目的は、特定のフィルター条件と、「最後に追加された行を置き換える」高度な増分更新ロジックとの間で発生する可能性のある競合を回避することです。
以前の手順は、増分更新のための新しい抽出の定義または既存の抽出の編集に使用できます。
増分更新を実行する際の考慮事項
抽出の編集
既存の抽出を編集する場合は、前回の更新が表示されるため、正しいデータで抽出を更新していることを確認できます。
完全更新
完全更新では、抽出を更新するたびに、すべての行が元のデータ ソースのデータに置き換えられます。完全更新には時間がかかるため、データベースにかかるコストが高くなる可能性があります。
データ エンジン
データ エンジンは、Tableau が抽出を作成するために使用する基本的なメカニズムであり、時刻値を小数点以下 3 桁までの精度で保存します。[列を利用して新しい行を識別] に日時またはタイムスタンプ列を指定し、データベースが Tableau よりも高い精度を使用している場合は、増分更新の後に行が重複する場合があります。たとえば、データベースに日時の値として 2015-03-13 17:30:56.502352
と 2015-03-13 17:30:56.502852
という 2 つの行がある場合、Tableau は 2015-03-13 17:30:56.502
という一時の値で両方の行を保存するので、重複行が作成されます。
抽出履歴の参照 (Tableau Desktop)
[データ] メニューでデータ ソースを選択し、 を選択すると、抽出の更新履歴を表示できます。
[抽出履歴] ダイアログ ボックスには、各更新の日付と時刻、完全更新と増分更新の区別、追加された行数が表示されます。更新がファイルから行われた場合は、ソース ファイル名も表示されます。