Web 上での抽出の作成
Web でデータ ソースを抽出して (Tableau Desktop を使用せずに)、データ ソースのパフォーマンスを向上させたり、追加の分析機能をサポートしたりできます。データ ソースを抽出すると、Tableau は、データをリモート データ ストアから Tableau Server または Tableau Cloud にコピーします。データを抽出するメリットの詳細については、「データの抽出」を参照してください。Web では、Web 作成またはコンテンツ サーバーで抽出を実行できます。
Web 作成で抽出を作成する
既定の抽出設定を使用して、Web 作成で抽出を直接作成できます。
Web 作成で埋め込みデータ ソースを抽出する
Web 作成で抽出を作成するには、次の手順を実行します。
ヒント: 抽出を作成する前にデータ モデルを確定することをお勧めします。抽出の作成には時間がかかる場合があり、新しい論理テーブルの追加など、データ モデルに変更を加えると、抽出が無効になります。
- Web 作成ペインの左下隅にある [データ ソース] タブを選択します。新しいワークブックの場合は、[データ ソース] タブから開始します。
- 右上隅で、接続タイプを [ライブ] から [抽出] に変更します。
- [抽出の作成] を選択します。[抽出を作成] ダイアログ ボックスが表示されます。
抽出の作成には時間がかかる場合があり、抽出の作成中に作成セッションを終了できます。抽出の作成が失われないようにするには、ダイアログ ボックスで [完了時に通知する] を選択して、抽出したワークブックを保存する場所を指定します。抽出が成功すると、ワークブックは指定した場所に保存され、Web 作成セッションを続行できることが通知されます。
抽出の作成に失敗した場合は、抽出を作成できなかったことが通知されるので、Web 作成で元のワークブックをもう一度開いて、保存されていない変更を復元できます。
抽出設定を定義する
次のいずれか 1 つまたは複数のオプションを設定すると、Tableau での保存方法、フィルター定義、および抽出のデータ量制限を設定できます。
抽出データの保存方法を決定する
2 つの構造 (スキーマ)、つまり論理テーブル (非正規化されたスキーマ) または物理テーブル (正規化されたスキーマ) のいずれかを使用し、Tableau でデータを抽出に保存させることもできます。論理および物理テーブルの詳細については、「Tableauデータ モデル」を参照してください。選択するオプションは、目的に応じて異なります。
論理テーブル
論理テーブルは、データ ソース内の各論理テーブルに対して 1 つの抽出テーブルを使用してデータを格納します。論理テーブルを定義する物理テーブルは、その論理テーブルとマージされて保管されます。たとえば、データソースが 1 つの論理テーブルで構成されている場合、データは 1 つのテーブルに格納されます。
データ ソースが 3 つの論理テーブル (それぞれに複数の物理テーブルを含む) で構成されている場合、抽出データは 3 つのテーブル (論理テーブルごとに 1 つずつ) に格納されます。
抽出フィルター、集計、上位 N、または非正規化データを必要とするその他の機能などの追加の抽出プロパティを使用して、抽出内のデータの量を制限したい場合は論理テーブルを選択します。また、データがパススルー関数 (RAWSQL) を使用する場合にも使用します。抽出データの保存に Tableau ではこの構造が既定で使用されます。
抽出に結合が含まれるときにこのオプションを使用する場合は、抽出の作成時に結合が適用されます。
物理テーブル
物理テーブルは、データ ソース内の各物理テーブルに対して 1 つの抽出テーブルを使用してデータを格納します。
抽出が 1 つまたは複数の等価結合と組み合わされたテーブルで構成されており、以下の物理テーブル オプションを使用する条件を満たす場合は、[物理テーブル] を選択します。このオプションを使用する場合、結合はクエリ時に実行されます。
このオプションにより、パフォーマンスが向上し、抽出ファイルのサイズが小さくなる可能性があります。Tableau が推奨する物理テーブル オプションの使用については、「物理テーブル オプションを使用する際のヒント」を参照してください。
このオプションは、行レベルのセキュリティの回避策として使用できる場合もあります。Tableau を使用した行レベルのセキュリティに関する詳細は、Tableau Desktop ヘルプの「データ行レベルでのアクセスの制限」を参照してください。
物理テーブル オプションを使用する条件
物理テーブルオプションを使用する抽出を保存するには、抽出に含まれるデータが以下の条件すべてを満たしている必要があります。
- 物理テーブルの結合がすべて等価 (=) 結合である
- 関係または結合に使用される列のデータ型は同一である
- パススルー関数 (RAWSQL) が使用されていない
- 増分更新が構成されていない
- 抽出フィルターが構成されていない
- 上位 N やサンプリングが構成されていない
- 抽出が物理テーブルとして保存される場合、抽出にデータを追加することはできない
- 論理テーブルでは、複数の論理テーブルが含まれる抽出にデータを追加することはできない。
注: [論理テーブル] オプションと [物理テーブル] オプションのどちらも、抽出のデータの保存方法にしか影響しません。このオプションを使用しても、[データ ソース] ページでの抽出の表の表示方法には影響しません。
抽出するデータの量を決定する
[追加] を選択して 1 つまたは複数のフィルターを定義し、フィールドとその値に基づいて、抽出するデータ量を制限します。
抽出のデータを集計する
[表示可能なディメンションのデータの集計] を選択し、既定の集計を使用してメジャーを集計します。データの集計により、行を統合し、抽出ファイルのサイズを最小限に抑え、パフォーマンスを向上させることができます。
データの集計を選択する場合、年、月などの指定した日付レベルに [日付のロールアップ] を選択することもできます。次の例は、選択できる各集計オプションでどのようにデータが抽出されるかを示します。
元のデータ 各レコードは別々の行として表示されます。データには 7 行が含まれます。 表示可能なディメンションのデータの集計 (ロールアップなし)
同じ日付と地域のレコードが 1 行に集計されています。抽出には 5 行が含まれます。 表示可能なディメンションのデータの集計
(日付を月にロールアップ)日付は月レベルにロールアップされ、同じ地域のレコードが 1 行に集計されています。抽出には 3 行が含まれます。 サンプリングをサポートしていないデータ ソースもあります。そのため、[データの抽出] ダイアログ ボックスに [サンプリング] オプションが 表示されない場合があります。
[データ ソース] ページまたはシート タブで最初に非表示にしたフィールドはすべて抽出から除外されます。
抽出する行を選択する
抽出する行数を選択します。
すべての行または上位 N 行を抽出できます。Tableau では、最初にフィルターと集計が適用され、次にフィルターおよび集計の結果から指定の行数が抽出されます。行数のオプションは、抽出元のデータ ソースのタイプによって異なります。
注:
増分更新設定の構成
ほとんどのデータ ソースで増分更新がサポートされています。抽出全体を更新する代わりに、前回データを抽出して以降の新しい行のみを追加するように抽出を構成することができます。
たとえば、新しい販売トランザクションで毎日更新されるデータ ソースがあるとします。その場合、抽出全体を毎日再構築する代わりに、その日に発生した新しいトランザクションのみを追加できます。更新をスケジュールするときにオプションとして増分を使用するには、まず設定を定義する必要があります。
定期的に完全更新を行い、最新のデータを維持することをお勧めします。
注: ソース データのデータ構造が変更された場合 (たとえば、新しい列が追加された場合)、増分更新を再び開始する前に、完全な抽出更新を実行する必要があります。
増分更新を設定する
[増分更新] ボックスを選択します。
更新するテーブルを選択します。
新しい行を識別するために使用する列を選択します。
[更新する最小日付範囲] にサブ日付範囲を入力します。このフィールドでは、日、時間、分、秒単位で特定の時間範囲を選択できます。
以下のステップに従って、抽出を段階的に更新するように設定します。その際、抽出する行の数として [すべての行] を選択していることを確認してください。
増分更新は、データベースのすべての行を抽出する場合にのみ定義できます。サンプル抽出は増分できません。
たとえば、Tableau で日付または日付時間の列を選択すると、更新日から 14 日間など、指定された期間内の抽出データを更新できます。この機能は、定義された期間内に挿入や遡及的な変更を許可するデータ ソースで役立ちます。増分抽出更新を使用することで、ユーザーはこれらの変更を新しいデータとともに効率的にキャプチャできます。
パブリッシュされたデータソースを参照する埋め込みデータ ソースの抽出を作成することはできません。回避策として、パブリッシュされたデータソースに直接抽出を作成します。詳細については、「コンテンツ サーバーでパブリッシュされたデータ ソースを抽出する」を参照してください。
ファイルベースのデータ ソースの抽出を作成することはできません。ファイルベースのデータソースには既に特別なパフォーマンス機能があり、抽出を追加してもパフォーマンス上の利点はありません。
この機能は、Tableau Cloud のブリッジベースのデータ ソースには適用されません。
カスタム SQL の制限: カスタム SQL クエリは詳細設定ではサポートされていません。カスタム SQL に依存しているユーザーが増分更新に詳細設定を使用したい場合は、アプローチを調整する必要があります。
詳細設定を使用する
[詳細設定] を展開すると、新しい行を取得する方法を設定できます。
注: 更新する最小日付範囲を設定している場合は、詳細設定機能を利用できません。
[詳細設定] を使用すると、最後に記録された値以上の値を更新することによって最後に追加された行を置き換えたり、最後に記録された値よりも大きい値を含む抽出のみを更新することによって最後に追加された行を保持したりすることができます。
最初のアプローチでは、ユーザーは [日付]、[日時]、[ID] などの一意でないキー列を使用して抽出を段階的に更新することができます。
このメソッドでは、増分更新を実行するときに新しいステップが追加されます。Tableau はまず、抽出結果の行の中から、前に表示された最高値と等しい行を削除します。次に、前に表示された最高値以上のすべての行をクエリし、削除されたすべての行と新しい行をすべて取得します。
逆に、最後に追加された行を置き換えずに、最後に記録された値より大きい値を持つ行だけを追加することもできます。
終了するには、[抽出の作成] を選択します。
増分更新を実行する際の考慮事項
抽出の編集:
既存の抽出を編集する場合は、前回の更新が表示されるため、正しいデータで抽出を更新していることを確認できます。
完全更新:
完全更新では、抽出を更新するたびに、すべての行が元のデータ ソースのデータに置き換えられます。完全更新には時間がかかるため、データベースにかかるコストが高くなる可能性があります。
データ エンジン:
データ エンジンは、Tableau が抽出を作成するために使用する基本的なメカニズムであり、時刻値を小数点以下 3 桁までの精度で保存します。
[列を利用して新しい行を識別] に日時またはタイムスタンプ列を指定し、データベースが Tableau よりも高い精度を使用している場合は、増分更新の後に行が重複する場合があります。
たとえば、データベースに日時の値として 2015-03-13 17:30:56.502352 と 2015-03-13 17:30:56.502852 という 2 つの行がある場合、Tableau は 2015-03-13 17:30:56.502 という値で両方の行を保存するため、重複行が作成されます。
制限事項
コンテンツ サーバーで抽出を作成する
コンテンツ サーバーでパブリッシュされたデータ ソースを抽出する
パブリッシュされたデータ ソースを抽出するには、次の手順を実行します。
- 管理者またはデータ ソースの所有者としてサインインします。
- [コンテンツ] タブで [探索] を選択し、[データ ソース ] を選択します。
- データ ソース名をクリックして、データ ソースを選択します。
- 画面上部の [データ ソース名] の下で、[ライブ] というドロップダウン メニューを選択します。
- 接続タイプを [ライブ] から [抽出]に変更します。 サイトで保存時の抽出の暗号化機能が有効になっている場合は、[暗号化] または [暗号化なし]を選択します。
- 埋め込みの認証資格情報に関するエラー メッセージが表示された場合は、認証資格情報をデータ ソースに埋め込みます。これを行うには、[接続の編集] を選択します。[接続の埋め込みパスワード] を選択し、[保存] を選択します。
コンテンツ サーバーで埋め込みデータ ソースを抽出する
パブリッシュされたワークブックに埋め込まれている 1 つまたは複数のデータ ソースを抽出するには、次の手順を実行します。
- 管理者またはデータ ソースの所有者としてサインインします。
- パブリッシュされたワークブックに移動します。
- データ ソース タブに移動します。
- 1 つ以上のデータ ソースを選択します。
- [アクション] ボタンを選択します。
- [抽出] を選択します。サイトで保存時の抽出の暗号化機能が有効になっている場合は、[暗号化] または [暗号化なし]を選択します。
制限事項
- 接続認証資格情報は、データ ソースに埋め込む必要があります。
- パブリッシュされたデータソースを参照する埋め込みデータ ソースの抽出を作成することはできません。回避策として、パブリッシュされたデータソースに直接抽出を作成します。
- ファイルベースのデータ ソースの抽出を作成することはできません。ファイルベースのデータソースには既に特別なパフォーマンス機能があり、抽出を追加してもパフォーマンス上の利点はありません。
- この機能は、Tableau Cloud のブリッジベースのデータ ソースには適用されません。
抽出されたデータを最新に保つ
データを抽出した後、必要に応じて抽出更新スケジュールを設定して、データを最新に保つことができます。詳細については、定期的なデータ更新を参照してください。
抽出の監視と管理
サーバー管理者は、[抽出でのバックグラウンド タスクク] 管理ビューで抽出の作成を監視できます。詳細については、抽出でのバックグラウンド タスクを参照してください。
サーバー管理者は、[ジョブ] ページで抽出を管理できます。詳細については、Tableau Server でのバックグラウンド ジョブの管理を参照してください。
抽出の作成ジョブ (抽出更新ジョブなど) には、タイムアウトする前の最大クエリ制限があります。これは、ジョブが永久に実行され、無制限のサーバー リソースを使用することを防ぐためです。抽出クエリ制限のタイムアウトは、サーバー管理者が TSM コマンドライン インターフェイスの構成設定 backgrounder.querylimit
を使用して設定できます。詳細については、tsm configuration set のオプションを参照してください。
サーバー管理者は、Web 作成を管理できます。詳細については、サイトの Web 作成アクセスと機能の設定を参照してください。