その他の関数詳細については、
正規表現
REGEXP_REPLACE
| 構文 | REGEXP_REPLACE(string, pattern, replacement) |
| 出力 | 文字列 |
| 定義 | 正規表現のパターンが置換文字列に置き換えられている特定の文字列のコピーを返します。 |
| 例 | REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123' |
| 注 | この関数はテキスト ファイル、Hadoop Hive、Google BigQuery、PostgreSQL、Tableau Data Extract、Microsoft Excel、Salesforce、Vertica、Pivotal Greenplum、Teradata (バージョン 14.1 以上)、Snowflake、および Oracle データ ソースで利用できます。 Tableau データ抽出では、パターンおよび置換を定数にする必要があります。 正規表現の構文の詳細については、お使いのデータ ソースのドキュメントを参照してください。Tableau 抽出の場合、正規表現の構文は ICU 規格 (Unicode の国際的なコンポーネント)、Unicode サポートのための成熟した C/C++ ライブラリと Java ライブラリのオープン ソース プロジェクト、ソフトウェアの国際化、およびソフトウェアのグローバル化に準拠しています。オンラインの ICU ユーザー ガイドの「正規表現」(新しいウィンドウでリンクが開く)のページを参照してください。 |
REGEXP_MATCH
| 構文 | REGEXP_MATCH(string, pattern) |
| 出力 | ブール値 |
| 定義 | 指定した文字列のサブストリングが正規表現パターンに一致した場合に true を返します。 |
| 例 | REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true |
| 注 | この関数はテキスト ファイル、Google BigQuery、PostgreSQL、Tableau Data Extract、Microsoft Excel、Salesforce、Vertica、Pivotal Greenplum、Teradata (バージョン 14.1 以降)、Impala 2.3.0 (Cloudera Hadoop データ ソースを介して)、Snowflake、および Oracle データ ソースで利用できます。 Tableau データ抽出では、パターンを定数にする必要があります。 正規表現の構文の詳細については、お使いのデータ ソースのドキュメントを参照してください。Tableau 抽出の場合、正規表現の構文は ICU 規格 (Unicode の国際的なコンポーネント)、Unicode サポートのための成熟した C/C++ ライブラリと Java ライブラリのオープン ソース プロジェクト、ソフトウェアの国際化、およびソフトウェアのグローバル化に準拠しています。オンラインの ICU ユーザー ガイドの「正規表現」(新しいウィンドウでリンクが開く)のページを参照してください。 |
REGEXP_EXTRACT
| 構文 | REGEXP_EXTRACT(string, pattern) |
| 出力 | 文字列 |
| 定義 | 正規表現のパターンと一致する文字列の一部を返します。 |
| 例 | REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123' |
| 注 | この関数はテキスト ファイル、Hadoop Hive、Google BigQuery、PostgreSQL、Tableau Data Extract、Microsoft Excel、Salesforce、Vertica、Pivotal Greenplum、Teradata (バージョン 14.1 以上)、Snowflake、および Oracle データ ソースで利用できます。 Tableau データ抽出では、パターンを定数にする必要があります。 正規表現の構文の詳細については、お使いのデータ ソースのドキュメントを参照してください。Tableau 抽出の場合、正規表現の構文は ICU 規格 (Unicode の国際的なコンポーネント)、Unicode サポートのための成熟した C/C++ ライブラリと Java ライブラリのオープン ソース プロジェクト、ソフトウェアの国際化、およびソフトウェアのグローバル化に準拠しています。オンラインの ICU ユーザー ガイドの「正規表現」(新しいウィンドウでリンクが開く)のページを参照してください。 |
REGEXP_EXTRACT_NTH
| 構文 | REGEXP_EXTRACT_NTH(string, pattern, index) |
| 出力 | 文字列 |
| 定義 | 正規表現のパターンと一致する文字列の一部を返します。部分文字列は n 番目 (n は指定されたインデックス) のキャプチャリング グループと照合されます。index が 0 の場合、文字列全体が返されます。 |
| 例 | REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123' |
| 注 | この関数は、テキスト ファイル、PostgreSQL、Tableau Data Extract、Microsoft Excel、Salesforce、Vertica、Pivotal Greenplum、Teradata (バージョン 14.1 以降)、および Oracle データ ソースで利用できます。 Tableau データ抽出では、パターンを定数にする必要があります。 正規表現の構文の詳細については、お使いのデータ ソースのドキュメントを参照してください。Tableau 抽出の場合、正規表現の構文は ICU 規格 (Unicode の国際的なコンポーネント)、Unicode サポートのための成熟した C/C++ ライブラリと Java ライブラリのオープン ソース プロジェクト、ソフトウェアの国際化、およびソフトウェアのグローバル化に準拠しています。オンラインの ICU ユーザー ガイドの「正規表現」(新しいウィンドウでリンクが開く)のページを参照してください。 |
Hadoop Hive 固有の関数
注: PARSE_URL および PARSE_URL_QUERY 関数は、Cloudera Impala データ ソースにのみ対応しています。
GET_JSON_OBJECT(JSON string, JSON path)
JSON パスに基づいた JSON 文字列内の JSON オブジェクトを返します。
PARSE_URL(string, url_part)
コンポーネントが url_part で定義されている特定の URL 文字列のコンポーネントを返します。有効な url_part の値は、'HOST'、'PATH'、'QUERY'、'REF'、'PROTOCOL'、'AUTHORITY'、'FILE'、'USERINFO' などです。
例
PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'
PARSE_URL_QUERY(string, key)
特定の URL 文字列内にある指定したクエリ パラメーターの値を返します。クエリ パラメーターはキーで定義されます。
例
PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'
XPATH_BOOLEAN(XML string, XPath expression string)
XPath 式がノードに一致した場合、または true に評価された場合に true を返します。
例
XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true
XPATH_DOUBLE(XML string, XPath expression string)
XPath 式の浮動小数点値を返します。
例
XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5
XPATH_FLOAT(XML string, XPath expression string)
XPath 式の浮動小数点値を返します。
例
XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5
XPATH_INT(XML string, XPath expression string)
XPath 式の数値を返します。または、XPath 式が数字に評価できない場合はゼロを返します。
例
XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_LONG(XML string, XPath expression string)
XPath 式の数値を返します。または、XPath 式が数字に評価できない場合はゼロを返します。
例
XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_SHORT(XML string, XPath expression string)
XPath 式の数値を返します。または、XPath 式が数字に評価できない場合はゼロを返します。
例
XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_STRING(XML string, XPath expression string)
最初に一致したノードのテキストを返します。
例
XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'
Google BigQuery 固有の関数
DOMAIN(string_url)
URL 文字列が指定された場合に、ドメインを文字列として返します。
例
DOMAIN('http://www.google.com:80/index.html') = 'google.com'
GROUP_CONCAT(expression)
各レコードの値をコンマで区切られた 1 つの文字列に連結します。この機能は、文字列に対して SUM() を実行するのと同じです。
例
GROUP_CONCAT(Region) = "Central,East,West"
HOST(string_url)
URL 文字列が指定された場合に、ホスト名を文字列として返します。
例
HOST('http://www.google.com:80/index.html') = 'www.google.com:80'
LOG2(number)
数値の対数 (底 2) を返します。
例
LOG2(16) = '4.00'
LTRIM_THIS(string, string)
最初の string から、2 つ目の string を先頭から削除した文字列を返します。
例
LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'
RTRIM_THIS(string, string)
最初の string から、2 つ目の string を末尾から削除した文字列を返します。
例
RTRIM_THIS('[-Market-]','-]') = '[-Market'
TIMESTAMP_TO_USEC(expression)
TIMESTAMP データ型を UNIX タイムスタンプ (ミリ秒単位) に変換します。
例
TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000
USEC_TO_TIMESTAMP(expression)
UNIX タイムスタンプ (ミリ秒単位) を TIMESTAMP データ型に変換します。
例
USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#
TLD(string_url)
URL 文字列が指定された場合に、URL 内のトップ レベル ドメインと国ドメイン (ある場合) を返します。
例
TLD('http://www.google.com:80/index.html') = '.com'
TLD('http://www.google.co.uk:80/index.html') = '.co.uk'
