추가 함수

REGEXP_REPLACE(string, pattern, replacement)

지정된 문자열의 정규식 패턴을 대체 문자열로 바꾸고 그 복사본을 반환합니다. 이 함수는 텍스트 파일, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau 데이터 추출, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata(버전 14.1 이상), Snowflake 및 Oracle 데이터 원본에 사용할 수 있습니다.

Tableau 데이터 추출의 경우 pattern과 replacement가 상수여야 합니다.

정규식 구문에 대한 자세한 내용은 데이터 원본 설명서를 참조하십시오. Tableau 추출의 정규식 구문은 유니코드 지원, 소프트웨어 국제화 및 소프트웨어 세계화를 위한 C/C++ 및 Java 라이브러리의 발전된 오픈 소스 프로젝트인 현재 ICU(International Components for Unicode) 표준을 준수합니다. 자세한 내용은 온라인 ICU 사용자 가이드에서 Regular Expressions(링크가 새 창에서 열림)(정규식) 페이지를 참조하십시오.

REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'

REGEXP_MATCH(string, pattern)

지정된 문자열의 부분 문자열이 정규식 패턴과 일치할 경우 true를 반환합니다. 이 함수는 텍스트 파일, Google BigQuery, PostgreSQL, Tableau 데이터 추출, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata(버전 14.1 이상), Impala 2.3.0(Cloudera Hadoop 데이터 원본을 통해), Snowflake 및 Oracle 데이터 원본에 사용할 수 있습니다.

Tableau 데이터 추출의 경우 패턴이 상수여야 합니다.

정규식 구문에 대한 자세한 내용은 데이터 원본 설명서를 참조하십시오. Tableau 추출의 정규식 구문은 유니코드 지원, 소프트웨어 국제화 및 소프트웨어 세계화를 위한 C/C++ 및 Java 라이브러리의 발전된 오픈 소스 프로젝트인 현재 ICU(International Components for Unicode) 표준을 준수합니다. 자세한 내용은 온라인 ICU 사용자 가이드에서 Regular Expressions(링크가 새 창에서 열림)(정규식) 페이지를 참조하십시오.

REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true

REGEXP_EXTRACT(string, pattern)

정규식 패턴과 일치하는 문자열 부분을 반환합니다. 이 함수는 텍스트 파일, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau 데이터 추출, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata(버전 14.1 이상), Snowflake 및 Oracle 데이터 원본에 사용할 수 있습니다.

Tableau 데이터 추출의 경우 패턴이 상수여야 합니다.

정규식 구문에 대한 자세한 내용은 데이터 원본 설명서를 참조하십시오. Tableau 추출의 정규식 구문은 유니코드 지원, 소프트웨어 국제화 및 소프트웨어 세계화를 위한 C/C++ 및 Java 라이브러리의 발전된 오픈 소스 프로젝트인 현재 ICU(International Components for Unicode) 표준을 준수합니다. 자세한 내용은 온라인 ICU 사용자 가이드에서 Regular Expressions(링크가 새 창에서 열림)(정규식) 페이지를 참조하십시오.

REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'

REGEXP_EXTRACT_NTH(string, pattern, index)

정규식 패턴과 일치하는 문자열 부분을 반환합니다. substring이 nth 캡처링 그룹과 일치합니다. 여기서 n은 해당 인덱스입니다. 인덱스가 0인 경우 전체 문자열이 반환됩니다. 이 함수는 텍스트 파일, PostgreSQL, Tableau 데이터 추출, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata(버전 14.1 이상) 및 Oracle 데이터 원본에 사용할 수 있습니다.

Tableau 데이터 추출의 경우 패턴이 상수여야 합니다.

정규식 구문에 대한 자세한 내용은 데이터 원본 설명서를 참조하십시오. Tableau 추출의 정규식 구문은 유니코드 지원, 소프트웨어 국제화 및 소프트웨어 세계화를 위한 C/C++ 및 Java 라이브러리의 발전된 오픈 소스 프로젝트인 현재 ICU(International Components for Unicode) 표준을 준수합니다. 자세한 내용은 온라인 ICU 사용자 가이드에서 Regular Expressions(링크가 새 창에서 열림)(정규식) 페이지를 참조하십시오.

REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'

Hadoop Hive 관련 함수

참고: Cloudera Impala 데이터 원본에는 PARSE_URL 및 PARSE_URL_QUERY 함수만 사용할 수 있습니다.

GET_JSON_OBJECT(JSON string, JSON path)

JSON 경로를 기반으로 JSON 문자열 내에 JSON 개체를 반환합니다.

PARSE_URL(string, url_part)

구성 요소가 url_part로 정의된 주어진 URL 문자열의 구성 요소를 반환합니다. 유효한 url_part 값:'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE', 'USERINFO'.

PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'

PARSE_URL_QUERY(string, key)

주어진 URL 문자열에 지정된 쿼리 매개 변수 값을 반환합니다. 쿼리 매개 변수는 키로 정의됩니다.

PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'

XPATH_BOOLEAN(XML string, XPath expression string)

XPath 식이 노드와 일치하거나 true로 평가될 경우 true를 반환합니다.

XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true

XPATH_DOUBLE(XML string, XPath expression string)

XPath 식의 부동 소수점 값을 반환합니다.

XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5

XPATH_FLOAT(XML string, XPath expression string)

XPath 식의 부동 소수점 값을 반환합니다.

XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5

XPATH_INT(XML string, XPath expression string)

XPath 식의 숫자 값 또는 0(XPath 식이 숫자로 연산될 수 없는 경우)을 반환합니다.

XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_LONG(XML string, XPath expression string)

XPath 식의 숫자 값 또는 0(XPath 식이 숫자로 연산될 수 없는 경우)을 반환합니다.

XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_SHORT(XML string, XPath expression string)

XPath 식의 숫자 값 또는 0(XPath 식이 숫자로 연산될 수 없는 경우)을 반환합니다.

XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_STRING(XML string, XPath expression string)

일치하는 첫 노드의 텍스트를 반환합니다.

XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'

Google BigQuery 관련 함수

DOMAIN(string_url)

주어진 URL 문자열에서 도메인을 문자열로 반환합니다.

DOMAIN('http://www.google.com:80/index.html') = 'google.com'

GROUP_CONCAT(expression)

각 레코드의 값을 쉼표로 구분된 단일 문자열로 연결합니다. 이 함수는 문자열의 SUM() 함수처럼 작동합니다.

GROUP_CONCAT(Region) = "Central,East,West"

HOST(string_url)

주어진 URL 문자열에서 호스트 이름을 문자열로 반환합니다.

HOST('http://www.google.com:80/index.html') = 'www.google.com:80'

LOG2(number)

숫자 로그 밑수 2를 반환합니다.

LOG2(16) = '4.00'

LTRIM_THIS(string, string)

두 번째 문자열의 선행 공백을 제거한 상태에서 첫 문자열을 반환합니다.

LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'

RTRIM_THIS(string, string)

두 번째 문자열의 후행 공백을 제거하고 첫 문자열을 반환합니다.

RTRIM_THIS('[-Market-]','-]') = '[-Market'

TIMESTAMP_TO_USEC(expression)

TIMESTAMP 데이터 유형을 마이크로초 단위의 UNIX 타임스탬프로 변환합니다.

TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000

USEC_TO_TIMESTAMP(expression)

마이크로초 단위의 UNIX 타임스탬프를 TIMESTAMP 데이터 유형으로 변환합니다.

USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#

TLD(string_url)

주어진 URL 문자열에서 URL에 최상위 수준의 도메인과 특정 국가 도메인을 반환합니다.

TLD('http://www.google.com:80/index.html') = '.com'

TLD('http://www.google.co.uk:80/index.html') = '.co.uk'

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!