Zusätzliche Funktionen

REGEXP_REPLACE(Zeichenfolge, Muster, Ersetzung)

Gibt eine Kopie einer angegebenen Zeichenfolge zurück, wobei das reguläre Ausdrucksmuster durch die Ersetzungszeichenfolge ersetzt wird. Diese Funktion ist für Textdatei-, Hadoop Hive-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Snowflake- und Oracle-Datenquellen verfügbar.

Für Tableau-Datenextrakte müssen das Muster und der Ersatz Konstanten sein.

Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards von ICU (International Components for Unicode) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.

Beispiel

REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'

 

REGEXP_MATCH(Zeichenfolge, Muster)

Gibt "true" zurück, wenn eine Unterzeichenfolge der angegebenen Zeichenfolge mit dem regulären Ausdrucksmuster übereinstimmt. Diese Funktion ist für Textdatei-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Impala 2.3.0- (über Cloudera Hadoop-Datenquellen), Snowflake- und Oracle-Datenquellen verfügbar.

Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.

Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards von ICU (International Components for Unicode) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.

Beispiel

REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true

REGEXP_EXTRACT(Zeichenfolge, Muster)

Gibt die Teilmenge der Zeichenfolge zurück, die mit dem regulären Ausdrucksmuster übereinstimmt. Diese Funktion ist für Textdatei-, Hadoop Hive-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Snowflake- und Oracle-Datenquellen verfügbar.

Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.

Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards von ICU (International Components for Unicode) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.

Beispiel

REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'

REGEXP_EXTRACT_NTH(Zeichenfolge, Muster, Index)

Gibt die Teilmenge der Zeichenfolge zurück, die mit dem regulären Ausdrucksmuster übereinstimmt. Die Unterzeichenfolge wird der n-ten Erfassungsgruppe zugeordnet, wobei n dem angegebenen Index entspricht. Wenn der Index "0" lautet, wird die gesamte Zeichenfolge zurückgegeben. Diese Funktion ist für Textdatei-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1) und Oracle-Datenquellen verfügbar.

Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.

Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards von ICU (International Components for Unicode) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.

Beispiel

REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'

Hadoop Hive-spezifische Funktionen

Hinweis: Nur die Funktionen PARSE_URL und PARSE_URL_QUERY stehen für Cloudera Impala-Datenquellen zur Verfügung.

GET_JSON_OBJECT(JSON-Zeichenfolge, JSON-Pfad)

Gibt das JSON-Objekt innerhalb der JSON-Zeichenfolge basierend auf dem JSON-Pfad zurück.

 

PARSE_URL(Zeichenfolge, url_part)

Gibt eine Komponente der angegebenen URL zurück, wobei die Komponente durch url_part definiert ist. Gültige url_part-Werte beinhalten Folgendes: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' und 'USERINFO'.

Beispiel

PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'

 

PARSE_URL_QUERY(Zeichenfolge, Schlüssel)

Gibt den Wert des angegebenen Abfrageparameters in der angegebenen URL-Zeichenfolge zurück. Der Abfrageparameter ist durch den Schlüssel definiert.

Beispiel

PARSE_URL_QUERY('http://www.tableau.com?page=1cat=4', 'page') = '1'

 

 

XPATH_BOOLEAN(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt "true" zurück, wenn der XPath-Ausdruck mit einem Knoten übereinstimmt oder als "true" evaluiert wird.

Beispiel

XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5") = true

 

XPATH_DOUBLE(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den Gleitkommawert des XPath-Ausdrucks zurück.

Beispiel

XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5

 

XPATH_FLOAT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den Gleitkommawert des XPath-Ausdrucks zurück.

Beispiel

XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5

 

XATH_INT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.

Beispiel

XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

 

XPATH_LONG(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.

Beispiel

XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

 

XPATH_SHORT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.

Beispiel

XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_STRING(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)

Gibt den Text des ersten übereinstimmenden Knotens zurück.

Beispiel

XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'

 

Google BigQuery-spezifische Funktionen

DOMAIN(Zeichenfolgen_URL)

Gibt im Fall einer URL-Zeichenfolge die Domäne als Zeichenfolge zurück.

Beispiel

DOMAIN('http://www.google.com:80/index.html') = 'google.com'

 

GROUP_CONCAT(Ausdruck)

Verkettet Werte aus den einzelnen Datensätzen zu einer einzelnen, durch Komma getrennten Zeichenfolge. Diese Funktion entspricht etwa der Funktion SUM() für Zeichenfolgen.

Beispiel

GROUP_CONCAT(Region) = "Central,East,West"

 

HOST(Zeichenfolgen_URL)

Gibt im Fall einer URL-Zeichenfolge den Hostnamen als Zeichenfolge zurück.

Beispiel

HOST('http://www.google.com:80/index.html') = 'www.google.com:80'

 

LOG2(Zahl)

Gibt den Logarithmus zur Basis 2 einer Zahl zurück.

Beispiel

LOG2(16) = '4.00'

 

LTRIM_THIS(Zeichnenfolge, Zeichenfolge)

Gibt die erste Zeichenfolge zurück und entfernt dabei alle vorangestellten Vorkommen der zweiten Zeichenfolge.

Beispiel

LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'

 

RTRIM_THIS(Zeichenfolge, Zeichenfolge)

Gibt die erste Zeichenfolge zurück und entfernt dabei alle nachgestellten Vorkommen der zweiten Zeichenfolge.

Beispiel

RTRIM_THIS('[-Market-]','-]') = '[-Market'

 

TIMESTAMP_TO_USEC(Ausdruck)

Konvertiert innerhalb von Mikrosekunden einen TIMESTAMP-Datentyp in einen UNIX-Zeitstempel.

Beispiel

TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000

 

USEC_TO_TIMESTAMP(Ausdruck)

Konvertiert einen UNIX-Zeitstempel innerhalb von Mikrosekunden in einen TIMESTAMP-Datentyp.

Beispiel

USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#

 

TLD(Zeichenfolgen_URL)

Gibt im Fall einer URL-Zeichenfolge die Domäne der obersten Ebene sowie eine beliebige Länderdomäne in der URL zurück.

Beispiel

TLD('http://www.google.com:80/index.html') = '.com'

 

TLD('http://www.google.co.uk:80/index.html') = '.co.uk'

 

Vielen Dank für Ihr Feedback!