Zusätzliche Funktionen
REGEXP_REPLACE(Zeichenfolge, Muster, Ersetzung)
Gibt eine Kopie einer angegebenen Zeichenfolge zurück, wobei das reguläre Ausdrucksmuster durch die Ersetzungszeichenfolge ersetzt wird. Diese Funktion ist für Textdatei-, Hadoop Hive-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Snowflake- und Oracle-Datenquellen verfügbar.
Für Tableau-Datenextrakte müssen das Muster und der Ersatz Konstanten sein.
Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards der aktuellen International Components for Unicode (ICU) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.
Beispiel
REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'
REGEXP_MATCH(Zeichenfolge, Muster)
Gibt "true" zurück, wenn eine Unterzeichenfolge der angegebenen Zeichenfolge mit dem regulären Ausdrucksmuster übereinstimmt. Diese Funktion ist für Textdatei-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Impala 2.3.0- (über Cloudera Hadoop-Datenquellen), Snowflake- und Oracle-Datenquellen verfügbar.
Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.
Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards der aktuellen International Components for Unicode (ICU) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.
Beispiel
REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true
REGEXP_EXTRACT(Zeichenfolge, Muster)
Gibt die Teilmenge der Zeichenfolge zurück, die mit dem regulären Ausdrucksmuster übereinstimmt. Diese Funktion ist für Textdatei-, Hadoop Hive-, Google BigQuery-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1), Snowflake- und Oracle-Datenquellen verfügbar.
Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.
Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards der aktuellen International Components for Unicode (ICU) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.
Beispiel
REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'
REGEXP_EXTRACT_NTH(Zeichenfolge, Muster, Index)
Gibt die Teilmenge der Zeichenfolge zurück, die mit dem regulären Ausdrucksmuster übereinstimmt. Die Unterzeichenfolge wird der n-ten Erfassungsgruppe zugeordnet, wobei n dem angegebenen Index entspricht. Wenn der Index "0" lautet, wird die gesamte Zeichenfolge zurückgegeben. Diese Funktion ist für Textdatei-, PostgreSQL-, Tableau Data Extract-, Microsoft Excel-, Salesforce-, Vertica-, Pivotal Greenplum-, Teradata- (ab Version 14.1) und Oracle-Datenquellen verfügbar.
Für Tableau-Datumsextrakte muss das Muster eine Konstante sein.
Informationen über die Syntax regulärer Ausdrücke finden Sie in der Dokumentation zu Ihrer Datenquelle. Bei Tableau-Extrakten stimmt die Syntax regulärer Ausdrücke mit den Standards der aktuellen International Components for Unicode (ICU) überein. Hierbei handelt es sich um ein Open-Source-Projekt der ausgereiften C/C++- und Java-Bibliotheken für die Unicode-Unterstützung, die Softwareinternationalisierung und -globalisierung. Informationen finden Sie auf der Seite Reguläre Ausdrücke(Link wird in neuem Fenster geöffnet) im ICU-Onlinebenutzerhandbuch.
Beispiel
REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'
Hadoop Hive-spezifische Funktionen
Hinweis: Nur die Funktionen PARSE_URL und PARSE_URL_QUERY stehen für Cloudera Impala-Datenquellen zur Verfügung.
GET_JSON_OBJECT(JSON-Zeichenfolge, JSON-Pfad)
Gibt das JSON-Objekt innerhalb der JSON-Zeichenfolge basierend auf dem JSON-Pfad zurück.
PARSE_URL(Zeichenfolge, url_part)
Gibt eine Komponente der angegebenen URL zurück, wobei die Komponente durch url_part definiert ist. Gültige url_part-Werte beinhalten Folgendes: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' und 'USERINFO'.
Beispiel
PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'
PARSE_URL_QUERY(Zeichenfolge, Schlüssel)
Gibt den Wert des angegebenen Abfrageparameters in der angegebenen URL-Zeichenfolge zurück. Der Abfrageparameter ist durch den Schlüssel definiert.
Beispiel
PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'
XPATH_BOOLEAN(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt "true" zurück, wenn der XPath-Ausdruck mit einem Knoten übereinstimmt oder als "true" evaluiert wird.
Beispiel
XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true
XPATH_DOUBLE(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den Gleitkommawert des XPath-Ausdrucks zurück.
Beispiel
XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5
XPATH_FLOAT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den Gleitkommawert des XPath-Ausdrucks zurück.
Beispiel
XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5
XATH_INT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.
Beispiel
XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_LONG(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.
Beispiel
XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_SHORT(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den numerischen Wert des XPath-Ausdrucks oder null zurück, wenn der XPath-Ausdruck nicht als Zahl evaluiert werden kann.
Beispiel
XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_STRING(XML-Zeichenfolge, Zeichenfolge für XPath-Ausdruck)
Gibt den Text des ersten übereinstimmenden Knotens zurück.
Beispiel
XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'
Google BigQuery-spezifische Funktionen
DOMAIN(Zeichenfolgen_URL)
Gibt im Fall einer URL-Zeichenfolge die Domäne als Zeichenfolge zurück.
Beispiel
DOMAIN('http://www.google.com:80/index.html') = 'google.com'
GROUP_CONCAT(Ausdruck)
Verkettet Werte aus den einzelnen Datensätzen zu einer einzelnen, durch Komma getrennten Zeichenfolge. Diese Funktion entspricht etwa der Funktion SUM() für Zeichenfolgen.
Beispiel
GROUP_CONCAT(Region) = "Central,East,West"
HOST(Zeichenfolgen_URL)
Gibt im Fall einer URL-Zeichenfolge den Hostnamen als Zeichenfolge zurück.
Beispiel
HOST('http://www.google.com:80/index.html') = 'www.google.com:80'
LOG2(Zahl)
Gibt den Logarithmus zur Basis 2 einer Zahl zurück.
Beispiel
LOG2(16) = '4.00'
LTRIM_THIS(Zeichnenfolge, Zeichenfolge)
Gibt die erste Zeichenfolge zurück und entfernt dabei alle vorangestellten Vorkommen der zweiten Zeichenfolge.
Beispiel
LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'
RTRIM_THIS(Zeichenfolge, Zeichenfolge)
Gibt die erste Zeichenfolge zurück und entfernt dabei alle nachgestellten Vorkommen der zweiten Zeichenfolge.
Beispiel
RTRIM_THIS('[-Market-]','-]') = '[-Market'
TIMESTAMP_TO_USEC(Ausdruck)
Konvertiert innerhalb von Mikrosekunden einen TIMESTAMP-Datentyp in einen UNIX-Zeitstempel.
Beispiel
TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000
USEC_TO_TIMESTAMP(Ausdruck)
Konvertiert einen UNIX-Zeitstempel innerhalb von Mikrosekunden in einen TIMESTAMP-Datentyp.
Beispiel
USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#
TLD(Zeichenfolgen_URL)
Gibt im Fall einer URL-Zeichenfolge die Domäne der obersten Ebene sowie eine beliebige Länderdomäne in der URL zurück.
Beispiel
TLD('http://www.google.com:80/index.html') = '.com'
TLD('http://www.google.co.uk:80/index.html') = '.co.uk'