Aanvullende functies
REGEXP_REPLACE(tekenreeks, patroon, vervanging)
Retourneert een kopie van de opgegeven tekenreeks waarin het patroon van de reguliere expressie wordt vervangen door de vervangende tekenreeks. Deze functie is alleen beschikbaar voor tekstbestanden, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moeten het patroon en de vervanging constanten zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'
REGEXP_MATCH(tekenreeks, patroon)
Retourneert 'waar' als een subtekenreeks van de opgegeven tekenreeks overeenkomt met het patroon van de reguliere expressie. Deze functie is beschikbaar voor tekstbestanden, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Impala 2.3.0 (via Cloudera Hadoop-databronnen), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true
REGEXP_EXTRACT(tekenreeks, patroon)
Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. Deze functie is alleen beschikbaar voor tekstbestanden, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'
REGEXP_EXTRACT_NTH(tekenreeks, patroon, index)
Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. De subtekenreeks wordt afgestemd met de nde groep voor vastleggen, waarbij n de opgegeven index is. Als index 0 is, wordt de volledige tekenreeks geretourneerd. Deze functie is beschikbaar voor tekstbestanden, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger) en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'
Specifieke functies voor Hadoop Hive
Opmerking: alleen de functies PARSE_URL en PARSE_URL_QUERY zijn beschikbaar voor Cloudera Impala-databronnen.
GET_JSON_OBJECT(JSON-tekenreeks, JSON-pad)
Retourneert het JSON-object binnen de JSON-tekenreeks op basis van het JSON-pad.
PARSE_URL(tekenreeks, url_gedeelte)
Retourneert een component van de opgegeven URL-tekenreeks waarbij het component wordt gedefinieerd door url_onderdeel. Geldige url_onderdeel-waarden omvatten: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' en 'USERINFO'.
Voorbeeld
PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'
PARSE_URL_QUERY(tekenreeks, sleutel)
Retourneert de waarde van de opgegeven queryparameter in de opgegeven URL-tekenreeks. De queryparameter wordt gedefinieerd door de sleutel.
Voorbeeld
PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'
XPATH_BOOLEAN(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert 'waar' als de XPath-expressie overeenstemt met een knooppunt of als de uitkomst ervan waar is.
Voorbeeld
XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true
XPATH_DOUBLE(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de waarde met zwevende komma van de XPath-expressie.
Voorbeeld
XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5
XPATH_FLOAT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de waarde met zwevende komma van de XPath-expressie.
Voorbeeld
XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5
XPATH_INT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_LONG(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_SHORT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_STRING(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de tekst van het eerste overeenkomende knooppunt.
Voorbeeld
XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'
Specifieke functies voor Google BigQuery
DOMAIN(tekenreeks_url)
Retourneert het domein van een opgegeven URL als tekenreeks.
Voorbeeld
DOMAIN('http://www.google.com:80/index.html') = 'google.com'
GROUP_CONCAT(expressie)
Voegt waarden uit elk record samen in één door komma's gescheiden tekenreeks. Deze functie werkt als een SUM() voor tekenreeksen.
Voorbeeld
GROUP_CONCAT(Region) = "Central,East,West"
HOST(tekenreeks_url)
Retourneert voor een opgegeven URL-tekenreeks de hostnaam als tekenreeks.
Voorbeeld
HOST('http://www.google.com:80/index.html') = 'www.google.com:80'
LOG2(getal)
Retourneert de logaritmebasis 2 van een getal.
Voorbeeld
LOG2(16) = '4.00'
LTRIM_THIS(tekenreeks, tekenreeks)
Retourneert de eerste tekenreeks met eventuele voorloop van de tweede tekenreeks verwijderd.
Voorbeeld
LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'
RTRIM_THIS(tekenreeks, tekenreeks)
Retourneert de eerste tekenreeks met eventuele naloop van de tweede tekenreeks verwijderd.
Voorbeeld
RTRIM_THIS('[-Market-]','-]') = '[-Market'
TIMESTAMP_TO_USEC(expressie)
Converteert een TIMESTAMP-datatype naar een UNIX-tijdstempel in microseconden.
Voorbeeld
TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000
USEC_TO_TIMESTAMP(expressie)
Converteert een UNIX-tijdstempel in microseconden naar een TIMESTAMP-datatype.
Voorbeeld
USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#
TLD(tekenreeks_url)
Retourneert voor een opgegeven URL-tekenreeks het domein van het hoogste niveau plus een landdomein in de URL.
Voorbeeld
TLD('http://www.google.com:80/index.html') = '.com'
TLD('http://www.google.co.uk:80/index.html') = '.co.uk'