Aanvullende functies
REGEXP_REPLACE(tekenreeks, patroon, vervanging)
Retourneert een kopie van de opgegeven tekenreeks waarin het patroon van de reguliere expressie wordt vervangen door de vervangende tekenreeks. Deze functie is alleen beschikbaar bij voor: tekstbestand, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extract, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moeten het patroon en de vervanging constanten zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'
REGEXP_MATCH(tekenreeks, patroon)
Retourneert waar als een subtekenreeks van de opgegeven tekenreeks overeenkomt met het patroon van de reguliere expressie. Deze functie is beschikbaar voor tekstbestanden, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Impala 2.3.0 (via Cloudera Hadoop-databronnen), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true
REGEXP_EXTRACT(tekenreeks, patroon)
Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. Deze functie is alleen beschikbaar bij voor: tekstbestand, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extract, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'
REGEXP_EXTRACT_NTH(tekenreeks, patroon, index)
Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. De subtekenreeks wordt afgestemd met de nde groep voor vastleggen, waarbij n de opgegeven index is. Als index 0 is, wordt de volledige tekenreeks geretourneerd. Deze functie is beschikbaar voor tekstbestanden, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger) en Oracle-databronnen.
Voor Tableau-data-extracten moet het patroon een constante zijn.
Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.
Voorbeeld
REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'
Specifieke functies voor Hadoop Hive
Opmerking: alleen de functies PARSE_URL en PARSE_URL_QUERY zijn beschikbaar voor Cloudera Impala-databronnen.
GET_JSON_OBJECT(JSON-tekenreeks, JSON-pad)
Retourneert het JSON-object binnen de JSON-tekenreeks op basis van het JSON-pad.
PARSE_URL(tekenreeks, url_gedeelte)
Retourneert een onderdeel van de opgegeven URL-tekenreeks waarbij het onderdeel wordt gedefinieerd door url_gedeelte. Geldige url_part-waarden omvatten: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' en 'USERINFO'.
Voorbeeld
PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'
PARSE_URL_QUERY(tekenreeks, sleutel)
Retourneert de waarde van de opgegeven queryparameter in de opgegeven URL-tekenreeks. De queryparameter wordt gedefinieerd door de sleutel.
Voorbeeld
PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'
XPATH_BOOLEAN(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert waar als de XPath-expressie overeenstemt met een knooppunt of als de uitkomst ervan waar is.
Voorbeeld
XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true
XPATH_DOUBLE(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de waarde met zwevende komma van de XPath-expressie.
Voorbeeld
XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5
XPATH_FLOAT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de waarde met zwevende komma van de XPath-expressie.
Voorbeeld
XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5
XPATH_INT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_LONG(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_SHORT(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.
Voorbeeld
XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6
XPATH_STRING(XML-tekenreeks, XPath-expressietekenreeks)
Retourneert de tekst van het eerste overeenkomende knooppunt.
Voorbeeld
XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'
Specifieke functies voor Google BigQuery
DOMAIN(tekenreeks_url)
Retourneert het domein van een opgegeven URL als tekenreeks.
Voorbeeld
DOMAIN('http://www.google.com:80/index.html') = 'google.com'
GROUP_CONCAT(expressie)
Voegt waarden uit elk record samen in één door komma's gescheiden tekenreeks. Deze functie werkt als een SUM() voor tekenreeksen.
Voorbeeld
GROUP_CONCAT(Region) = "Central,East,West"
HOST(tekenreeks_url)
Retourneert voor een opgegeven URL-tekenreeks de hostnaam als tekenreeks.
Voorbeeld
HOST('http://www.google.com:80/index.html') = 'www.google.com:80'
LOG2(getal)
Retourneert de logaritmebasis 2 van een getal.
Voorbeeld
LOG2(16) = '4.00'
LTRIM_THIS(tekenreeks, tekenreeks)
Retourneert de eerste tekenreeks met eventuele voorloop van de tweede tekenreeks verwijderd.
Voorbeeld
LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'
RTRIM_THIS(tekenreeks, tekenreeks)
Retourneert de eerste tekenreeks met eventuele naloop van de tweede tekenreeks verwijderd.
Voorbeeld
RTRIM_THIS('[-Market-]','-]') = '[-Market'
TIMESTAMP_TO_USEC(expressie)
Converteert een TIMESTAMP-datatype naar een UNIX-tijdstempel in microseconden.
Voorbeeld
TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000
USEC_TO_TIMESTAMP(expressie)
Converteert een UNIX-tijdstempel in microseconden naar een TIMESTAMP-datatype.
Voorbeeld
USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#
TLD(tekenreeks_url)
Retourneert voor een opgegeven URL-tekenreeks het domein van het hoogste niveau plus een landdomein in de URL.
Voorbeeld
TLD('http://www.google.com:80/index.html') = '.com'
TLD('http://www.google.co.uk:80/index.html') = '.co.uk'