Aanvullende functies

REGEXP_REPLACE(tekenreeks, patroon, vervanging)

Retourneert een kopie van de opgegeven tekenreeks waarin het patroon van de reguliere expressie wordt vervangen door de vervangende tekenreeks. Deze functie is alleen beschikbaar voor tekstbestanden, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moeten het patroon en de vervanging constanten zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'

REGEXP_MATCH(tekenreeks, patroon)

Retourneert 'waar' als een subtekenreeks van de opgegeven tekenreeks overeenkomt met het patroon van de reguliere expressie. Deze functie is beschikbaar voor tekstbestanden, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Impala 2.3.0 (via Cloudera Hadoop-databronnen), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true

REGEXP_EXTRACT(tekenreeks, patroon)

Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. Deze functie is alleen beschikbaar voor tekstbestanden, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'

REGEXP_EXTRACT_NTH(tekenreeks, patroon, index)

Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. De subtekenreeks wordt afgestemd met de nde groep voor vastleggen, waarbij n de opgegeven index is. Als index 0 is, wordt de volledige tekenreeks geretourneerd. Deze functie is beschikbaar voor tekstbestanden, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger) en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'

Specifieke functies voor Hadoop Hive

Opmerking: alleen de functies PARSE_URL en PARSE_URL_QUERY zijn beschikbaar voor Cloudera Impala-databronnen.

GET_JSON_OBJECT(JSON-tekenreeks, JSON-pad)

Retourneert het JSON-object binnen de JSON-tekenreeks op basis van het JSON-pad.

PARSE_URL(tekenreeks, url_gedeelte)

Retourneert een component van de opgegeven URL-tekenreeks waarbij het component wordt gedefinieerd door url_onderdeel. Geldige url_onderdeel-waarden omvatten: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' en 'USERINFO'.

Voorbeeld

PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'

PARSE_URL_QUERY(tekenreeks, sleutel)

Retourneert de waarde van de opgegeven queryparameter in de opgegeven URL-tekenreeks. De queryparameter wordt gedefinieerd door de sleutel.

Voorbeeld

PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'

XPATH_BOOLEAN(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert 'waar' als de XPath-expressie overeenstemt met een knooppunt of als de uitkomst ervan waar is.

Voorbeeld

XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true

XPATH_DOUBLE(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de waarde met zwevende komma van de XPath-expressie.

Voorbeeld

XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5

XPATH_FLOAT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de waarde met zwevende komma van de XPath-expressie.

Voorbeeld

XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5

XPATH_INT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_LONG(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_SHORT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_STRING(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de tekst van het eerste overeenkomende knooppunt.

Voorbeeld

XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'

Specifieke functies voor Google BigQuery

DOMAIN(tekenreeks_url)

Retourneert het domein van een opgegeven URL als tekenreeks.

Voorbeeld

DOMAIN('http://www.google.com:80/index.html') = 'google.com'

GROUP_CONCAT(expressie)

Voegt waarden uit elk record samen in één door komma's gescheiden tekenreeks. Deze functie werkt als een SUM() voor tekenreeksen.

Voorbeeld

GROUP_CONCAT(Region) = "Central,East,West"

HOST(tekenreeks_url)

Retourneert voor een opgegeven URL-tekenreeks de hostnaam als tekenreeks.

Voorbeeld

HOST('http://www.google.com:80/index.html') = 'www.google.com:80'

LOG2(getal)

Retourneert de logaritmebasis 2 van een getal.

Voorbeeld

LOG2(16) = '4.00'

LTRIM_THIS(tekenreeks, tekenreeks)

Retourneert de eerste tekenreeks met eventuele voorloop van de tweede tekenreeks verwijderd.

Voorbeeld

LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'

RTRIM_THIS(tekenreeks, tekenreeks)

Retourneert de eerste tekenreeks met eventuele naloop van de tweede tekenreeks verwijderd.

Voorbeeld

RTRIM_THIS('[-Market-]','-]') = '[-Market'

TIMESTAMP_TO_USEC(expressie)

Converteert een TIMESTAMP-datatype naar een UNIX-tijdstempel in microseconden.

Voorbeeld

TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000

USEC_TO_TIMESTAMP(expressie)

Converteert een UNIX-tijdstempel in microseconden naar een TIMESTAMP-datatype.

Voorbeeld

USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#

TLD(tekenreeks_url)

Retourneert voor een opgegeven URL-tekenreeks het domein van het hoogste niveau plus een landdomein in de URL.

Voorbeeld

TLD('http://www.google.com:80/index.html') = '.com'

TLD('http://www.google.co.uk:80/index.html') = '.co.uk'

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.