Aanvullende functies

REGEXP_REPLACE(tekenreeks, patroon, vervanging)

Retourneert een kopie van de opgegeven tekenreeks waarin het patroon van de reguliere expressie wordt vervangen door de vervangende tekenreeks. Deze functie is alleen beschikbaar bij voor: tekstbestand, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extract, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moeten het patroon en de vervanging constanten zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_REPLACE('abc 123', '\s', '-') = 'abc-123'

REGEXP_MATCH(tekenreeks, patroon)

Retourneert waar als een subtekenreeks van de opgegeven tekenreeks overeenkomt met het patroon van de reguliere expressie. Deze functie is beschikbaar voor tekstbestanden, Google BigQuery, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Impala 2.3.0 (via Cloudera Hadoop-databronnen), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_MATCH('-([1234].[The.Market])-','\[\s*(\w*\.)(\w*\s*\])')=true

REGEXP_EXTRACT(tekenreeks, patroon)

Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. Deze functie is alleen beschikbaar bij voor: tekstbestand, Hadoop Hive, Google BigQuery, PostgreSQL, Tableau-data-extract, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger), Snowflake en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_EXTRACT('abc 123', '[a-z]+\s+(\d+)') = '123'

REGEXP_EXTRACT_NTH(tekenreeks, patroon, index)

Retourneert het deel van de tekenreeks dat overeenkomt met het patroon van de reguliere expressie. De subtekenreeks wordt afgestemd met de nde groep voor vastleggen, waarbij n de opgegeven index is. Als index 0 is, wordt de volledige tekenreeks geretourneerd. Deze functie is beschikbaar voor tekstbestanden, PostgreSQL, Tableau-data-extracten, Microsoft Excel, Salesforce, Vertica, Pivotal Greenplum, Teradata (versie 14.1 en hoger) en Oracle-databronnen.

Voor Tableau-data-extracten moet het patroon een constante zijn.

Raadpleeg de documentatie van uw databron voor informatie over de syntaxis van reguliere expressies. Voor Tableau-extracten voldoet de syntaxis van reguliere expressies aan de standaarden van de huidige Components for Unicode (ICU), een openbronproject met volwassen C/C- en Java-bibliotheken voor Unicode-ondersteuning, software-internationalisatie en -globalisatie. Zie de pagina Reguliere expressies(Link wordt in een nieuw venster geopend) in de online ICU-gebruikershandleiding.

Voorbeeld

REGEXP_EXTRACT_NTH('abc 123', '([a-z]+)\s+(\d+)', 2) = '123'

Specifieke functies voor Hadoop Hive

Opmerking: alleen de functies PARSE_URL en PARSE_URL_QUERY zijn beschikbaar voor Cloudera Impala-databronnen.

GET_JSON_OBJECT(JSON-tekenreeks, JSON-pad)

Retourneert het JSON-object binnen de JSON-tekenreeks op basis van het JSON-pad.

PARSE_URL(tekenreeks, url_gedeelte)

Retourneert een onderdeel van de opgegeven URL-tekenreeks waarbij het onderdeel wordt gedefinieerd door url_gedeelte. Geldige url_part-waarden omvatten: 'HOST', 'PATH', 'QUERY', 'REF', 'PROTOCOL', 'AUTHORITY', 'FILE' en 'USERINFO'.

Voorbeeld

PARSE_URL('http://www.tableau.com', 'HOST') = 'www.tableau.com'

PARSE_URL_QUERY(tekenreeks, sleutel)

Retourneert de waarde van de opgegeven queryparameter in de opgegeven URL-tekenreeks. De queryparameter wordt gedefinieerd door de sleutel.

Voorbeeld

PARSE_URL_QUERY('http://www.tableau.com?page=1&cat=4', 'page') = '1'

XPATH_BOOLEAN(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert waar als de XPath-expressie overeenstemt met een knooppunt of als de uitkomst ervan waar is.

Voorbeeld

XPATH_BOOLEAN('<values> <value id="0">1</value><value id="1">5</value>', 'values/value[@id="1"] = 5') = true

XPATH_DOUBLE(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de waarde met zwevende komma van de XPath-expressie.

Voorbeeld

XPATH_DOUBLE('<values><value>1.0</value><value>5.5</value> </values>', 'sum(value/*)') = 6.5

XPATH_FLOAT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de waarde met zwevende komma van de XPath-expressie.

Voorbeeld

XPATH_FLOAT('<values><value>1.0</value><value>5.5</value> </values>','sum(value/*)') = 6.5

XPATH_INT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_INT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_LONG(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_LONG('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_SHORT(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de numerieke waarde van de XPath-expressie of nul als de uitkomst van de XPath-expressie geen getal is.

Voorbeeld

XPATH_SHORT('<values><value>1</value><value>5</value> </values>','sum(value/*)') = 6

XPATH_STRING(XML-tekenreeks, XPath-expressietekenreeks)

Retourneert de tekst van het eerste overeenkomende knooppunt.

Voorbeeld

XPATH_STRING('<sites ><url domain="org">http://www.w3.org</url> <url domain="com">http://www.tableau.com</url></sites>', 'sites/url[@domain="com"]') = 'http://www.tableau.com'

Specifieke functies voor Google BigQuery

DOMAIN(tekenreeks_url)

Retourneert het domein van een opgegeven URL als tekenreeks.

Voorbeeld

DOMAIN('http://www.google.com:80/index.html') = 'google.com'

GROUP_CONCAT(expressie)

Voegt waarden uit elk record samen in één door komma's gescheiden tekenreeks. Deze functie werkt als een SUM() voor tekenreeksen.

Voorbeeld

GROUP_CONCAT(Region) = "Central,East,West"

HOST(tekenreeks_url)

Retourneert voor een opgegeven URL-tekenreeks de hostnaam als tekenreeks.

Voorbeeld

HOST('http://www.google.com:80/index.html') = 'www.google.com:80'

LOG2(getal)

Retourneert de logaritmebasis 2 van een getal.

Voorbeeld

LOG2(16) = '4.00'

LTRIM_THIS(tekenreeks, tekenreeks)

Retourneert de eerste tekenreeks met eventuele voorloop van de tweede tekenreeks verwijderd.

Voorbeeld

LTRIM_THIS('[-Sales-]','[-') = 'Sales-]'

RTRIM_THIS(tekenreeks, tekenreeks)

Retourneert de eerste tekenreeks met eventuele naloop van de tweede tekenreeks verwijderd.

Voorbeeld

RTRIM_THIS('[-Market-]','-]') = '[-Market'

TIMESTAMP_TO_USEC(expressie)

Converteert een TIMESTAMP-datatype naar een UNIX-tijdstempel in microseconden.

Voorbeeld

TIMESTAMP_TO_USEC(#2012-10-01 01:02:03#)=1349053323000000

USEC_TO_TIMESTAMP(expressie)

Converteert een UNIX-tijdstempel in microseconden naar een TIMESTAMP-datatype.

Voorbeeld

USEC_TO_TIMESTAMP(1349053323000000) = #2012-10-01 01:02:03#

TLD(tekenreeks_url)

Retourneert voor een opgegeven URL-tekenreeks het domein van het hoogste niveau plus een landdomein in de URL.

Voorbeeld

TLD('http://www.google.com:80/index.html') = '.com'

TLD('http://www.google.co.uk:80/index.html') = '.co.uk'

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.