Utiliser des scripts R et Python dans votre flux
Depuis la version 2019.3.1, vous pouvez utiliser des scripts R et Python pour effectuer des opérations de nettoyage plus complexes ou intégrer des données de modélisation prédictive dans votre flux. Les données sont transmises à partir du flux en entrée par l’étape de script R ou Python, puis renvoyées sous forme de données de sortie que vous pouvez continuer à nettoyer à l’aide des fonctionnalités et des fonctions de Tableau Prep Builder.
Remarque : la connexion aux scripts en tant qu’étape de saisie pour votre flux n’est pas encore prise en charge. En outre, les étapes de script ne sont pas encore prises en charge pour les flux créés ou publiés sur Tableau Cloud.
Configurez votre serveur Rserve ou votre serveur Tableau Python (TabPy) et ajoutez une étape de script à votre flux. Tableau Prep transmet les données à Rserve pour R ou au serveur Tableau Python (TabPy) pour Python et renvoie les données résultantes au flux sous la forme de table. Vous pouvez continuer à appliquer des opérations de nettoyage aux résultats et générer vos résultats pour analyse.
Lorsque vous créez votre script, vous devrez inclure une fonction qui spécifie un dataframe comme argument de la fonction. Pour retourner des champs différents de ceux que vous entrez, vous devrez inclure une fonction getOutputSchema dans votre script qui définit les types de sortie et de données. Sinon, la sortie utilisera les champs des données d’entrée.
Si vous créez ou modifiez des flux dans Tableau Server (à partir de la version 2020.4.1) qui incluent des étapes de script, Tableau Server doit également avoir une connexion à un serveur Rserve ou TabPy pour exécuter les étapes de script. Pour plus d’informations sur la configuration de R ou de Python à utiliser dans vos flux et sur la création de vos scripts, consultez Utiliser des scripts R (Rserve) dans votre flux(Le lien s’ouvre dans une nouvelle fenêtre) ou Utiliser des scripts Python dans votre flux(Le lien s’ouvre dans une nouvelle fenêtre).