Statistisch bestand
In dit artikel wordt beschreven hoe u Tableau verbindt met een statistisch bestand en de databron instelt.
Tableau maakt verbinding met SAS- (*.sas7bdat), SPSS- (*.sav) en R-databestanden (*.rdata, *.rda).
Opmerking: vanaf versie 2020.1 biedt Tableau geen ondersteuning meer voor statistische bestanden die zijn gecomprimeerd met SASYZCR2. Gebruik een ander compressieschema om het bestand leesbaar te maken voor Tableau.
Start Tableau op en selecteer onder Verbinding maken de optie Statistisch bestand. Selecteer vervolgens het bestand waarmee u verbinding wilt maken en selecteer Openen.
Ga als volgt te werk op de databronpagina:
(Optioneel) Selecteer de standaard databronnaam boven aan de pagina en voer vervolgens een unieke databronnaam in voor gebruik in Tableau. Gebruik bijvoorbeeld een naamgevingsconventie voor databronnen waarmee andere gebruikers van de databron kunnen bepalen met welke databron ze verbinding moeten maken.
Selecteer het tabblad Werkblad om de analyse te starten.
Zie Joins maken van uw data voor informatie over het verbinden met meer dan één tabel.
Voorbeeld van een statistisch bestand als databron
Hier is een voorbeeld van een statistisch bestand als databron met Tableau Desktop op een Windows-computer:
Let op het volgende:
De connector voor statistische bestanden biedt geen ondersteuning voor waardelabels.
De connector voor statistische bestanden ondersteunt slechts één tabel per statistisch bestand.
Als de foutmelding 'Er is een fout opgetreden bij het communiceren met de databron' verschijnt, controleer dan of het statistische bestand slechts één object bevat en of het object een dataframe of een matrix is. R-bestanden bevatten soms verborgen objecten in wat op het oog een schone werkruimte lijkt. Voer
ls(environment(), all.names=TRUE)
uit in Rstudio om te controleren op verborgen objecten.U kunt de tekencodering voor een statistisch bestand wijzigen. Ze De tekencodering voor statistische bestanden wijzigen voor meer informatie.
R-databestanden mogen slechts één van de volgende typen objecten bevatten:
Tweedimensionale matrices
Vectoren
Factoren
Dataframes
Als het R-databestand meerdere objecten bevat, maakt Tableau verbinding met het eerste object.
Tableau biedt geen ondersteuning voor R-databestanden die een binaire indeling gebruiken.
ASCII-bestanden worden niet ondersteund in Tableau Desktop. Als u een .rdata- of .rda-bestand in de ASCII-indeling probeert te gebruiken, ziet u de foutmelding ''Kan het bestand in de tabel niet lezen' '[TableauTemp].[filename.rdata]' bestaat niet". In dat geval kunt u RStudio gebruiken om het bestand als volgt op te slaan in een binaire indeling:
- Download RStudio als u dat nog niet gedaan hebt.
- Open uw R-databestand in RStudio. Als het goed is, ziet u het dataobject dan rechtsboven in het globale omgevingsvenster.
Sla het object als volgt op in een nieuw bestand met de functie "save()":
save(<objectName>,file="<filename>",ascii=FALSE)
waarbij: <objectName> uw data-object is, <filename> de naam van het nieuwe bestand is en 'FALSE' hoofdlettergevoelig is
Tip: als u snel de documentatie voor deze functie wilt bekijken, typt u '?save' bij de opdrachtprompt.
Gecomprimeerde bestanden worden niet ondersteund in Tableau Desktop. U moet bestanden eerst uitpakken met een ander programma, zoals Gzip of WinZip, voordat u verbinding maakt met Tableau.
Tableau leest de data in een statistisch bestand (bijvoorbeeld een SAS- of R-bestand) op basis van de tekencodering van het bestand of op basis van informatie in een invoerbestand. R-bestanden gebruiken doorgaans de tekencodering van het besturingssysteem. In SAS- en SPSS-bestanden is de tekencoderingsinformatie daarentegen vaak in het bestand opgenomen. Soms moet u een andere codering opgeven. Als een collega u bijvoorbeeld een statistisch bestand met Griekse tekencodering stuurt, dient u een Griekse tekenset op te geven om het bestand met Tableau te kunnen gebruiken. Als u een andere tekenset moet gebruiken om een statistisch bestand te lezen, kunt u een Tableau-bestand voor aanpassing van de databron (TDC-bestand) maken en de te gebruiken codering opgeven.
Het TDC-bestand maken
Een .tdc-bestand is een XML-bestand dat betrekking heeft op één databron en dat informatie bevat over de leveranciers- en stuurprogrammanaam van de databronprovider. Voor de connector voor statistische bestanden is de leveranciers- en stuurprogrammanaam stat-direct
.
Een TDC-bestand maken:
Open een eenvoudig tekstbewerkingsprogramma, zoals Kladblok.
Kopieer de informatie uit het onderstaande voorbeeld, plak deze in uw tekstbestand en geef vervolgens de
source-charset
-waarde op. (Raadpleeg Door de statistische bestandsconnector ondersteunde, door de gebruiker gedefinieerde coderingen voor een lijst met coderingen.)Sla het bestand op met de extensie .tdc, bijvoorbeeld:
r-statsfile.tdc
in de map Mijn Tableau Repository\Datasources.
TDC-voorbeeldbestand stelt de source-charset-waarde in
Het volgende TDC-bestandsvoorbeeld stelt de waarde van source-charset
in op shift-jis
voor een statistisch bestand als databron.
<connection-customization class='stat-direct' enabled='true' version='10.0'>
<vendor name='stat-direct' />
<driver name='stat-direct' />
<customizations>
<customization name='source-charset' value='shift-jis' />
</customizations>
</connection-customization>
Belangrijk: U kunt TDC-bestanden gebruiken om de functionaliteit van een verbinding aan te passen of om verbindingsproblemen met uw data te diagnosticeren en op te lossen. Tableau is niet in staat niet elke mogelijke wijziging die u in deze bestanden kunt aanbrengen grondig te testen. Het maken en gebruiken van TDC-bestanden vereist handmatige bewerking en het is van cruciaal belang om ze grondig te testen voordat u ze in een productieomgeving implementeert.
Mogelijk ziet u .ttde- of .hhyper-bestanden wanneer u door de directory van uw computer navigeert. Wanneer u een Tableau-databron maakt die verbinding maakt met uw data, maakt Tableau een .ttde- of .hhyper-bestand. Dit bestand, ook wel een schaduwextract genoemd, wordt gebruikt om de snelheid waarmee uw databron in Tableau Desktop wordt geladen, te verbeteren. Hoewel een schaduwextract onderliggende data en andere informatie bevat die vergelijkbaar is met het standaard Tableau-extract, wordt een schaduwextract in een ander formaat opgeslagen en kan het niet worden gebruikt om uw data te herstellen.
Opmerking: .tde-bestanden worden niet langer ondersteund voor Tableau-versies na 2024.2. Alle extracten zijn nu in .hyper-indeling.
Zie ook
- Databronnen instellen – Voeg meer data toe aan deze databron of bereid de data voor voordat u deze analyseert.
- Diagrammen maken en data analyseren – Begin met de data-analyse.