Datastrategi
Det här innehållet är en del av Tableau Blueprint – ett ramverk med vilket ni kan zooma in och förbättra hur organisationen använder data för att få större genomslag. Sätt igång genom att göra vår utvärdering(Länken öppnas i ett nytt fönster).
Alla organisationer har olika krav på och lösningar för sin datainfrastruktur. Tableau respekterar organisationers val och integrerar i er befintliga datastrategi. Förutom företagets datalager finns det många nya datakällor i och utanför din organisation. Program och data i molnet, databaser med big data, strukturerade och ostrukturerade lagringsplatser. Dataflödet, från Hadoop-kluster till NoSQL-databaser och många andra, behöver inte längre vara centraliserat runt företagets informationslager som slutdestination.
Modern dataarkitektur drivs av nya affärskrav (som hastighet, agilitet, volym) och ny teknik. Du kan välja mellan att tillhandahålla åtkomst till data som finns på plats eller anrika data med andra källor. Detta kombinerat med molnlösningar gör att infrastruktur och tjänster kan köra datapipelines i flera timmar och du har en process som flyttar runt data i organisationen på ett sätt som aldrig tidigare. Tyvärr missar många den här nya möjligheten om din organisations handbok för datahantering skrevs med ett traditionellt företagsinformationlagers enda databucket i åtanke. Tricket för att byta från databuckets till pipelines är att acceptera att inte alla datafrågor i en organisation kan besvaras från en enda datakälla. Mönstret för en modern dataarkitektur visas nedan.
Modern dataarkitektur
- Rådata: datakällor, som transaktionella data som läses in i dataplattformen och ofta behöver omvandlas på olika sätt; rensning, inspektion för PII, osv.
- Beräkna för förberedelse: bearbetning av rådata kan kräva enorma beräkningsresurser, mer än traditionell ETL. Det är ofta här dataforskningsappar finns. De kan faktiskt skapa nya data med stort värde.
- Lagring: Moderna dataplattformar bygger på principen att lagra data eftersom du aldrig riktigt vet hur de kan användas i framtiden. I allt större utsträckning sparar vi mellandata och flera versioner och former av samma data. Därför sker lagring ofta i flera lager.
- Beräkna för fråga: den vanliga motorn för databasanalys, innefattar Hyper-extrakt men även Hadoop, osv.
- Analys: Tableau finns i Analytics.
Tableaus hybriddataarkitektur
Tableaus hybriddataarkitektur har två lägen för att interagera med data, med en liveanslutning eller ett minnesextrakt. Det är lika enkelt att växla mellan de två som att välja rätt alternativ för dina användningsfall.
Liveanslutning
Tableaus datakopplingar utnyttjar din befintliga datastruktur genom att skicka dynamiska frågor direkt till källdatabasen i stället för att importera alla data. Det betyder att om du har investerat i snabba, analysoptimerade databaser kan du dra nytta av den investeringen genom att ansluta live till din data. Det lämnar detaljerad data i källsystemet och skickar aggregerade resultat av frågorna till Tableau. Detta innebär dessutom att Tableau effektivt kan utnyttja obegränsade mängder data. Tableau är faktiskt den ledande analysklienten i många av världens största databaser. Tableau har optimerat varje koppling för att dra nytta av unika egenskaper i varje datakälla.
Minnesextrakt
Om du har en datastruktur som bygger på transaktionella databaser eller vill minska arbetsbelastningen på kärndatastrukturen ger Tableaus datamotor, som är baserad på Hyper-teknik, ett minnesdatalager som är optimerat för analys. Du kan ansluta och extrahera din data för att få dem i minnet och utföra sökningar i Tableau med ett enda klick. Med Tableau-dataextrakt kan användarupplevelsen förbättras avsevärt eftersom det tar kortare tid att ställa en fråga i databasen igen. Därmed kan extrakt frigöra överflödig frågetrafik från databasservern.
Extrakt är en alldeles ypperlig lösning för transaktionella system som är mycket aktiva och inte har resurser för frekventa frågor. Extrakten kan uppdateras nattetid och vara tillgängliga för användarna under dagen. Extrakt kan även vara deluppsättningar av data baserade på ett fast antal poster, en procentandel av totalt antal poster eller filtrerade kriterier. Datamotorn kan också göra stegvisa extraheringar som uppdaterar befintliga extrakt med nya data. Extrakt är inte avsedda att ersätta din databas så se till att ha rätt storlek på extraktet för den aktuella analysen.
Om du vill dela dina arbetsböcker med användare som inte har direktåtkomst till underliggande datakällor kan du utnyttja extrakt. Tableaus ingående arbetsböcker (.twbx-filer) innehåller all analys och alla data som har använts i arbetsboken. Det gör dem både portabla och möjliga att dela med andra Tableau-användare.
Om en användare publicerar en arbetsbok med ett extrakt publiceras extraktet även i Tableau Server eller Tableau Cloud. Senare interaktion med arbetsboken använder då extraktet i stället för att begära livedata. Arbetsboken kan ställas in på att begära automatisk extraktuppdatering enligt schema om detta aktiveras.
Gemensam fråga
När relaterad data lagras i tabeller i olika databaser eller filer kan du använda korsdatabaskoppling för att kombinera tabellerna. För att skapa en korsdatabaskoppling skapar du en integrerad Tableau-datakälla genom att lägga till och sedan koppla den till var och en av de olika databaserna (inklusive Excel- och textfiler) innan du sammanför tabellerna. Korsdatabaskopplingar kan användas med liveanslutningar eller minnesextrakt.
Dataserver
Dataserver, som ingår i Tableau Server och Tableau Cloud, gör att du kan dela och centralisera hantering av extrakt och delade proxydatabasanslutningar. Därmed får du kontroll, mäter och hanterar datakällor som är tillgängliga för alla användare av Tableau Server eller Tableau Cloud utan att behöva duplicera extrakt eller dataanslutningar mellan arbetsböcker.
Eftersom flera arbetsböcker kan ansluta till samma datakälla kan du minimera dimensionering av inbäddade datakällor och spara både lagringsutrymme och bearbetningstid. Om någon laddar ner en arbetsbok som ansluter till en publicerad datakälla som i sin tur har en extraktanslutning blir extraktet kvar på Tableau Server eller Tableau Cloud, och minskar därmed nätverkstrafiken. Avslutningsvis, om en anslutning kräver en databasdrivrutin behöver du bara installera och underhålla drivrutinen på Tableau Server, i stället för på alla användares respektive dator. På samma sätt hanteras drivrutiner i Tableau Cloud av Tableau för datakällor som stöds.
Genom att använda initiala dataanvändningsfall som samlats in från alla team kan en databasadministratör och/eller datasteward publicera en certifierad datakälla för varenda källa med data som identifierats för användare med rätt behörigheter för att komma åt den. Användare kan ansluta direkt till en publicerad datakälla från Tableau Desktop och Tableau Server eller Tableau Cloud.
Publicerade datakällor förhindrar dimensionering av datasilor och icke betrodda data för både extrakt och liveanslutningar. Extraktuppdateringar kan schemaläggas och användare i organisationen hålls uppdaterade med samma delade data och definitioner. En publicerad datakälla kan konfigureras att ansluta direkt till livedata med en proxydatabasanslutning. Det innebär att din organisation har ett sätt att centralt hantera dataanslutningar, kopplingslogik, metadata och beräknade fält
Samtidigt kan användare, för att möjliggöra självbetjäning och flexibilitet, utöka datamodellen genom att kombinera nya data eller skapa nya beräkningar och låta den nyligen definierade datamodellen smidigt levereras till produktion. Centralt hanterad data ändras inte men användarna behåller flexibiliteten.
Certifierade datakällor
Databasadministratörer och/eller datastewards ska certifiera publicerade datakällor så användarna vet att data är betrodda. Certifierade datakällor visas med ett unikt certifieringsmärke i Tableau Server, Tableau Cloud och Tableau Desktop. Certifieringsnoteringar gör att du kan beskriva varför en specifik datakälla är betrodd. Dessa noteringar är tillgängliga i hela Tableau när datakällan visas tillsammans med information om vem som har certifierat den. Certifierade datakällor får specialbehandling i sökresultat och syns tydligt i listor med datakällor i Tableau Server, Tableau Cloud och Tableau Desktop. Projektledare och platsadministratörer för Tableau Cloud och Tableau Server har behörighet att certifiera datakällor. Mer information finns i Certifierade datakällor.
Datasäkerhet
Datasäkerhet är ytterst viktigt i alla företag. Med Tableau kan kunderna bygga vidare på sina befintliga implementeringar av dataskydd. IT-administratörer har möjlighet att implementera säkerhet i databasen med hjälp av databasautentisering, i Tableau med hjälp av behörigheter eller genom en hybrid av båda. Säkerheten upprätthålls oberoende av om användare kommer åt data från publicerade vyer på webben, på mobila enheter eller genom Tableau Desktop och Tableau Prep Builder. Kunder föredrar ofta hybridmetoden för dess flexibilitet att hantera olika typer av användningsfall. Börja med att fastställa en datasäkerhetsklassificering för att definiera de olika typerna av data och känslighetsnivåer som finns i din organisation.
Observera att metoden som väljs för autentisering till databasen är det viktigaste när databassäkerhet utnyttjas. Denna autentiseringsnivå är åtskild från Tableau Server- eller Tableau Cloud-autentisering (dvs när en användare loggar in på Tableau Server eller Tableau Cloud innebär det inte att hen loggar in i databasen). Det innebär att Tableau Server- och Tableau Cloud-användare även måste ha inloggningsuppgifter (eget användarnamn/lösenord eller servicekontots användarnamn/lösenord) för att ansluta till databasen så att säkerheten på databasnivå tillämpas. Tableau behöver endast läsbehörighet till databasen för att ytterligare skydda din data, vilket förhindrar att utgivare oavsiktligt ändrar underliggande data. Alternativt kan det i vissa fall vara praktiskt att ge databasen användarbehörighet för att skapa tillfälliga tabeller. Detta kan innebära fördelar både för prestanda och säkerhet eftersom tillfälliga data sparas i databasen i stället för i Tableau. För Tableau Cloud behöver du bädda in inloggningsuppgifter som ska användas vid automatiska uppdateringar i datakällans anslutningsinformation. För datakällorna Google och Salesforce.com kan du bädda in inloggningsuppgifterna i form av OAuth 2.0 åtkomsttoken.
Extraktkryptering vid vila är en datasäkerhetsfunktion som gör att du kan kryptera .hyper-extrakt medan de lagras på Tableau Server. Tableau Server-administratörer kan framtvinga kryptering av alla extrakt på sin webbplats eller tillåta användare att välja att kryptera alla extrakt som är associerade med specifika publicerade arbetsböcker eller datakällor. Mer information finns i Extraktkryptering vid vila.
Om din organisation driftsätter dataextraktkryptering vid vila kan du valfritt konfigurera Tableau Server för användning av AWS som KMS för extraktkryptering. För att aktivera AWS- eller Azure-nyckelhanteringstjänster (KMS) måste du driftsätta Tableau Server i AWS respektive Azure och ha licens för Advanced Management för Tableau Server. I AWS-scenariot använder Tableau Server den primära kundnyckeln (CMK) för AWS KMS för att generera en AWS-datanyckel. Tableau Server använder AWS-datanyckeln som rothuvudnyckel för alla krypterade extrakt. I Azure-scenariot använder Tableau Server Azure Key Vault för att kryptera den primära rotnyckeln (RMK) för alla krypterade extrakt. Men även om det konfigurerats för integration med AWS KMS eller Azure KMS används fortfarande det inbyggda Java-nyckelarkivet och den lokala nyckelhanteringstjänsten för säker lagring av hemligheter i Tableau Server. AWS KMS eller Azure KMS används enbart för att kryptera den primära rotnyckeln för krypterade extrakt. Mer information finns i Key Management System.
För Tableau Cloud krypteras all data i vila som standard. Med Advanced Management för Tableau Cloud kan du dock få mer kontroll över nyckelrotation och granskning genom att använda kundhanterade krypteringsnycklar. Kundhanterade krypteringsnycklar ger dig en extra säkerhetsnivå genom att du kan kryptera webbplatsens dataextrakt med en kundhanterad platsspecifik nyckel. Instansen för Salesforce Key Management System (KMS) lagrar den platsspecifika och standardiserade krypteringsnyckeln för alla som aktiverar kryptering på en plats. Krypteringsprocessen följer en nyckelhierarki. Först krypterar Tableau Cloud ett extrakt. Därefter kontrollerar Tableau Cloud KMS viktig cacheinformation för att hitta en lämplig datanyckel. Om en nyckel inte hittas genereras den av KMS GENERATEDATAKEY API med hjälp av behörigheten som beviljas av nyckelpolicyn som är associerad med nyckeln. AWS KMS använder CMK för att generera en datanyckel och returnerar en klartextkopia och en krypterad kopia till Tableau Cloud. Tableau Cloud använder klartextkopian av datanyckeln för att kryptera data och lagrar den krypterade kopian av nyckeln tillsammans med den krypterade datan.
Du kan begränsa vilka användare som ser vilka data genom att ställa in användarfilter i både Tableau Server och Tableau Cloud. På så sätt får du bättre kontroll på vilka data användare ser i en publicerad vy baserat på deras inloggningskonto för Tableau Server. Med denna teknik kan en regional chef visa data för sin region men inte data för andra regionala chefer. Med denna inställning till datasäkerhet kan du publicera en enskild vy eller instrumentpanel på ett sätt som ger många användare på Tableau Cloud och Tableau Server säker, personanpassad data och analys. Mer information finns i Data Security (Datasäkerhet) och Restrict Access at the Data Row Level (Begränsa åtkomst på dataradnivå). Om säkerhet på radnivå är av största vikt för ditt användningsfall för analys kan du med Tableau Data Management utnyttja virtuella anslutningar med datapolicyer och implementera användarfiltrering i stor skala. Se Virtual Connections and Data Policies (Virtuella anslutningar och datapolicyer) för mer information.