Amazon S3
이 문서에서는 Tableau를 드라이버 없이 Amazon S3 커넥터 연결하고 데이터 원본을 설정하는 방법에 대해 설명합니다.
시작하기 전에 다음 연결 정보를 수집하십시오.
S3 버킷의 AWS 리전
S3 버킷 이름.
S3 버킷의 AWS IAM 액세스 키(키 ID 및 비밀 액세스 키).
사용 권한
AWS IAM 사용자에 S3 버킷에 대한 읽기 권한이 있는지 확인하십시오.
권장 사항
다음 권장 사항은 성능 향상에 도움이 될 수 있습니다.
- EC2 인스턴스에 설치된 Tableau Desktop 또는 Server이거나 Tableau Cloud를 사용하는 경우처럼 클라이언트가 AWS 환경에서 실행 중인 경우 최적의 성능을 얻을 수 있습니다.
- 교차 리전 버킷이 지원되지만 동일한 리전 액세스보다 성능이 떨어집니다. 데이터 송신 요금으로 인해 추가 비용이 발생할 수도 있습니다.
연결한 후 데이터 원본 설정
- Tableau를 시작하고 연결 아래의 추가 커넥터 목록에서 Amazon S3를 선택합니다.
- 설치 후 Tableau 다시 시작을 선택하여 커넥터를 설치합니다.
- Tableau가 다시 시작되면 연결로 이동한 다음 설치된 커넥터 목록에서 Amazon S3를 선택합니다.
- 버킷 리전, 버킷 이름, 액세스 키 ID 및 비밀 액세스 키를 입력합니다.
- 로그인을 선택합니다.
- 버킷의 콘텐츠에서 연결하려는 파일을 선택합니다.
- 연결을 선택합니다.
데이터 원본 설정
데이터 원본을 설정하려면 다음 단계를 완료하십시오.
- (선택 사항) 페이지 상단에서 기본 데이터 원본 이름을 선택합니다.
- Tableau에서 사용할 고유한 데이터 원본 이름을 입력합니다.
- 연결하려는 하나 이상의 파일을 왼쪽 패널에서 캔버스로 끌어옵니다.
- 분석을 시작하려면 시트 1 탭을 선택합니다.
데이터 유니온
S3 버킷에서 파일을 유니온할 수 있습니다. 유니온에 대한 자세한 내용은 데이터 유니온을 참조하십시오. 하위 폴더의 파일을 포함하는 와일드카드 유니온을 수행하려면 루트 폴더 또는 버킷에서 유니온에 포함할 하나 이상의 파일이 하위 폴더에 포함된 파일의 구조와 일치해야 합니다. 이 파일은 유니온을 만들 때 연결하는 첫 번째 파일입니다.
알려진 문제와 제한 사항
다음 섹션에는 Amazon S3 커넥터를 사용할 때 성공 여부에 영향을 줄 수 있는 알려진 문제 및 제한 사항이 나와 있습니다.
참고: 이 커넥터는 현재 Tableau Prep 웹 작성 또는 가상 연결에서 지원되지 않습니다.
인증 관련 알려진 문제와 제한 사항
세션 토큰이 없는 Amazon IAM 사용자 암호 키/액세스 키 인증만 지원됩니다.
게시 관련 알려진 문제와 제한 사항
통합 문서 및 데이터 원본은 '내장된 비밀번호' 인증 옵션을 사용하여 게시해야 합니다. '사용자에게 확인'은 현재 지원되지 않습니다.
유니온 관련 알려진 문제와 제한 사항
- Tableau Desktop만 와일드카드 유니온을 지원합니다.
- 웹 작성은 사용자 지정 수동 유니온(파일 끌기)만 지원합니다.
파일 유형 관련 알려진 문제 및 제한 사항
- 현재 Parquet, .csv, 압축 .gz 및 Excel 파일이 지원됩니다.
- 모든 데이터는 설계에 따라 문자열 형식으로 가져옵니다.
- 단일 연결에서 여러 파일 형식을 유니온하거나 조인할 수 없습니다(예: Parquet 및 .csv를 함께 유니온 불가).
- 현재 쉼표로 구분된 .csv 파일만 지원됩니다.
- 파일 크기 제한은 15gb입니다.
- 조인이나 유니온의 누적 결과 집합은 15gb를 초과할 수 없습니다.
- Excel 파일은 현재 커넥터에서 Excel 파일 구문 분석기의 성능 문제로 인해 최대 100MB를 초과할 수 없습니다.
추가 Parquet 파일 관련 알려진 문제 및 제한 사항
- Parquet 파일은 Hyper API 설명서에서 설명하는 형식이어야 합니다.
- 중첩된 열은 지원되지 않으며 그에 따라 중첩된 유형의 MAP 및 LIST도 지원되지 않습니다.
- BSON, UUID 및 ENUM 유형은 지원되지 않습니다.
- 논리적 또는 변환된 유형이 없는 물리적 유형의 FIXED_LEN_BYTE_ARRAY는 지원되지 않습니다.
- DECIMAL 유형은 최대 8바이트(18자리 십진수)까지만 지원됩니다. 18자리 이상의 십진수가 필요한 경우 배정밀도 사용을 고려하십시오.
- TIME_MILLIS 및 TIME_NANOS 유형은 지원되지 않습니다. 대신 TIME_MICROS를 사용하는 것이 좋습니다.
- 사용 중단된 BIT_PACKED 인코딩은 지원되지 않습니다. 이 인코딩은 5년 이상 사용 중단되었으므로 최근 Parquet 파일에 이 인코딩을 사용하지 않아야 합니다.
- DELTA_LENGTH_BYTE_ARRAY 인코딩 및 최신 BYTE_STREAM_SPLIT 인코딩은 어떤 라이브러리에서도 작성되지 않았으므로 지원되지 않습니다. 이러한 인코딩을 사용하는 Parquet 파일이 있으면 알려주십시오.
- 지원되는 압축은 SNAPPY, GZIP, ZSTD 및 LZ4_RAW입니다.
참고 항목
- 데이터 원본 설정 – 이 데이터 원본에 더 많은 데이터를 추가하거나 데이터를 분석할 수 있도록 준비합니다.
- 차트 작성 및 데이터 분석 – 데이터 분석을 시작합니다.
- Amazon Redshift 및 Tableau 소프트웨어 배포를 최적화하여 성능 개선(영문)(링크가 새 창에서 열림) - Tableau 백서(등록 또는 로그인 필요)
- Amazon Redshift를 사용한 빅 데이터 분석 탐색(영문)(링크가 새 창에서 열림) - Tableau 웹 세미나 녹화본(등록 또는 로그인 필요)