데이터 테스트 및 추출 사용

대개는 사용자가 데이터베이스가 실행되는 기반 하드웨어, 처리 성능 및 디스크 공간을 제어할 수 없습니다. 또한 지정된 시간에 데이터베이스에 액세스하는 사용자의 수, 실행되는 서비스의 수, 네트워크의 안정성 등도 사용자가 제어할 수 없습니다. 하지만 통합 문서를 작성하기 전에 데이터의 원시 성능을 테스트하여 작업 중인 환경의 특성을 파악할 수 있습니다. 또한 데이터에 연결하는 방법 즉, 사용하는 드라이버를 선택하는 것부터 연결 유형이 라이브인지, 아니면 추출인지 같은 통합 문서의 성능에 영향을 줄 수 있는 많은 작업들이 있습니다.

가능한 경우 로컬에서 데이터 테스트

데이터의 원시 성능을 테스트하는 좋은 방법은 데이터가 상주하는 컴퓨터에 Tableau Desktop을 설치하고 쿼리를 실행하는 것입니다. 이렇게 하면 성능 결과에서 네트워크 대역폭 및 지연 시간 같은 외부적인 요인을 제거할 수 있으며 데이터 원본의 쿼리 원시 성능을 더 쉽게 파악할 수 있습니다.

또한 데이터에 DNS 이름 대신 localhost 이름을 사용할 수 있기 때문에 느린 이름 확인 서버나 프록시 서버 같은 환경적 요소가 성능을 저하시키는지 여부를 확인할 수 있습니다.

원시 데이터베이스 드라이버를 사용하여 연결

원시 데이터베이스 드라이버를 사용하여 데이터에 연결하면 ODBC 드라이버를 사용하여 같은 데이터에 연결하는 경우보다 성능이 상당히 향상되는 경험을 하게 될 것입니다. 원시 데이터베이스 드라이버를 사용할 경우 최신 버전을 사용하는지 확인해야 합니다. 데이터베이스 공급업체는 자사 드라이버를 향상시키기 위해 항상 노력하고 있습니다. 드라이버 목록에 대해서는 Tableau 웹 사이트에서 드라이버 및 활성화를 참조하십시오.

라이브 데이터 대신 추출 사용

데이터에 따라, 데이터 원본 페이지에서 라이브 또는 또는 추출 연결을 선택할 수 있습니다. 라이브 연결은 데이터에 직접 연결합니다. Tableau 데이터 추출은 로컬에 저장되어 있으며 Tableau 비주얼리제이션을 렌더링하기 위해 필요한 경우 메모리로 로드되는 데이터의 압축된 스냅샷입니다. 추출은 컴퓨터 메모리 모두를 최적화된 상태로 사용하도록 설계되었습니다.

추출을 사용하는 이유는 여러 가지이지만 성능과 관련하여 주된 이유는 쿼리 실행 속도를 높이기 위해서 입니다. 추출 데이터 유형은 분석 쿼리에 빠르게 응답하도록 설계되었습니다. 즉, 추출을 쿼리 가속 캐시로 생각할 수 있습니다.

Tableau 추출에 대한 자세한 내용은 데이터 추출을 참조하십시오. 다른 참조 자료는 첫 번째 게시글, Understanding Tableau Data Extracts(Tableau 데이터 추출 이해)부터 시작하는 총 3부의 블로그 게시글입니다.

데이터 양 줄이기

추출을 만들 때 필터를 사용하여 필요하지 않은 데이터를 제외하십시오. 또한 데이터 원본의 모든 레코드가 필요한지, 아니면 대표적인 샘플로 추출을 제한할 수 있는지를 자문해 물어보십시오. 자세한 내용은 데이터 추출을 참조하십시오.

사용되지 않은 필드 숨기기

숨겨진 필드는 추출을 만들 때 포함되지 않습니다. 추출을 만들기 전에 사용되지 않은 필드 모두 숨기기 옵션을 사용하여 불필요한 필드를 숨깁니다. 이렇게 하면 추출 크기가 줄어들고 성능이 향상됩니다. 자세한 내용은 필드 숨기기 또는 숨기기 취소를 참조하십시오.

추출 최적화

지금 계산 옵션은 추출에서 계산을 구체화합니다. 즉, 특정 계산이 미리 수행되고 해당 값이 추출에 저장됩니다. 추출에 사용된 계산의 복잡성에 따라, 이렇게 함으로써 후속 쿼리의 속도를 높일 수 있습니다.

계산을 구체화하려면 데이터 메뉴에서 데이터 원본을 선택한 다음 추출 > 지금 계산을 선택합니다. 자세한 내용은 추출에서 계산 구체화를 참조하십시오.

파일 기반 데이터의 추출 사용

일반적으로 최상의 방법은 파일 기반 데이터 즉, CSV, Microsoft Excel 스프레드시트, Microsoft Access 파일 같은 텍스트 파일과 SPSS, SAS, R 같은 통계 파일을 Tableau로 가져오는 것입니다. 이렇게 하면 쿼리 성능이 훨씬 빨라지고 데이터 값을 저장하는 파일이 더 작아집니다.

데이터가 큰 텍스트 파일 또는 Excel 파일인 경우 추출을 사용하면 성능만 향상되는 것이 아니라 더 많은 기능을 사용할 수 있게 됩니다. Tableau를 큰 텍스트 파일에 연결하는 경우 파일이 너무 커서 성능이 저하된다고 확인되면 데이터를 추출하라는 메시지가 표시됩니다.

사용자 지정 SQL 사용 방지

대부분의 경우 사용자 지정 SQL은 Tableau로 만든 쿼리보다 느리게 실행됩니다. 이는 Tableau가 사용자 지정 SQL에서 쿼리 최적화를 수행할 수 없기 때문입니다. 반드시 사용자 지정 SQL을 사용해야 한다면 쿼리가 한 번만 실행되도록 추출을 사용하십시오. 자세한 내용은 사용자 지정 SQL 쿼리에 연결을 참조하십시오.

피드백을 제공해 주셔서 감사합니다!