데이터 해석기를 사용하여 Excel, CSV, PDF 및 Google 스프레드시트의 데이터 정리

Excel 스프레드시트에서 데이터를 추적할 때 인간적인 인터페이스를 염두에 두고 데이터를 만들어야 합니다. 스프레드시트를 읽기 쉽도록 제목, 잘 정리된 머리글, 메모, 공백을 추가하기 위한 빈 행과 열 같은 항목을 포함시킬 수 있으며 데이터를 여러 탭에 표시할 수도 있습니다.

하지만 Tableau에서 이 데이터를 분석할 때 이러한 심미적인 요소들이 Tableau가 데이터를 해석하는 것을 방해할 수 있습니다. 이러한 경우 데이터 해석기가 도움이 될 수 있습니다.

팁: Tableau의 Excel 추가 기능은 더 이상 지원되지 않지만 데이터 해석기를 사용하면 Tableau에서 분석할 수 있도록 데이터를 재구성할 수 있습니다.

데이터 해석기가 수행하는 작업

데이터 해석기를 사용하면 데이터를 빠르게 정리할 수 있습니다. 제목, 메모, 바닥글, 빈 셀 등을 감지하고 이를 무시하여 데이터 집합의 실제 필드와 값을 식별할 수 있습니다.

또한 추가 테이블과 하위 테이블을 감지하여 다른 데이터와 상관없이 사용자 데이터의 일부로 작업을 수행할 수 있도록 지원합니다.

데이터 해석기의 마법과 같은 작업이 완료되면 작업 결과를 점검하여 원하는 데이터가 캡처되고 올바르게 식별되었는지 확인할 수 있습니다. 그런 후 필요한 모든 조정을 수행할 수 있습니다.

작업할 데이터를 선택한 후에는 데이터를 피벗하거나, 필드를 분할하거나, 필터를 추가하는 등 몇 가지 추가적인 정리 단계를 수행하여 분석을 시작하기 전에 원하는 형태로 데이터를 준비해야 할 수도 있습니다.

참고: 데이터에 데이터 해석기가 수행하는 것보다 더 세밀한 정리가 필요하다면 Tableau Prep(링크가 새 창에서 열림)을 사용해 보십시오.

데이터 해석기 설정 및 결과 검토

  1. 연결 패널에서 Excel 스프레드시트에 연결하거나 텍스트(.csv) 파일, PDF 파일 또는 Google 스프레드시트와 같은 데이터 해석기를 지원하는 다른 커넥터에 연결합니다.

  2. 테이블을 캔버스로 끌어옵니다(필요한 경우). 그런 다음 데이터 원본 페이지의 왼쪽 패널에서 데이터 해석기 사용 확인란을 선택하여 데이터 해석기가 데이터 정리에 도움을 줄 수 있는지 여부를 확인합니다.

    참고: 데이터 해석기로 데이터를 지우는 경우 데이터 해석기가 데이터 원본의 연결과 관련된 모든 데이터를 지웁니다. 데이터 해석기는 기초 데이터를 변경하지 않습니다.

  3. 데이터 패널에서 결과 검토 링크를 클릭하여 데이터 해석기의 결과를 검토합니다.

    데이터 원본 복사본이 Excel의 데이터 해석기용 키 탭에서 열립니다. 키를 검토하여 결과를 읽는 방법을 찾습니다.

  4. 각 탭을 클릭하여 데이터 해석기가 데이터 원본을 해석한 방식을 검토합니다.

    데이터 해석기가 찾은 테이블 또는 하위 테이블이라고도 하는 추가 테이블을 발견한 경우 <시트 이름>__subtables 탭에 나타나며 테이블의 셀 범위가 표시됩니다. 또한 각 하위 테이블에는 머리글 행과 데이터 행을 구분할 수 있도록 색상이 지정된 별도의 탭이 포함됩니다.

    데이터 해석기가 예상된 결과를 제공하지 않는 경우 데이터 해석기로 지워짐 확인란을 선택 취소하여 원래 데이터 원본을 사용하십시오.

  5. 현재 테이블을 찾은 테이블 중 하나로 바꾸려면 현재 테이블을 캔버스 밖으로 끌어 놓은 다음 사용하려는 찾은 테이블을 캔버스로 끌어 놓습니다.

    데이터 해석기에서 찾은 테이블의 범위가 잘못 식별되면 찾은 테이블을 캔버스로 끌어 놓은 다음 해당 테이블 드롭다운 화살표를 클릭하고 찾은 테이블 편집을 선택하여 찾은 테이블의 범위(테이블의 왼쪽 위 셀과 오른쪽 아래 셀)를 조정합니다.

  6. 작업할 데이터를 준비했으면 데이터를 분석할 수 있도록 데이터에 추가 정리 작업을 적용할 수 있습니다.

데이터 해석기 예

이 예에서는 2016년도의 도시 및 주별 폭력 범죄 데이터가 있는 Excel 스프레드시트에 연결합니다. 이 스프레드시트는 여러 개의 테이블이 포함된 시트 하나와 몇 가지 추가 서식이 포함되어 있습니다.

  1. 제목

  2. 병합된 머리글 셀

  3. 추가 공백

  4. 하위 테이블

이 스프레드시트의 추가 서식은 Tableau가 필드 머리글과 필드 값의 구분하기 어렵게 만듭니다.

대신 Tableau는 데이터를 세로로 읽고 각 열에 기본값 F1, F2, F3(필드 1, 필드 2, 필드 3) 등을 할당합니다. 공백 셀은 null 값으로 읽습니다.

데이터 해석기가 이 데이터 집합을 정리하는 데 도움이 되는지 확인하기 위해 데이터 해석기 사용을 선택합니다.

데이터 해석기는 필드의 적절한 머리글을 감지하고 불필요한 서식을 제거했으며 여러 개의 하위 테이블을 찾았습니다. 하위 테이블은 데이터 패널의 시트 섹션에 나열되며 원래 시트 이름과 각 하위 테이블의 셀 범위를 사용하여 이름이 지정됩니다.

이 예에는 세 개의 하위 테이블 Crimes 2016 A4:H84, Crimes 2016 K5:L40Crimes 2016 O5:P56이 있습니다.

데이터 해석기의 결과를 보다 면밀히 검토하기 위해 데이터 패널에서 결과 검토 링크를 클릭하여 스프레드시트의 주석이 지정된 복사본을 표시합니다.

여기서 원래 데이터의 복사본을 볼 수 있으며, 이 복사본은 머리글 데이터로 식별된 데이터와 필드 값으로 식별된 데이터를 구분할 수 있도록 색상이 지정되어 있습니다.

다음 탭에서는 데이터 해석기가 찾은 하위 테이블을 셀 범위에 윤곽선을 표시하여 보여 줍니다.

이 예에서 첫 번째 하위 테이블인 Crimes 2016 A4:H84에 작업할 주 데이터가 있습니다. 이 테이블을 데이터 테이블로 사용하려면 원래 테이블을 캔버스 밖으로 끌어 놓은 다음 새 테이블을 캔버스에 끌어 놓으면 됩니다.

작업할 데이터를 캔버스 안에 놓았으면 데이터에 대한 몇 가지 추가 정리 작업을 수행할 수 있습니다. 예를 들어 다음을 수행할 수 있습니다.

  • 도시, 주 및 월 이름을 나타내도록 필드 이름을 변경합니다.

  • 월 필드를 피벗합니다.

  • 세 번째 하위 테이블인 Crimes 2016 o5:P56을 끌어 놓아 State(주) 필드의 첫 번째 하위 테이블과 조인시켜 분석할 주 모집단을 포함시킵니다.

  • 조인의 결과로 추가된 모든 중복 필드를 숨깁니다.

결과는 다음과 비슷한 모양입니다.

이제 Tableau에서 데이터를 분석할 준비가 되었습니다.

데이터 해석기를 사용할 수 없는 경우

데이터 해석기 옵션을 사용할 수 없는 이유는 다음과 같습니다.

  • 데이터 원본이 이미 Tableau가 해석할 수 있는 형식입니다. Tableau Desktop은 데이터 해석기를 통해 고유한 서식이나 관련 없는 정보를 처리해야 할 필요가 없는 경우 데이터 해석기를 사용할 수 없게 만듭니다.

  • 많은 행 또는 많은 열: 데이터에 다음과 같은 특성이 있는 경우 데이터 해석기 옵션을 사용할 수 없습니다.

    • 데이터에 2000개가 넘는 열이 있습니다.

    • 데이터에 3000개가 넘는 행과 150개가 넘는 열이 있습니다.

  • 데이터 원본이 지원되지 않음: 데이터 해석기는 Microsoft Excel, 텍스트(.csv) 파일, PDF 파일 및 Google 스프레드시트에만 사용할 수 있습니다. Excel의 경우 데이터는 .xls 또는 .xlsx 형식이어야 합니다.

 

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!