예측 모델링 함수는 선형 회귀, 정규화된 선형 회귀 및 가우스 프로세스 회귀를 지원합니다. 이러한 모델은 다양한 사용 사례 및 예측 유형을 지원할 뿐만 아니라 다양한 제한이 있습니다.

지원되는 모델

선형 회귀

선형 회귀(링크가 새 창에서 열림)(최소 자승 회귀 또는 OLS라고도 함)는 예측과 예측 대상 사이에 선형 관계가 있는 하나 이상의 예측자가 있고 이러한 예측자가 동일한 기본 조건의 영향을 받지 않으며 동일한 데이터의 두 인스턴스를 나타내지 않는 경우(예: 달러와 유로로 표시되는 매출)에 사용하는 것이 가장 좋습니다. 선형 회귀는 Tableau의 예측 모델링 함수에 대한 기본 모델입니다. 모델을 지정하지 않으면 선형 회귀가 사용됩니다. 테이블 계산의 첫 번째 인수로 "model=linear"를 포함하여 이 모델을 명시적으로 지정할 수 있습니다.

예:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

정규화된 선형 회귀

정규화된 선형 회귀(링크가 새 창에서 열림)는 두 개 이상의 독립 변수 간에 근사적인 선형 관계가 있는 경우에 사용하는 것이 가장 좋습니다. 다중공선성(링크가 새 창에서 열림)이라고도 하는 이 관계는 실제 데이터 집합에서 자주 관찰됩니다. 기본 선형 회귀 대신에 이 모델을 사용하려면 테이블 계산의 첫 번째 인수로 "model=rl"을 포함하십시오.

예:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

가우스 프로세스 회귀

가우스 프로세스 회귀(링크가 새 창에서 열림)는 시간 또는 공간과 같은 연속 도메인에서 예측을 생성하는 경우 또는 변수와 예측 대상 간에 비선형 관계가 있는 경우에 사용하는 것이 가장 좋습니다. Tableau의 가우스 프로세스 회귀에는 반드시 정렬된 단일 차원이 예측자로 있어야 하며, 정렬되지 않은 여러 차원이 예측자로 포함될 수 있습니다. 측정값은 Tableau의 가우스 프로세스 회귀에서 예측자로 사용할 수 없습니다. 기본 선형 회귀 대신에 이 모델을 사용하려면 테이블 계산의 첫 번째 인수로 "model=gp"를 포함하십시오.

참고: 정렬된 차원은 MONTH와 같이 값을 차례로 배열할 수 있는 모든 차원입니다. 정렬되지 않은 차원은 성별 또는 색상과 같이 값에 고유한 순서가 없는 모든 차원입니다.

예:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


간단한 추론법으로 아래 기준을 사용하여 모델을 선택할 수 있습니다.

  • 선형 회귀(기본값): 예측자가 하나만 있고 해당 예측자가 대상 메트릭과 선형 관계를 갖는 경우 사용합니다.

  • 정규화된 선형 회귀: 여러 예측자가 있는 경우, 특히 해당 예측자가 대상 메트릭과 선형 관계를 가지며 유사한 기초 관계 또는 추세의 영향을 받을 가능성이 있는 경우 사용합니다.

  • 가우스 프로세스 회귀: 시간 또는 공간 예측자가 있거나 대상 메트릭과 선형 관계를 갖지 않을 수 있는 예측자를 사용하는 경우 사용합니다.

피드백을 제공해 주셔서 감사합니다!