▶︎ LOD (Level of Detail)
LOD를 사용하면 계층 구조로 이루어진 차원값의 데이터를 다양한 수준으로 집계하여 볼 수 있다.
이를테면 상위 카테고리와 하위 카테고리가 동시에 뷰에 위치하여 집계가 하위 카테고리 수준에서 이뤄질 때,
LOD를 통해 하위 카테고리를 무시하고 상위 카테고리 수준에서 데이터를 집계하여 볼 수 있다는 것이다.
Sample Superstore 데이터를 이용해 Category, SubCategory별 Sales를 나타냈다.
위의 그림처럼, 나타난 수치들은 SubCategory별로 집계된 Sales이다.
이 표를 이용해서 LOD 표현식에 따른 값의 변화를 확인해 볼 예정이다.
1. FIXED LOD
FIXED는 특정 필드만을 고려해 값을 집계한다.
위의 수식처럼 Category를 사용해 FIXED 표현식을 작성하게 되면,
SubCategory를 제외하고 Category만을 사용해 값을 집계하게 된다.
위의 그림처럼 FIXED를 통해 Category만을 사용해 값을 집계하면,
같은 Category에 속한 SubCategory들의 데이터가 모두 동일한 것을 볼 수 있다.
Furniture의 경우, SubCategory인 Bookcases, Chairs, Furnishings, Tables의 수치가
모두 더해진 754,748이 결과로 반환되는 것이다.
2. EXCLUDE LOD
EXCLUDE는 현재 뷰에서 특정 필드를 제외하고 값을 집계한다.
위의 수식처럼 SubCategory를 사용해 EXCLUDE 표현식을 작성하게 되면,
SubCategory를 제외하고 값을 집계하게 된다.
위의 그림처럼 EXCLUDE를 통해 SubCategory를 제외하고 값을 계산하면,
FIXED를 통해 Category만을 사용해 값을 집계한 것과 같은 결과가 나온다.
SubCategory를 제외하면 Category만 남게 되니 어찌보면 당연한 결과기도 하다.
3. INCLUDE LOD
INCLUDE는 현재 뷰에서 특정 필드를 포함하여 값을 집계한다.
INCLUDE의 사용 예시를 잘 보여주기 위해서 평균을 사용했다.
위의 수식처럼 SubCategory를 사용해 INCLUDE 표현식을 작성하게 되면,
SubCategory가 뷰에 존재하지 않더라도 이를 추가해 계산하게 된다.
위의 그림은 SubCategory가 뷰에 존재하는 경우이다.
이 경우, INCLUDE 표현식으로 계산한 결과와 그냥 평균을 계산한 결과가 같다.
이는 뷰에 이미 SubCategory가 존재하여, 결과에 반영이 되었기 때문이다.
그러나, 위의 그림처럼 SubCategory가 뷰에 존재하지 않는 경우,
INCLUDE 표현식으로 계산한 결과와 그냥 평균을 계산한 결과가 다르다.
Furniture Category의 경우를 주목해보면,
그냥 평균을 구하는 식은 SUM[Sales] / COUNT[Sales] = 343이 된다.
그러나, INCLUDE를 통해 평균을 구하는 식은,
첫번째 그림에서 SubCategory별로 구해진 평균을 모두 더해서 4로 나눈 것이 된다.
즉 Bookcase, Chairs, Furnishings, Table의 평균을 다 더하고, 4로 나눠서
497 + 530 + 95 + 638 / 4 = 440이 되는 것이다.
** 셀프로 예시를 만들어보다 보니, 귀여운 오류가 있을 수 있습니다,, **