본문 바로가기
데이터 분석/시각화

[태블로 13기 신병 훈련소] 2주차 회고

by gokite 2022. 4. 6.

2주차 어떤 내용을 다루었는가?

6일차 : LOD 표현식
7일차 : 다양한 시각화 (범프차트, 워터폴 차트, 퍼널 차트), 대화형 필터
8일차 : 동작을 사용한 대시보드 상호작용 , 집합
9일차 : 효과적인 시각화를 작성하기 위한 다양한 방법
10일차 : Tableau Prep Builder를 이용한 데이터 전처리

 

 

새롭게 배운 내용이 있다면?

 

LOD

태블로는 보이는 시각화()를 기준으로 집계한다. 그 기준이 아닌 다른 차원의 집계가 필요할 때 사용하는 것이 세부 표현식이다. LOD는 크게 FIXED, INCLUDED, EXCLUDED로 구성되어 있다.

 

LOD 가 자주 사용되는 경우

1. 고객 당, 주문 당 등 '~' 계산이 필요한 경우

2. 집계를 다시 한번 더 집계해야 하는 경우

3. 집계 결과를 기준으로 구간을 나눠야 하는 경우

4. 뷰에서 보고 있는 수준보다 아래 또 위 수준에서 계산 결과를 만들어야 하는 경우

 

 

MAX VS RUNING MAX

둘의 가장 큰 차이는 '누계' 이다.

RUNNING MAX는 파티션에 있는 첫 번째 행에서 현재 행까지 주어진 식의 누계 최대값을 반환한다.

 

 

집합

집합이란 조건을 기반으로 데이터의 하위 집합을 정의하는 필드이다. 지속적으로 필터를 사용하는 경우가 있을 때 집합으로 만들어 처리하면 사용하기 편하다. 집합을 사용하면 여러 측면에서 컨트롤하게 해주어 데이터를 탐색하는데 유용하다.

 

<집합이 자주 사용되는 경우>

1. 집합 및 필터

2. 계층구조

3. 계산 (집합을 필드처럼 사용해서 계산 필드 만들기)

 

 

시각화하면서 던져야 할 질문

1.시각화 목적을 이행하기 위해 포함할 내용을 잘 선별하였는가

2.보고 대상에 맞는 시각화 방법을 선택했는가

3.분석 유형에 가장 적합한 차트 유형을 선택했는가

4.뷰가 직관적으로 방향이 지정되었는지

 (사용자가 데이터를 읽고 인식할 수 있는 방식으로 제공되었는지)

5. 모든 뷰가 하나의 스토리를 보여주도록 서로 잘 맞는지

 

 

어떻게 사용할건지?

 

1. 이상치가 높아 특정하게 높은 집계를 가진 차원을 제외하고 나머지 차원간의 간극이 색으로 잘 나타나지 않을 때, 이를 방지하기 위해 집합을 사용하면 좋을 듯 하다.

 

2.

 

코호트 분석은 아무래도 한 페이지에 많은 정보가 들어가니 시각화가 유용한 것 같다. 이런 이유로 시각화해봤지만 부족한 점이 많다. 계산 필드를 이용해서 더 직관적인 코호트 분석 시각화를 해봐야겠다.

 

 

느낀 점

지난주에는 어떻게 하면 보는 사람이 쉽게 이해할 수 있을지에 대해 집중했다. 반면 이번 주는 어떻게 하면 해당 시각화로 데이터를 쉽게 탐색하고 인사이트를 뽑을 수 있는지에 대해 고민해보았다.

시각화는 단순히 누군가를 설득하기 위한 자료에 불과하다고 생각했었다. 그러나 파이썬에서 EDA를 하는 것처럼 태블로에서도 다양한 데이터 탐색이 가능하다는 걸 느꼈다. 심지어 어느 기능에서는 더욱 강력하고 편리했다.

툴에 대한 쓰임새를 미리 정하지 않고, 유연하게 사용하며 해당 툴의 강점을 잘 이용해야겠다.

 

 

 

 

 

(양질의 강의를 제공해주신 관계자 측에 감사드린다. 너무 즐거웠습니다..!!)

'데이터 분석 > 시각화' 카테고리의 다른 글

[태블로 13기 신병 훈련소] 1주차 회고  (0) 2022.04.02