본문 바로가기

데이터분석5

[태블로 13기 신병 훈련소] 2주차 회고 2주차 어떤 내용을 다루었는가? 6일차 : LOD 표현식 7일차 : 다양한 시각화 (범프차트, 워터폴 차트, 퍼널 차트), 대화형 필터 8일차 : 동작을 사용한 대시보드 상호작용 , 집합 9일차 : 효과적인 시각화를 작성하기 위한 다양한 방법 10일차 : Tableau Prep Builder를 이용한 데이터 전처리 새롭게 배운 내용이 있다면? LOD 태블로는 보이는 시각화(뷰)를 기준으로 집계한다. 그 기준이 아닌 다른 차원의 집계가 필요할 때 사용하는 것이 세부 표현식이다. LOD는 크게 FIXED, INCLUDED, EXCLUDED로 구성되어 있다. LOD 가 자주 사용되는 경우 1. 고객 당, 주문 당 등 '~당' 계산이 필요한 경우 2. 집계를 다시 한번 더 집계해야 하는 경우 3. 집계 결과를 .. 2022. 4. 6.
[태블로 13기 신병 훈련소] 1주차 회고 1주차 어떤 내용을 다루었는가? 1일차: 태블로 개요, 차원과 측정값의 차이 2일차: 행과 열, 마크의 개념, 계산된 필드 만들기 3일차: 매개 변수 사용, 대시보드 동작 적용하기 4일차: 하이라이트 테이블 , 다양한 시각화 맵(덤벨차트) 5일차: 지리 정보 시각화, 배경 이미지를 이용한 Custom Map 사용하기 새롭게 배운 내용이 있다면? 차원과 측정값 차원과 측정값을 범주,명목형 변수, 수치형 변수라고 단순히 이해하고 있었다. 그러나 데이터 특성으로 인지를 하는 것보단 시각화에서 어떻게 적용되는 지를 알고 있는 게 중요하다는 걸 느꼈다. 측정값은 숫자 형식이고 사용자가 선택하는 집계(sum, average)에 따라 차트를 만들게 된다. 차원은 그 숫자들로만 만들어진 차트를 어떻게 나눠서 볼 것인지.. 2022. 4. 2.
제 24회 ADP 실기 복기 나는 얼마나 준비되어 있는 사람이었는가? 1번 떨어진 경험이 있어 스터디를 구해 약 4개월 간, 주 1회 2시간씩 코드를 공유하는 시간을 가졌다. 주로 공부한 책에는 '파이썬 머신러닝 완벽 가이드', '파이썬 라이브러리를 활용한 머신러닝', '파이썬 비즈니스 통계분석' 이 있다. 그리고 ADP 범위를 주제로 요약, 코드 정리하여 제본한 결과 무려 700페이지가 나왔다. 그럼에도 시험장에 가보니 부족함을 느꼈다..(..) 문제를 보면 어느 점을 물어보는 건지 파악할 수 있고, 그에 따른 세부 플랜이 머리에 착착 그려지는 정도로 시험장에 향했다. 문제를 어떻게 접근하고 풀어냈는지? 1번,2번 기계학습 문제 데이터(추정) https://archive.ics.uci.edu/ml/datasets/student+p.. 2022. 3. 30.
[MySQL] 한 행 안에 있는 문자열 여러 개를 행으로 분리하기 이렇게 생긴 테이블을 이렇게 바꾸는 방법!! 우선 모범 답안을 보고 코드를 뜯어보자. select tb.drama, substring_index(substring_index(tb.names, "$", numbers.n), "$" , -1) as name from ( select 1 as n union all select 2 union all select 3 union all select 4 union all select 5) as numbers inner join tb on char_length(tb.names) - char_length(replace(tb.names, "$", "")) >= numbers.n - 1 order by tb.drama 어떻게 문자열을 쪼갤까? drama names 구경이 이.. 2022. 1. 14.