분류 전체보기27 데이터 분석 (EDA 과정 정리) 캐글 대회를 구경하다 양질의 EDA 정리를 발견했다 https://www.kaggle.com/snowpea8/osic-eda-efficientnet-quantile-reg OSIC🩺EDA & EfficientNet & Quantile Reg Explore and run machine learning code with Kaggle Notebooks | Using data from efficientnet www.kaggle.com 1. 데이터 형태 확인 print("train_data shape:", train.shape) print("test_data shape:", test.shape) 2. 결측값 처리 train.isnull().sum() test.isnull().sum() 3.중복 데이터 처리 3-1.. 2021. 10. 6. 파이썬 막대그래프가 히스토그램처럼 붙어있는 현상 수학등급에 따른 학생 수 그래프를 그리고 있었다. 그런데 막대그래프가 이 꼬라지인 것을 발견! 당황해서 막대 너비도 조절해보고 별의별짓거리를 하다가 원인을 찾았다. 범주형으로 인식되어야 할 칼럼이 "숫자형" 으로 지정되어있기 때문이었다. 숫자형으로 되어있다보니 bar 차트를 사용해도 저절로 히스토그램처럼 반영된듯하다. data = data.astype({"수학등급":str}) 문자형으로 바꿔주면 잘 된다 ~ (레이블 개수가 바뀐건 중간에 조건을 걸어놨기때문에 그렇다. 해결과정과는 관련없다) 똑같은 조건으로 컬럼 조건을 바꿨을 땐 잘만 나와서 당황하느라 좀 고생을 했다 . -_-.. 아무래도 한 레이블에 0 값이 들어가 있어서 저렇게 인식된 것 같다.!! 2021. 10. 2. 데이터 분석의 논리적 모순 가능성 https://blog.ncsoft.com/game-data-analytics-20200820/ PK를 당한 유저는 게임에서 이탈할까? 'PK(Player Killing)가 게임 유저의 이탈에 미치는 인과 효과 분석 blog.ncsoft.com A 사람 (흡연 : O, 나이: 22, 매주 운동시간 : 2, 석면 노출 정도 : 하루 1시간) - A 집단 (흡연 O) B 사람 (흡연 : X, 나이: 22, 매주 운동시간: 2, 석면 노출 정도 : 하루 1시간) - B 집단 (흡연 X) 이렇게 동일하게 맞춰줘서 흡연만이 폐암 여부를 판단하는 데 사용될 수 있도록! 참고 : https://greend93.tistory.com/3 2021. 8. 30. [프로그래머스 SQL 문제] 루시와 엘라 찾기 https://programmers.co.kr/learn/courses/30/lessons/59046 코딩테스트 연습 - 루시와 엘라 찾기 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디 programmers.co.kr 너무 쉬운 문제여서 한 번에 정답이긴 했지만, 어떤분이 정규식으로 찾는 걸 보았다! 생각 못했던 부분이라 짚고 넘어가는 걸로!! 정규식 함수 => 표준 구문 규칙을 사용하여 문자열 데이터의 간단한 패턴 및 복잡한 패턴을 검색하고 조작할 수 있으며, 자연.. 2021. 8. 25. 이전 1 2 3 4 5 6 7 다음