데이터 분석이란
하고자 하는 바에 대한 "명확한 근거"를 줄 수 있게 도와주는 도구.
데이터 분석 자료가 많은 kaggle 사이트...(캐글은 데이터 사이언티스트들에게 아주 유명한 커뮤니티 플랫폼이다. 우리가 쉽게 구할수 없는 기업들의 다양하고 재미있는 자료들이 많다.)
앞으로 자주갈거같은 예감이...
타이타닉 사연으로 데이터 분석을 해봤다.
(가공된 타이타닉 데이터
https://s3.ap-northeast-2.amazonaws.com/materials.spartacodingclub.kr/data/week1/exceltrain.csv )
출처: titanic kaggle
스프레드시트.. 가끔 사용해 보긴 했지만
(구글 스프레드 시트 바로가기 : http://sheet.new/ )
스프레드 시트 사용법
1.파일 → 가져오기 클릭
2. 파일 가져오기 → 업로드 → 다운로드한 파일 업로드
데이터 표 살펴보기
1. 요금과 생존이 관계가 있는가?
요금과 생존률의 상관관계확인하기, 관계가 있다면 왜 그런지 파악하기.
이 과정을 '데이터 전처리'라고 한다.
공백제거하기
깔대기 아이콘 클릭 --> 새 필터 보기 만들기 클릭
공백 있는 행을 선택해서 공백 옵션을 해제해준다.
숫자가 있는 영역을 클릭하고 필터를 걸어준다.
정리하면,
데이터 분석 기본 세팅은 3단계로 진행된다.
1. 데이터를 가져온다.
2. 데이터 표를 확인하고 어떤 부분을 볼지, 고려할 사항은 없는지 생각한다.
3. 원하는 형태로 데이터를 다듬는다. (전처리 한다.)
분석 도구 사용하기
엑셀도 그렇지만 간단한 사용법밖에 몰랐어서.... 생각지도 못한 걸 배운 느낌~
확장 프로그램 --> 부가기능 설치하기 --> 검색창에서 'analysis toolpak' 검색 --> XLMiner Analysis ToolPak 설치
확장 프로그램 --> xlminer analysis toolpak 클릭 --> start 버튼 누르기 --> Correlation(상관관계 분석) 버튼 누르기 --> Input 범위설정, Labels in
First Row 클릭, Output 범위 설정
분석 결과 나오면 차트로 시각화하기
범위 지정 --> 삽입 --> 차트 --> 차트 편집기 --> 행, 열 전환 해제 --> 기준이 되는 항목 제외하고 삭제 --> 맞춤설정에서 데이터 라벨 클릭 (차트에 수치를 표시함)
차트 보는 법
음수, 양수와 상관없이 숫자가 클수록 상관관계가 큰 편이라고 생각하면 된다 한다.
양수일 경우 : 한 변수가 증가함에 따라 다른 변수도 증가하는 경향을 보이는 것
음수일 경우 : 한 변수의 수치가 증가할 때 다른 변수는 감소하는 경향을 보이는 것
데이터 분석하는 방법
1) 문제 정의 및 가설 설정하기 → 2) 데이터 분석 기본 세팅 하기 → 3) 데이터 분석하기 → 4) 분석 결과 시각화 하기 → 5) 최종 결론 내리기
첨으로 데이터 분석이라는 걸 해봤다.
전문적이고 복잡한 데이터로 해본 건 아니지만, 맛보기? 는 되는 거 같다. 어떤 일인지 이해될 정도~
좀 더 해보고 싶다는 생각이 든다~
끝까지 해보자~
'교육 후기 > 스파르타코딩클럽_개발일지' 카테고리의 다른 글
주식 데이터를 활용한 파이썬 데이터 분석_3주차 개발일지 (0) | 2023.09.20 |
---|---|
주식 데이터를 활용한 파이썬 데이터 분석_2주차 개발일지 (0) | 2023.09.10 |
마케터, 기획자를 위한 실전 데이터 분석_2주차 개발일지 (0) | 2023.09.10 |
주식 데이터를 활용한 파이썬 데이터 분석_1주차 개발일지 (0) | 2023.09.03 |
댓글