728x90
'Hot'
Update
- 주식 데이터를 활용한 파이썬 데이터 분석_3주차 개발일지 3주 차... 코드는 반복하는 게 맞는 거 같은데... 자꾸 복붙 하라네.... DART에서 오픈API 받는법 !pip install dart-fss Dart-fss 라이브러리 설치 import dart_fss as dart_fss import pandas as pd api_key = '2bca0de6d04cd8f3b74f378f9fb69e6cf22888c9' dart_fss.set_api_key(api_key=api_key) corp_list = dart_fss.get_corp_list() corp_list.corps Dart의 OpenAPI를 발급받고, 키넣기 all = dart_fss.api.filings.get_corp_code() all[0] 전체 종목을 보는 코드 df = pd.DataFram..
- 주식 데이터를 활용한 파이썬 데이터 분석_2주차 개발일지 주식데이터 사용 데이터 분석 시작 해외주식 다루기 - FinanceDataReader !pip install finance-datareader FinanceDataReader 라이브러리 설치 pandas 라이브러리 설치 numpy 라이브러리 설치 def make_rate(code): df = fdr.DataReader(code, '2017') original = df[['Close']].iloc[0] df = df[['Close']] / original -1 return df['Close'] 수익률 구하기 함수(종목티커넣기) 2017년부터 현재까지 'code' 종목데이터 = df에 담기 종가데이터 처음 꺼 = original에 담기 현재 종가 데이터 / 종가데이터 처음꺼 담은 original을 나누기 -..
- 마케터, 기획자를 위한 실전 데이터 분석_2주차 개발일지 구글 스프레드시트로 분석해 봤던걸 파이썬으로 분석해 보게 됐다. 브라우저 에디터 코랩도 사용하게 됐고, 파이썬에 대해 조금 배우고 시작했다. import pandas as pd 분석에 필요한 판다스라이브러리도 필요해 import 해서 사용했고, import matplotlib.pyplot as plt 그래프를 위한 matplotlib도 사용했고, titanic = pd.read_table('train.csv',sep=',') titanic.head() 엑셀파일 가져오는 법 알게 됐고, titanic = titanic.dropna() 데이터중 공백데이터 확인과, 제거하는 법 배웠고, corr = titanic.corr(method='pearson') corr 상관관계 구하는 법해봤고, corr = corr..
- 마케터, 기획자를 위한 실전 데이터 분석_1주차 개발일지 데이터 분석이란 하고자 하는 바에 대한 "명확한 근거"를 줄 수 있게 도와주는 도구. 데이터 분석 자료가 많은 kaggle 사이트...(캐글은 데이터 사이언티스트들에게 아주 유명한 커뮤니티 플랫폼이다. 우리가 쉽게 구할수 없는 기업들의 다양하고 재미있는 자료들이 많다.) 앞으로 자주갈거같은 예감이... 타이타닉 사연으로 데이터 분석을 해봤다. (가공된 타이타닉 데이터 https://s3.ap-northeast-2.amazonaws.com/materials.spartacodingclub.kr/data/week1/exceltrain.csv ) 출처: titanic kaggle Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 스프레드시트.. ..
- 주식 데이터를 활용한 파이썬 데이터 분석_1주차 개발일지 웹 스크래핑 colab사용시 라이브러리 설치 명령어 앞에 "!"를 붙인다. 예를 들면, !pip install bs4 requests 라이브러리 requests로 요청하고 가져온다 , bs4로 추출해서 분석하기 좋게 만듦! 예시, import requests from bs4 import BeautifulSoup from openpyxl import Workbook from datetime import datetime 스크래핑과 엑셀사용에 필요한 라이브러리 가져오고 def get_news(keyword): 함수 사용으로 여러 개를 가져올 수 있게 하고 wb= Workbook() (새로운 엑셀파일을 만들거나, 기존의 엑셀파일을 사용할때 쓰는 코드)(지금은 파일을 지정안했으니 새로 만드는거) sheet = w..