전체 글
DATA Sience
-
머신러닝에서 여러 가지 패키지와 라이브러리를 사용해서 삼성전자의 주식을 예측하는 코드를 만들어 보겠습니다. 데이터셋은 주식관련 데이터를 가져올 수 있는 Yahoo Finance에서 불러옵니다. from statsmodels.tsa.arima_model import ARIMA # ARIMA 라는 시계열 패키지를 가져옵니다. import statsmodels.api as sm # 데이터를 전처리 후 회귀분석을 적용해 회귀계수를 구할 수 있게 도와주는 패키지. %matplotlib inline #일반적으로 가장 많이 사용하는 패키지를 가져옵니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import yfinance as yf..
Machine learning을 활용한 삼성전자 주식 예측하기 .머신러닝에서 여러 가지 패키지와 라이브러리를 사용해서 삼성전자의 주식을 예측하는 코드를 만들어 보겠습니다. 데이터셋은 주식관련 데이터를 가져올 수 있는 Yahoo Finance에서 불러옵니다. from statsmodels.tsa.arima_model import ARIMA # ARIMA 라는 시계열 패키지를 가져옵니다. import statsmodels.api as sm # 데이터를 전처리 후 회귀분석을 적용해 회귀계수를 구할 수 있게 도와주는 패키지. %matplotlib inline #일반적으로 가장 많이 사용하는 패키지를 가져옵니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import yfinance as yf..
2021.10.31 -
머신러닝에서 여러 가지 패키지와 라이브러리를 사용해서 코로나19 바이러스 확진자 수를 예측하는 코드를 만들어 보겠습니다. 사용데이터는 github에서 사용할 수 있는 데이터를 url을 통해 가져왔고, 엑셀 파일로 불러와도 상관없습니다. import pandas as pd import plotly.graph_objs as go import plotly.offline as py from fbprophet import Prophet from fbprophet.plot import plot_plotly, add_changepoints_to_plot import numpy as np url = 'https://raw.githubusercontent.com/datasets/covid-19/master/dat..
Machine learning을 활용한 코로나 확진자 수 예측하기.머신러닝에서 여러 가지 패키지와 라이브러리를 사용해서 코로나19 바이러스 확진자 수를 예측하는 코드를 만들어 보겠습니다. 사용데이터는 github에서 사용할 수 있는 데이터를 url을 통해 가져왔고, 엑셀 파일로 불러와도 상관없습니다. import pandas as pd import plotly.graph_objs as go import plotly.offline as py from fbprophet import Prophet from fbprophet.plot import plot_plotly, add_changepoints_to_plot import numpy as np url = 'https://raw.githubusercontent.com/datasets/covid-19/master/dat..
2021.10.26 -
영화 리뷰 데이터에서 단어의 빈도수를 조사하여 가장 빈도가 높은 단어 10개를 출력하는 코드입니다. txtdata = open("ratings_train.txt" , "r" , encoding='UTF8') word_dic={} for review in txtdata : A=review.strip().split("\t") lst_word=A[1].split(" ") for word in lst_word : if word not in word_dic: word_dic[word]=0 word_dic[word]+=1 list_word_freq= sorted(word_dic.items(), key=lambda x:x[1], reverse=True) print(list_word_freq[0:10]) 데이터의 la..
텍스트 리뷰 데이터에서 단어 빈도수 조사하기.영화 리뷰 데이터에서 단어의 빈도수를 조사하여 가장 빈도가 높은 단어 10개를 출력하는 코드입니다. txtdata = open("ratings_train.txt" , "r" , encoding='UTF8') word_dic={} for review in txtdata : A=review.strip().split("\t") lst_word=A[1].split(" ") for word in lst_word : if word not in word_dic: word_dic[word]=0 word_dic[word]+=1 list_word_freq= sorted(word_dic.items(), key=lambda x:x[1], reverse=True) print(list_word_freq[0:10]) 데이터의 la..
2021.09.09