Coding/Python Matlab

아나콘다, 선형회귀분석

smores 2017. 6. 13. 03:00

윈도우10 64비트에서 python 2.7.13 사용중 아무래도 numpy, scipy 등의 여러가지 라이브러리를 사용해야 할 필요성을 느낌.


문제는 numpy 는 zip된 설치프로그램을 받아서 setup.py 로 잘 설치를 했는데 scipy 는 에러가 나고 matplotlib 는 설치 프로그램을 다운받을 수 없었다.


주식 분석 등의 목적으로 선형회귀분석을 하려고 하는데 이것까지 다 생코드로 짜기도 그렇고, 앞으로 machine learning 등을 연습하기 위해서라도 아예 pandas, anaconda 같은 패키지를 사용해 보기로 함. 


기존에 64비트 python 2.7.13 설치된 상태 (pillow, numpy, xlrd 등이 설치되어 있음) 에서 anaconda 설치 후 scipy를 사용하려 해 보니까 C:\Users\myuserID\AppData\Local\Continuum\Anaconda2 에 역시 python이 설치되어 있어서 이놈을 사용해야 그 하위에 들어있는 라이브러리들을 다 사용할 수 있었다. 그래서 기존 C:\Python27 패스는 모두 제거후 사용 시작.


간단한 선형회귀분석 예제


D:\>python

Python 2.7.13 |Anaconda 4.4.0 (64-bit)| (default, May 11 2017, 13:17:26) [MSC v.1500 64 bit (AMD64)] on win32

Type "help", "copyright", "credits" or "license" for more information.

Anaconda is brought to you by Continuum Analytics.

Please check out: http://continuum.io/thanks and https://anaconda.org

>>> from scipy import stats

>>> x=[3.52,2.58,3.20]

>>> y =[2.48,2.27,2.53]

>>> slope,intercept,r,p,stderr = stats.linregress(x,y)

>>> r

0.86602540378443904

>>> p

0.3333333333333327

>>> slope

0.24999999999999994

>>> intercept

1.6516666666666664

>>> stderr

0.14433756729740616

>>>