반응형

Coding/Python Matlab 80

PDF 파일에서 텍스트 추출 - slate

스마트폰의 ebook reader 들을 이용해서 책이나 인터넷에서 갈무리한 글을 읽기를 즐기는 편이다. 텍스트 파일의 경우는 GoodReader 를 오랜기간 사용해 왔다. 간혹 영문 소설을 인터넷에서 PDF 로 받아오는 경우 현재 사용하고 있는 iPhone4s 3.5인치의 작은 화면에서는 글자가 작아서 읽기가 무척 불편하다. 그렇다고 글자가 잘 보일 만큼 확대해 놓고 페이지를 왔다 갔다 스크롤 하는 것도 무척 불편하다. 때문에 소설 같은 것은 그냥 텍스트만 추출해서 텍스트파일로 바꾸어서 읽으면 싶을 때가 많다. 오랫만에 Python 으로 이런 일을 할 수 있을 것 같아서 인터넷을 조금 찾아보니 쉽게 답이 나온다. Slate 라는 모듈. https://pypi.python.org/pypi/slate 리눅스..

Python Algorithmic Trading

http://gbeced.github.io/pyalgotrade/ stock trading 알고리즘 개발 및 시뮬레이션에 괜찮아 보이는 라이브러리. 사용법을 공부하면서 배운 내용을 정리하려 함. 기본적으로 파이썬 2.7 을 사용하고, 윈도우즈에 직접 설치하기가 그래서 Virtualbox Lubuntu 15.10 에 설치하여 테스트 해 보기로 하였다. 사용하는 에디터는 geany 로 하였고, 설치는 간단히 pip install pyalgotrade 로 되질 않아서 모듈별로 개별적으로 설치했음. (LinuxMint 17.3 Mate 에서도 동일한 문제 발생) 순서는 1) sudo apt-get install python-pip 2) http://gbeced.github.io/pyalgotrade/downlo..

한글 포함된 웹사이트 스크래핑시

기본으로 python 2.7 대를 쓰고 있기에 한글 코딩과 관련한 어려움이 많다.간단히 이를 우회하기 위한 방법으로 1) OS는 윈도우즈가 아닌 리눅스(우분투) 사용2) 에디터는 geany3) 코드 첫줄에 UTF-8 선언 4) 그리곤 그냥 한글 단어를 일반 스트링처럼... 예제---------------------#-*- coding: utf-8 -*-import urllib as ur link='http://www.subkorea.com/xe/index.php?mid=baduk_changho&page=1'f=ur.urlopen(link)s=f.read()f.close()#print (s)#exit()p1=s.find('추천')p2=s.find('전체',p1)#print p1, p2s1=s[p1:p2]s..

파이썬을 쓰게 되는 이유

오랜 세월 컴퓨터를 이용하다보니 잘은 못하지만 이것 저것 프로그래밍 언어를 사용해 보았다. 특히 과학기술분야에서의 수치 계산 및 그래프 출력 등을 위해서 Matlab도 다루어 보았는데 사회생활을 시작하면서 개인적으로는 Matlab을 더이상 사용할 길이 없어서 (불법이 아닌 이상에야...) 대체 무료 소프트웨어를 이것 저것 찾던 중 Octave, Scilab 등을 만났었고, 이후 웹 데이터 (주식 관련) 다룰 일이 생겨서 Java, Perl, Python 등을 저울질하다가 파이썬의 막강한 라이브러리들과 (Perl 도 만만치 않지만...) 문법 및 코드 indentation 스타일 등이 나와 잘 맞는 것 같아서 현재는 대다수의 간단한 작업에는 파이썬을 주로 사용하게 되었다. 아직도 풀 패키지 소프트웨어 등을..

linux distro summary

http://distrowatch.com/ 을 가면 현존하는 대다수의 리눅스 디스토로들에 대한 정리와 순위 등을 볼 수 있다. 좋기는 한데 비교 검색을 위해서 엑셀 시트 등으로 정리가 된 것이 있으면 싶을 때가 많다. 개인적으로 이것 저것 시도를 하다 보니 아무래도 가장 많이 사용해서 익숙해 진 우분투 계열의 변형이 이것 저것 해 보기가 쉽기 때문에 계열별로 정리가 된 자료가 있으면 싶다는... 그래서 간단히 파이썬 코드로 이를 만들어 보았다. 먼저 상기 홈페이지 소스를 받아서 일단 배포본들의 이름만 간단한 수작업 (에디트플러스의 find/replace 명령 - regular expression 기능 활용 - 위주로 해서)으로 뽑아 놓고 각각의 배포본 정리 페이지를 찾아가서 원하는 요약부분만 뽑아서 .c..

파이썬 - pyglet & avbin

최근 CHIP8 인터프리터를 접하게 되서 조금 공부를 해 보았다. 무척 흥미로운 8비트 가상머신 에뮬레이터이다. 인터넷을 뒤져서 에뮬레이터 소스들을 주욱 모아 본 결과 python 코드로 된 것도 있다. 그래픽과 사운드는 Pyglet 을 사용. 헌데 pyglet 을 조금 테스트하다 보니 MP3 를 돌리질 못한다. 윈도우에서는 된다고 설명이 있는 것 같았는데... 덕분에 AVBIN dll 까지 함께 구해서 Windows\System32 또는 현재 소스가 있는 곳에 함께 넣고 돌리면 되는 것을 확인. 파이썬은 2.7.3 사용중이고 pyglet 과 avbin-win32 가 혹시 필요할 때 다시 찾게 될까 일단 이곳에 등록해 둔다.

728x90