최근 관심을 두눈 주제들 중 하나는 web scraping 이다. 몇가지 해보고 싶은 것 중 하나는 조만간 사라질 한국 야후 서비스 중 야후!북 서비스에서 미처 보지 못했던 책들을 나중에 보기 위해 받아두는 것이다. 물론 손으로 하나씩 받아둘 수 있겠지만 컴퓨터를 사용하는 입장에서 이것은 너무도 불합리하기에 파이썬 혹은 펄을 이용하여 자동화하여 받아두는 것을 고려했다. 그런데 막상 시작하고 보니 사이트에서 보여주는 책자(그림파일)들이 페이지 소스내에 바로 나오는 것이 아니라 javascript를 통해서 얻어오는 것이더군... 내 수준에서는 직접적으로 얻을 수 있는 그림 링크라면 받겠는데 이것은 아직 제 수준 밖임. 나름 공부를 한 결과 webkit 라이브러리를 사용해서 내용을 다 받아온 상태에서의 최종 ..