IT/컴퓨터와 한글

컴퓨터에서의 한글 처리 (8) Geany 에디터의 문제점 ?

smores 2013. 5. 5. 11:52

본 카테고리의 지난 마지막 포스트에서 무지막지하게 무식한 삽질을 했었다. 그런 짓을 한 이유는 파이썬으로 웹스크래핑 등을 할때 한글 키로 소스 내용 검색을 하고 싶어서였다. 


지난 포스트에서 언급했던 웹파일(HTML 소스) 다운받아서 바이너리 형식으로 저장하는 코드를 동일하게 우분투와 윈도우즈에서 돌려보았다. 그것도 에디트플러스, Geany, 그리고 터미널에서 파이썬 호출하는 식으로...


먼저 윈도우즈에서는 실행 결과는 세가지 상황에서 완전히 동일하다. 코드는 EUC-KR로 노트패드에서 한글 완전히 잘 보인다. 에디트플러스도 다들 ANSI 코드로 인식한다. 


다음은 우분투에서는 Geany 와 터미널상에서의 파이썬 호출로 직접 실행. 결과는 양쪽 완전 동일. cat 명령으로 터미널 상에서 리스트를 뽑아보면 양쪽 파일 다 한글은 깨져서 안보인다. 당연히 우분투 터미널은 UTF-8 코딩 기본이고 받아온 파일들은 EUC-KR 일것이니까...


헌데 Geany 에디터로 파일들을 열기 시작하면 황당한 일들이 나타난다. 


우선 윈도우즈의 경우...

Geany의 폰트를 한글폰트로 해 놓으면 양쪽 파일 모두 한글이 잘 보인다. 그런데 인코딩 세팅을 체크해 보면 첫번째 사이트 (대법원) 것은 EUC-KR 이라고 체크되어 있는데 두번째 파일 (천리안 홈) 은 UTF-8 이란다.


우분투에 가서는...

따로 폰트 설정 건드린 바 없다. 우분투 기본 영문으로 설치해 놓은 상태이고...

첫번째 파일은 한글 깨지지 않고 잘 보인다. 인코딩 세팅을 보니 EUC-KR 이란다. 두번재 파일은 한글이 다 깨져서 안보인다. 그리고 인코딩 세팅은 Western European - ISO-8859-1 이란다. 


우분투와 윈도우즈에 다운받아진 파일들 끼리 비교해 보면 사이즈도 완전 동일하다. 즉 파일 전송시 코딩이 바뀌거나 하지는 않는다는...


헌데 똑같은 에디터라 생각했던 Geany 가 우분투와 윈도우즈에서 서로 완전히 딴짓을 해 댄다. 이놈 괜찮다고 여겼는데 못쓸놈이다. 영문으로 된 프로그램만 한다면 모를까 아무래도 이녀석은 포기해야 할 모양이다. 멀티플랫폼 지원한다고 해서 기껏 에디트플러스에서 옮겨갈까 한동안 사용했더니만... 


어쨌거나 이 삽질을 시작한 이유가 앞서도 언급한 한글 키 소스 검색인데 프로그래밍 환경의 편의를 위해 에디터에서 직접 코드 실행을 하면서 디버그를 하려 하다가 에디터 때문에 뭔가 큰 혼선이 올 가능성이 있어서 본질적인 일은 조금 뒤로 미루고 헛 삽질을 하고 있는거 같다. :(


일단 우분투는 제쳐 두고 윈도우에서 에디트 플러스로 원래 생각하고 있는 일들을 더 진행해야 하겠다.