IT/소프트웨어

Capture2Text - 빠른 OCR

smores 2023. 8. 21. 05:28

웹사이트에서 일본어를 볼 경우 텍스트라면 google translate 에 복붙을 하면 꽤 괜찮은 번역을 해 주기에 google translate 사이트를 별도의 윈도우로 띄워 놓고 잘 써먹는다 (이 경우 두개의 모니터 사용 환경이라 편하다). 그런데 만화 같이 이미지로 되어 있는 경우 조금 난감하다. 네이버 Whale 브라우저를 설치해서 파파고 기능을 쓰면 되기는 한데, 그 번역의 질이 좀 불만스러울때가 많다. 그래서 빠른 속도가 필요 없는 경우라면 간단한 파이썬 프로그램을 작성해서 윈도우의 Win+Shift+S 로 이미지 영역에서 글자 부분을 캡춰한 후, 파이썬 프로그램의 버튼을 하나 누르면 클립보드 내용을 이미지 파일로 저장하고, 파이썬의 pyautogui 미케닉 기능을 사용해서 google translate 사이트로 가고, 이미지를 로드하는 식으로 번역을 시켜 보기도 했지만 이 역시 번역 품질이 기대 이하.

 

주말에 다른 방식을 생각하다가 아예 파이썬 manga_ocr 라이브러리를 설치해서 그림으로 저장된 파일의 text 로 변환 후 google translate 에 문자로 붙여서 하는 방법을 시도해 보니 나름 품질은 만족스러운데 OCR 속도가 무척 느리다. 그래서 좀 더 찾아보니 capture2text 라는 무료 OCR 프로그램이 있어서 아예 스크린 캡춰부터 자체 핫키(Win+Q)로 처리해서 text 를 클립보드에 넣어 두고, 이를 google translate 에 autohotkey 를 사용해서 붙이는 방식으로 하면 그럭저럭 속도가 나오는 것 같다. 

 

https://capture2text.sourceforge.net/

 

Capture2Text

JGlossator (Windows) Automatically lookup Japanese words that you have OCR'd with Capture2Text. Supports de-inflected expressions, readings, audio pronunciation, example sentences, pitch accent, word frequency, kanji information, and grammar analysis. Supp

capture2text.sourceforge.net

 

그런데 이 경우도 retrogame 을 하면서 mednafen 에서 띄운 게임 화면의 경우 게임 화면 안으로 마우스 커서가 들어가면 보이질 않아서 capture2text 로 정확히 글자 부분을 따오기가 힘들다. 나름 꼼수로 Win+Shift+S 로 윈도우 스크린 캡춰 모드로 들어가서 마우스 커서를 시작 위치로 옮기고 난 후 ESC 로 취소, 그 상태에서 Win+Q 를 눌러서 capture2text 의 스크린 캡춰 위치 정하는 작업을 시작하면 그런데로 쓸만하다. capture2text 가 클립보드에 이미 있는 내용도 쓸 수 있으면 더 좋았겠건만...