Coding/Python Matlab

Python: UTF-8 한글코드를 TG 조합형으로 변환

smores 2023. 12. 7. 13:56

 

파이썬으로 하니 이렇게 쉬울수가 ㅠㅠ  (미쳤다! 라는 감탄만 나온다)

 

핵심은

 

1. jamo 라이브러리 덕분에 한 글자를 쉽게 초, 중, 종성으로 분리 가능

 

2. 조합형 초,중,종성 테이블을 그냥 스트링으로 만들어 두어도 find() 함수로 바로 인덱스를 얻을 수 있다는 점

 

3. 초중종성 인덱스 3개를 5비트 바이너리 스트링으로 만들고, '1' + 초 + 중 + 종 16비트 바이너리를 반으로 잘라서 그냥 정수로 변경해서 정수 리스트에 다 넣어버린 후, bytes() 로 바이트 어레이로 만들면 변환 끝

 

(아직은 정교하게 변환은 못하는 버전이지만 간단히 도트매트릭스 출력 에뮬레이션 추억놀이용으로 쓰려고 만듬)

 

ks2tg.py
0.00MB
ksutf8.txt
0.00MB
johap.txt
0.00MB