Coding/Python Matlab
CP-949 한글 인코딩
smores
2022. 2. 13. 15:35
아래 코드를 실행시켰더니,,, unicode에러가,,,,,
import graphviz
with open("tree.dot") as f:
dot_graph = f.read()
display(graphviz.Source(dot_graph))
cp949 코덱으로 인코딩 된 파일을 읽어들일때 발생하는 에러입니다.
UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 144: illegal multibyte sequence
인코딩을 utf-8로 바꿔주시면 됩니다.
open("tree.dot",encoding='UTF-8')
----------
CPC949 인코딩을 UTF-8 변환
S.decode('cpc949').encode('utf-8')
위의 방식으로는 오류문자열을 처리할 수 없으므로
unicode(S, 'cpc949', errors='ignore').encode('utf-8')
출처: https://dm4ir.tistory.com/147 [data mining for information retrieval]
--------------