Coding/Python Matlab

CP-949 한글 인코딩

smores 2022. 2. 13. 15:35

아래 코드를 실행시켰더니,,, unicode에러가,,,,,

import graphviz

with open("tree.dot") as f:
    dot_graph = f.read()
display(graphviz.Source(dot_graph))
 

cp949 코덱으로 인코딩 된 파일을 읽어들일때 발생하는 에러입니다.

UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 144: illegal multibyte sequence
인코딩을 utf-8로 바꿔주시면 됩니다.

open("tree.dot",encoding='UTF-8')


----------

CPC949 인코딩을 UTF-8 변환

S.decode('cpc949').encode('utf-8')


위의 방식으로는 오류문자열을 처리할 수 없으므로 

unicode(S, 'cpc949', errors='ignore').encode('utf-8')



출처: https://dm4ir.tistory.com/147 [data mining for information retrieval]

--------------

'Coding > Python Matlab' 카테고리의 다른 글

for... else... (nested loop break out)  (0) 2022.07.26
PyPDF2 PDF split, merge  (0) 2022.03.28
Matlab surface plot  (0) 2022.02.09
파이썬 비주얼스튜디오 실행출력 별도의 콘솔윈도우에  (0) 2021.07.16
파이썬 UTF-8  (0) 2021.07.15