아래 코드를 실행시켰더니,,, unicode에러가,,,,,
import graphviz
with open("tree.dot") as f:
dot_graph = f.read()
display(graphviz.Source(dot_graph))
cp949 코덱으로 인코딩 된 파일을 읽어들일때 발생하는 에러입니다.
UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 144: illegal multibyte sequence
인코딩을 utf-8로 바꿔주시면 됩니다.
open("tree.dot",encoding='UTF-8')
----------
CPC949 인코딩을 UTF-8 변환
S.decode('cpc949').encode('utf-8')
위의 방식으로는 오류문자열을 처리할 수 없으므로
unicode(S, 'cpc949', errors='ignore').encode('utf-8')
출처: https://dm4ir.tistory.com/147 [data mining for information retrieval]
--------------
'Coding > Python Matlab' 카테고리의 다른 글
for... else... (nested loop break out) (0) | 2022.07.26 |
---|---|
PyPDF2 PDF split, merge (0) | 2022.03.28 |
Matlab surface plot (0) | 2022.02.09 |
파이썬 비주얼스튜디오 실행출력 별도의 콘솔윈도우에 (0) | 2021.07.16 |
파이썬 UTF-8 (0) | 2021.07.15 |