본문 바로가기
Dev

[colab] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte

by 호랑2 2023. 2. 18.

colab 에서 csv 파일을 읽으려고 아래와 같이 시도하면 오류가 발생한다.

해당 오류가 발생하는 이유는 csv 파일을 utf-8 형태로 바로 읽어올 수 없기 때문이다.

 

해당 오류의 해결책은 3가지 인데, 첫번째는 코드를 읽어올 때 'r' 대신 'rb' 를 적용해 바이너리 형태로 불러오는 것이다.

두 번째는 csv_reader 함수를 사용해서 csv 파일을 읽어오는 것이다.

세번째는 open 시점에 인코딩을 설정해주고 에러는 ignore 처리 하는 것이다.

'Dev' 카테고리의 다른 글

P-Tuning  (0) 2023.02.22
LSTM  (0) 2023.02.21
[ChatGPT] ChatGPT is at capacity right now  (0) 2023.02.16
[POSTMAN] Error: getaddrinfo ENOTFOUND  (0) 2023.02.15
[Python] 라이브러리 import 오류  (0) 2023.01.25

댓글