Dev

[colab] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte

호랑2 2023. 2. 18. 22:55

colab 에서 csv 파일을 읽으려고 아래와 같이 시도하면 오류가 발생한다.

해당 오류가 발생하는 이유는 csv 파일을 utf-8 형태로 바로 읽어올 수 없기 때문이다.

 

해당 오류의 해결책은 3가지 인데, 첫번째는 코드를 읽어올 때 'r' 대신 'rb' 를 적용해 바이너리 형태로 불러오는 것이다.

두 번째는 csv_reader 함수를 사용해서 csv 파일을 읽어오는 것이다.

세번째는 open 시점에 인코딩을 설정해주고 에러는 ignore 처리 하는 것이다.