クロール先のサイトに機種依存文字が入っている場合などに発生します 例えば ㈱ などがそれにあたります
㈱
基本は shift_jis を指定していると思いますがその場合は別の文字コードを指定します CP932 を指定します
shift_jis
html = open(url, "r:CP932").read.encode('utf-8')
こんな感じでエラーを回避することができます
0 件のコメント:
コメントを投稿