この記事は2年以上前の投稿になります。
記載された情報が古くなっている可能性がございますので十分ご注意ください。
記載された情報が古くなっている可能性がございますので十分ご注意ください。
すでに utf-8 なバイト列を latin-1 と解釈してしまい utf-8 に二重エンコードすることで起きる文字化けの現象です。
かつては「YouTube」などでも多数発生していました。
WEBサイトのデータ(HTML)を取り込むサービスなどでは、この現象が発生する場合がある。
これは、データに埋め込まれた「Charset」を判別しているシステムが多い為で、メタ情報を強制的に読み込ませることで解消できる場合がある。
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
ていうか、ちゃんとメタタグ付けようよ。。。