メールが文字化けするのは仕方ない
最近、メールを受信してその中身を解析し、その結果に応じて
また次の処理を行うというアプリケーションをいじっています。
その中で思ったのが表題の件。
ドロドロした部分は(特にMS製の)メーラーが何とかしてくれていた。
昔*1はメールが文字化けするとかって結構良くあったんですが、最近はさほど感じません。
*2
で、なめていました。文字化け。
最近あまり見ないし、メールって枯れてきているからもう文字化けなんてならないんだろう。
なんて少しでも思ったのが馬鹿だった。
実際流れているデータを解析する処理を書くと、電文内のcharsetなんて何も信じられない。
適当というかフリーダムな状況。
文字化けは全てメーラーがよしなに解釈してくれていただけだったんだな…。
日本語の含まれるメールは魔境
自分が扱っているのは特定の形式のメールだけというはずだったのに、全然対応しきれない。
今の時点でどうもあちらをたてたらこちらがたたずみたいな、
フリーダムなものから人間の解釈出来るものによしなに持っていく…。
そんな、先の見えない作業をやっています。
そして、こう思った。
『もう、お前らメールを日本語で送ってくんな!』
同じ電文の中に色んなcharsetとencodeが入り乱れて、さらにそのうちなんぼかが嘘っぱち。
とか、こりゃひどい。
むしろ、このようなヘドロのようなデータを濾過して人間に見せているメーラーってすごいんだな。*3