何か着ていればいいよ

ソフトウェア技術者の日常や技術の話を書こうと思います。

メールが文字化けするのは仕方ない

最近、メールを受信してその中身を解析し、その結果に応じて
また次の処理を行うというアプリケーションをいじっています。
その中で思ったのが表題の件。

ドロドロした部分は(特にMS製の)メーラーが何とかしてくれていた。

*1はメールが文字化けするとかって結構良くあったんですが、最近はさほど感じません。
*2

で、なめていました。文字化け。
最近あまり見ないし、メールって枯れてきているからもう文字化けなんてならないんだろう。
なんて少しでも思ったのが馬鹿だった。

実際流れているデータを解析する処理を書くと、電文内のcharsetなんて何も信じられない。
適当というかフリーダムな状況。
文字化けは全てメーラーがよしなに解釈してくれていただけだったんだな…。

日本語の含まれるメールは魔境

自分が扱っているのは特定の形式のメールだけというはずだったのに、全然対応しきれない。
今の時点でどうもあちらをたてたらこちらがたたずみたいな、
フリーダムなものから人間の解釈出来るものによしなに持っていく…。
そんな、先の見えない作業をやっています。
そして、こう思った。
『もう、お前らメールを日本語で送ってくんな!』

同じ電文の中に色んなcharsetとencodeが入り乱れて、さらにそのうちなんぼかが嘘っぱち。 とか、こりゃひどい。
むしろ、このようなヘドロのようなデータを濾過して人間に見せているメーラーってすごいんだな。*3

*1:10年以上前かな?

*2:それでもたまにありますが

*3:自分のまわりであまり良い評判を聞かないWindows Live Mailだって何気に凄い!