JapaneseText.mdimporter 0.1

Spotlight インポータ

全文検索には決まり事があるようで、テキストファイルの文字コードシフトJISまたはUTF16で決め打ちされているらしく、日本語EUCUTF-8のテキストファイルに日本語のキーワードは反応しなかった。

決まり事というか、RichText.mdimporter が対応していないだけなので、代わりの MDImporter を書いてみた。本当は http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html みたいに多国語に対応させるほうがかっこいいけど、大変そうなので日本語のみ。M17N じゃなくて L10N
CJKV日中韓越情報処理 エンコーディングの判別はCJKV本に載ってるアルゴリズムのほぼパクり。いまは図書館から借りているんだけど、これはいい本なのでいつか買いたい。買って付録部分と分冊にしたい。