久しぶりに仕事ではまりました。
ファイルをアップロードして、その日本語名を利用するシステムなのですが、Macも含まれます。
それで、会社からMac miniを借りてダウンロード、アップロード実験をしていたところ、明らかにおかしい挙動があります。
何とかクラブ == 何とかクラブ
これがイコールにならないのです。調べてみたところUTF-8の正規化方法が違うんだそうです。
なんだそりゃ!
Unicode正規化(Wikipedia)
NFCとNFDという二つの方法があって、LinuxとWindowsではNFC。MacはNFDを採用しているらしいです。
NFDは濁点半濁点を一つの文字として扱い、前の文字と合成して表示します。ブラウザは何の問題もなく表示しますが、データ上は異なるので、イコールとはなりません。
PHPでは標準で対応していないので、プラグインを用いることになります。
php-intlというのがそれです。
使い方はヘルプに書かれている通り。
// UTF-8がNFD正規化の場合NFC正規化に変更 if (Normalizer::isNormalized($filename, Normalizer::FORM_D)) { $filename = Normalizer::normalize($filename, Normalizer::FORM_C); }
こんな風にします。
これで問題解決!