全角カタカナチェックの話

某会員管理システム(うちで作ったものではない)の話。

金融機関からのデータとの連係を始めたところ、更新画面でカナ氏名やカナ住所がエラーチェックに引っかかってしまってデータの更新が出来ないとのこと。

どうも、金融機関のデータというのが、ホストマシン上の半角カナデータを単純に全角に変換しただけで、例えば「ダ」が「タ」+「゛」、「ポ」が「ホ」+「゜」で送られてきている。で、この「゛」や「゜」が「全角カタカナではない」と判断されてエラーになっているようだ。

ソースを見てみると、

if ($kana_name !~ /^(([\xA3][\xB0-\xB9])|([\xA5][\xA1-\xF6])|([\xA3][\xC1-\xDA])|([\xA3][\xE1-\xFA])|([\xA1][\xA1])|([\xA1][\xA6])|([\xA1][\xBC])|([\xA1][\xDD]))*$/) {
 &error_proc('全角カナ以外の文字有り'); # エラー処理へ
}

ってなってる。

EUC コードで、

[\xA3][\xB0-\xB9] 1~9
[\xA5][\xA1-\xF6] ァアィイ~ヵヶ
[\xA3][\xC1-\xDA] A~Z
[\xA3][\xE1-\xFA] a~z
[\xA1][\xA1] <全角スペース>
[\xA1][\xA6] ・(中点)
[\xA1][\xBC] ー(長音符号(音びき符号))
[\xA1][\xDD] -(マイナス(ハイフン))

なので、これに、

[\xA1][\xAB-\xAC] ゛(濁音)、゜(半濁音)

を追加する必要があるね。

if ($kana_name !~ /^(([\xA3][\xB0-\xB9])|([\xA5][\xA1-\xF6])|([\xA3][\xC1-\xDA])|([\xA3][\xE1-\xFA])|([\xA1][\xA1])|([\xA1][\xA6])|([\xA1][\xBC])|([\xA1][\xDD])|([\xA1][\xAB-\xAC]))*$/) {
 &error_proc('全角カナ以外の文字有り'); # エラー処理へ
}

にすればOKだ。

まあ、会員情報をカナで検索することを考えると、登録時に「タ゛」は「ダ」に、「ホ゜」は「ポ」に変換してしまった方がきれいだと思うが・・・

トラックバック(0)

このブログ記事を参照しているブログ一覧: 全角カタカナチェックの話

このブログ記事に対するトラックバックURL: https://blog.netandfield.com/mt/mt-tb.cgi/616

コメントする

このブログ記事について

このページは、shinodaが2009年6月 3日 11:49に書いたブログ記事です。

ひとつ前のブログ記事は「東観音の膳咲が店じまいしてしまったようだ」です。

次のブログ記事は「久しぶりに Libretto ff1100 を・・・」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

電気ウナギ的○○ mobile ver.

携帯版「電気ウナギ的○○」はこちら