日本語照合順序での長音、繰り返し符号の取り扱いについて

皆さん、こんにちは。 SQL Server/Microsoft Azure SQL Database サポートチームです。

今回は、日本語照合順序 (Japanese、Japanese_90、Japanese_XJIS_100、Japanese_Unicode) での、長音、繰り返し符号の特殊な取り扱いについて紹介します。

[長音、繰り返し符号の特殊な取り扱い]

長音、繰り返し符号には、以下のものが存在します。

SQL Server で日本語照合順序を使用している場合、長音、繰り返し符号は、特殊な文字として、全て等価の符号として取り扱われます。そのため、長音、繰り返し符号で検索を実施した場合には、全ての長音、繰り返し符号が同じ符合(文字)として認識されるようになります。

具体的に REPLACE 関数を実行し、動作を見てみましょう。

SELECT REPLACE('長音符号ー繰り返し符号ヽ ','々','☆') as REPLACE;

// クエリ結果 //

REPLACE
---------------------------------
長音符号 ☆繰り返し符号 ☆

上記のクエリでは、文字列 “長音符号ー繰り返し符号ヽ”の中に、”々”が含まれている場合、”☆”に変換するというクエリになります。

クエリの結果を見ると、長音、繰り返し符号が、”☆”に変換されていることがわかると思います。これは、長音符号 “ー”、繰り返し符号 ”ヽ”、繰り返し符号 ”々” がすべて同じ符号(文字) として扱われるためとなります。

しかしながら、特定の長音、繰り返し記号のみを REPLACE 関数などで変換する必要がある状況もあると思います。この場合、明示的に バイナリの照合順序 (Japanese_BIN など)を COLLATE 句で指定することにより、実現することが可能です。

SELECT REPLACE('長音符号ー繰り返し符号ヽ ','々' COLLATE Japanese_BIN,'☆') as REPLACE;

// クエリ結果 //

REPLACE
---------------------------------
長音符号ー繰り返し符号ヽ

バイナリの照合順序の場合は、文字の比較の際に、文字コードで比較が行われ、長音、繰り返し符号でも特殊な取り扱いはされません。そのため、明示的にバイナリの照合順序を COLLATE 句で指定することにより、各長音、繰り返し符号が別の符号(文字) として認識させることが可能になります。

[関連情報]

日本語照合順序での漢数字〇 (0x815A) の取り扱いについて

※ 本Blogの内容は、2014年12月現在の内容となっております