MacのCotEditorでテキストをUnicode正規化する

Unicode正規化を使うと、テキストを一貫したUnicode形式に変換できます。CotEditorでは、さまざまなUnicode正規化方式で書類内のテキストを正規化できます。

Unicode正規化とは、テキストを標準化されたUnicode表現に変換する処理です。Unicodeでは、見た目が同じ文字であっても異なるUnicodeシーケンスで表現されている場合があり、正規化はそのような違いを解消するために使われます。

CotEditorでは、次のUnicode正規化方式を利用できます:

方式 説明
NFD

正準等価によって分解します。

NFC

正準等価によって分解し、正準等価によって合成します。

NFKD

互換性等価によって分解します。

NFKC

互換性等価によって分解し、正準等価によって合成します。

NFKC Case-Fold

NFKCを適用しすべて小文字に変換(case folding)したのち、デフォルトの無視できるコードポイントを削除します。

修正NFD

HFS+で使用されているNFDを基にした非公式の正規化形式です。

修正NFC

修正NFDに対応するNFCを基にした非公式の正規化形式です。

注記: 修正NFDおよび修正NFCは、macOSのファイルシステムで使用されているUnicode正規化を元にした特殊な正規化方式です。macOSでは、ファイル名を扱う際にUnicode標準の正規化とは一部挙動の異なる正規化が行われています。これらの方式はそのようなmacOSのファイル名由来のテキストを扱う場合に役立ちます。

テキストをUnicode正規化する

  1. MacのCotEditorアプリで、書類を開きます。

  2. 正規化をするテキスト範囲を選択します。

  3. 「テキスト」>「Unicode正規化」と選択し、正規化方式を選択します。