Unicode正規化を使うと、テキストを一貫したUnicode形式に変換できます。CotEditorでは、さまざまなUnicode正規化方式で書類内のテキストを正規化できます。
Unicode正規化とは、テキストを標準化されたUnicode表現に変換する処理です。Unicodeでは、見た目が同じ文字であっても異なるUnicodeシーケンスで表現されている場合があり、正規化はそのような違いを解消するために使われます。
CotEditorでは、次のUnicode正規化方式を利用できます:
| 方式 | 説明 |
|---|---|
| NFD | 正準等価によって分解します。 |
| NFC | 正準等価によって分解し、正準等価によって合成します。 |
| NFKD | 互換性等価によって分解します。 |
| NFKC | 互換性等価によって分解し、正準等価によって合成します。 |
| NFKC Case-Fold | NFKCを適用しすべて小文字に変換(case folding)したのち、デフォルトの無視できるコードポイントを削除します。 |
| 修正NFD | HFS+で使用されているNFDを基にした非公式の正規化形式です。 |
| 修正NFC | 修正NFDに対応するNFCを基にした非公式の正規化形式です。 |
注記: 修正NFDおよび修正NFCは、macOSのファイルシステムで使用されているUnicode正規化を元にした特殊な正規化方式です。macOSでは、ファイル名を扱う際にUnicode標準の正規化とは一部挙動の異なる正規化が行われています。これらの方式はそのようなmacOSのファイル名由来のテキストを扱う場合に役立ちます。
MacのCotEditorアプリ
で、書類を開きます。
正規化をするテキスト範囲を選択します。
「テキスト」>「Unicode正規化」と選択し、正規化方式を選択します。