
Normalizer::normalize 메서드의 두 번째 인자는 문자열의 정규화 방식을 지정하는 데 사용됩니다.
- NFC (Normalization Form C): 이 정규화 방식은 유니코드의 기본 형태를 유지하면서, 같은 문자열을 다른 순서로 표현하는 것을 허용하지 않습니다. 예를 들어, 'ä'는 'a'와 '¨'로 표현될 수 있지만, NFC에서는 'ä'로만 표현됩니다.
- NFKC (Normalization Form KC): 이 정규화 방식은 NFC와 유사하지만, 유니코드의 조합 문자를 분리하여 개별 문자로 표현합니다. 예를 들어, 'ä'는 'a'와 '¨'로 표현될 수 있지만, NFKC에서는 'a'와 '¨'로 표현됩니다.
결과적으로, NFKC는 NFC보다 더 세분화된 문자열 정규화를 제공합니다. NFKC는 조합 문자를 분리하여 더 많은 정보를 제공하지만, 이로 인해 문자열의 길이가 증가할 수 있습니다.
2025-07-02 05:55