
str.normalize(form) 함수는 문자열을 정규화하는 데 사용됩니다. form의 값은 문자열의 정규화 형식을 결정합니다. 일반적으로 사용되는 form의 값은 다음과 같습니다.
- NFD (Normalization Form Decomposition): 문자열을 기본 글자와 분리된 형식으로 정규화합니다.
- NFC (Normalization Form Composition): 문자열을 기본 글자와 결합된 형식으로 정규화합니다.
- NFKD (Normalization Form Decomposition, Compatibility): 문자열을 기본 글자와 분리된 형식으로 정규화하고, 호환성 있는 문자를 분리합니다.
- NFKC (Normalization Form Composition, Compatibility): 문자열을 기본 글자와 결합된 형식으로 정규화하고, 호환성 있는 문자를 결합합니다.
예를 들어, 'café'라는 문자열을 NFC 형식으로 정규화하면 'café'가 그대로 유지됩니다. 그러나 'café'라는 문자열을 NFD 형식으로 정규화하면 'café'가 'c' + 'a' + 'e' + 'f' + '́'으로 분리됩니다.
정규화된 형태의 문자열을 얻는 이유는 여러 가지가 있습니다. 예를 들어, 문자열을 비교하거나 저장할 때, 동일한 문자열이 다른 형식으로 저장되는 것을 방지하기 위함입니다. 또한, 문자열을 처리할 때, 정규화된 형태의 문자열을 사용하면 문자열의 처리가 더 간단해질 수 있습니다.
2025-05-22 18:28