
Normalizer::getRawDecomposition은 정규화된 텍스트를 분해하는 메서드입니다. 이 메서드는 정규화된 텍스트를 분해하여 각 글자의 유니코드 속성을 반환합니다.
이 메서드는 UAX #29 알고리즘을 사용하여 텍스트를 분해합니다. 이 알고리즘은 텍스트를 각 글자로 분해하고, 각 글자의 유니코드 속성을 반환합니다.
예를 들어, "Hello, World!"라는 텍스트를 Normalizer::getRawDecomposition에 입력했을 때, 다음과 같은 결과가 나옵니다.
- H: U+0048 (U+0048는 영문 대문자 H를 나타냅니다.)
- e: U+0065 (U+0065는 영문 소문자 e를 나타냅니다.)
- l: U+006C (U+006C는 영문 소문자 l을 나타냅니다.)
- l: U+006C (U+006C는 영문 소문자 l을 나타냅니다.)
- o: U+006F (U+006F는 영문 소문자 o를 나타냅니다.)
- ,: U+002C (U+002C는 쉼표를 나타냅니다.)
- : U+0020 (U+0020는 공백을 나타냅니다.)
- W: U+0057 (U+0057는 영문 대문자 W를 나타냅니다.)
- o: U+006F (U+006F는 영문 소문자 o를 나타냅니다.)
- r: U+0072 (U+0072는 영문 소문자 r을 나타냅니다.)
- l: U+006C (U+006C는 영문 소문자 l을 나타냅니다.)
- d: U+0064 (U+0064는 영문 소문자 d을 나타냅니다.)
- !: U+0021 (U+0021는 느낌표를 나타냅니다.)
이 결과는 텍스트의 각 글자의 유니코드 속성을 반환합니다. 이 정보는 텍스트의 분석, 검색, 및 처리와 같은 다양한 용도로 사용될 수 있습니다.
2025-06-04 20:20