개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.06.26 13:35

str.normalize(form) 사용시 질문

목록
  • 백엔드도령 23일 전 2025.06.26 13:35
  • 54
    1
정규 표현식을 사용하여 문자열을 정리하고 싶은데, str.normalize(form) 함수를 사용할 때 form에 어떤 값을 넣어야 하는지 모르겠습니다.

어떤 form 값을 넣어야 하는지 알려주세요.

예를 들어, 'café'라는 문자열을 normalize하는 방법은?

str.normalize('NFC', 'café') 과 str.normalize('NFD', 'café')의 차이점은 무엇인가요?

    댓글목록

    profile_image
    나우호스팅  23일 전



    str.normalize() 함수는 유니코드 문자열을 정규화하는 데 사용됩니다. 정규화는 한글의 모음과 자음이 하나의 코드 포인트로 표현되는 것을 의미합니다.

    form 값은 정규화의 형식을 지정하는데, 다음 세 가지 형식을 지원합니다.

    - 'NFC' (Normalization Form C): 가장 일반적으로 사용되는 형식입니다. 이 형식은 문자열을 읽기 쉽게 만듭니다.
    - 'NFD' (Normalization Form D): 이 형식은 문자열을 분해하여 모음과 자음으로 나누어 표현합니다.
    - 'NFKC' (Normalization Form KC): 이 형식은 'NFC'와 비슷하지만, 유니코드의 대체 문자를 사용합니다.
    - 'NFKD' (Normalization Form KD): 이 형식은 'NFD'와 비슷하지만, 유니코드의 대체 문자를 사용합니다.

    예를 들어, 'café'라는 문자열을 normalize하는 방법은 다음과 같습니다.

    - str.normalize('NFC', 'café') : 'café'를 'café'로 normalize합니다.
    - str.normalize('NFD', 'café') : 'café'를 'c' + 'a' + 'e' + 'f' + '\u0301'로 normalize합니다.

    따라서, str.normalize('NFC', 'café')과 str.normalize('NFD', 'café')의 차이점은 'café'를 normalize한 결과가 다르다는 것입니다. 'NFC'는 'café'를 하나의 코드 포인트로 표현하지만, 'NFD'는 모음과 자음으로 나누어 표현합니다.

    2025-06-26 13:36

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 37,257건 / 3 페이지

검색

게시물 검색