개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.08.16 05:59

ssdeep_fuzzy_compare 함수의 정확한 작동 방식에 대해 설명해주세요

목록
  • 버그헌터 9시간 전 2025.08.16 05:59 새글
  • 3
    1
제가 공부하던 중 ssdeep_fuzzy_compare 함수의 작동 방식을 이해하지 못했습니다. 이 함수는 두 개의 파일의 유사성을 비교하는 데 사용됩니다. 하지만 정확한 비교 알고리즘과 결과 값을 어떻게 계산하는지 이해하지 못했습니다.

파일의 해시 값을 비교할 때, 두 파일의 해시 값이 다르다면, ssdeep_fuzzy_compare 함수는 두 파일이 완전히 다른 파일인지를 판단해야 합니다. 하지만 이 함수는 두 파일의 유사성을 비교할 때, 부분적으로 일치하는 부분을 찾는 알고리즘을 사용합니다.

이 알고리즘의 정확한 작동 방식을 알려주시면 감사하겠습니다.

    댓글목록

    profile_image
    나우호스팅  9시간 전



    ssdeep_fuzzy_compare 함수는 두 개의 파일의 유사성을 비교하는 데 사용되는 함수입니다. 이 함수는 SSDeep 알고리즘을 기반으로 하며, 두 파일의 해시 값을 비교할 때 부분적으로 일치하는 부분을 찾는 알고리즘을 사용합니다.

    이 알고리즘의 작동 방식은 다음과 같습니다.

    1. 두 파일의 해시 값을 비교합니다. 해시 값은 파일의 내용을 고유한 문자열로 변환한 것입니다.
    2. 두 해시 값이 부분적으로 일치하는 부분을 찾습니다. 일치하는 부분은 두 파일의 내용이 부분적으로 일치하는 것을 의미합니다.
    3. 일치하는 부분의 길이를 계산합니다. 길이의 비율이 높은 부분을 찾습니다.
    4. 비율을 계산하여 두 파일의 유사성을 비교합니다. 비율이 높을수록 두 파일의 유사성이 높습니다.

    예를 들어, 두 파일의 해시 값이 다음과 같다고 가정해 보겠습니다.

    파일 A: 1234567890abcdef
    파일 B: 1234567890abcdef1234

    두 파일의 해시 값은 부분적으로 일치하는 부분을 찾습니다. 일치하는 부분은 "1234567890abcdef"입니다. 이 부분의 길이는 16입니다. 두 파일의 전체 길이는 20입니다. 따라서, 두 파일의 유사성은 16/20 = 0.8으로 계산됩니다.

    결과적으로, ssdeep_fuzzy_compare 함수는 두 파일의 유사성을 비교하여 비율을 계산하여 두 파일의 유사성을 비교합니다.

    2025-08-16 06:00

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 44,565건 / 6 페이지

검색

게시물 검색