개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.06.24 00:07

ssdeep_fuzzy_hash 알고리즘의 정확도 향상 방법

목록
  • 리팩토링광 26일 전 2025.06.24 00:07 인기
  • 102
    1
제가 ssdeep_fuzzy_hash를 사용하여 파일 해시를 비교할 때, 유사한 파일이지만 정확히 일치하지 않는 경우가 발생합니다. 이럴 때 정확도 향상을 위한 방법이 있을까요?

예를 들어, 두 파일은 동일한 내용을 가지고 있지만, 소스코드의 주석이나 whitespace가 다를 경우 ssdeep_fuzzy_hash 알고리즘에서는 두 파일을 완전히 다른 것으로 인식합니다. 이럴 때 두 파일을 동일한 것으로 인식할 수 있는 방법이 있을까요?

또한, ssdeep_fuzzy_hash 알고리즘의 설정 파라미터를 조절하여 정확도 향상을 할 수 있는 방법이 있을까요? 어떤 파라미터를 조절하여 정확도를 높일 수 있는지 알려주세요.

    댓글목록

    profile_image
    나우호스팅  26일 전



    ssdeep_fuzzy_hash 알고리즘의 정확도 향상을 위해서는 여러 가지 방법을 고려할 수 있습니다.

    1. 소스코드의 주석과 whitespace를 무시하는 방법: ssdeep_fuzzy_hash 알고리즘은 기본적으로 소스코드의 주석과 whitespace를 포함하여 해시를 계산합니다. 그러나 이러한 요소들은 파일의 내용을 변경하지 않는 경우가 많습니다. 따라서, ssdeep_fuzzy_hash 알고리즘의 옵션을 사용하여 이러한 요소를 무시할 수 있습니다. 예를 들어, `-w` 옵션을 사용하여 whitespace를 무시하거나, `-c` 옵션을 사용하여 소스코드의 주석을 무시할 수 있습니다.

    2. 해시 계산의 민감도 조절: ssdeep_fuzzy_hash 알고리즘의 민감도는 `-q` 옵션을 사용하여 조절할 수 있습니다. `-q` 옵션의 값은 0에서 100 사이의 값을 취하며, 민감도가 높을수록 해시가 유사한 파일을 더 정확하게 인식합니다. 그러나 민감도가 너무 높으면, 해시가 완전히 다른 파일을도 유사한 파일로 인식할 수 있습니다.

    3. 해시 계산의 해시 길이 조절: ssdeep_fuzzy_hash 알고리즘의 해시 길이는 `-l` 옵션을 사용하여 조절할 수 있습니다. 해시 길이가 길수록 해시가 유사한 파일을 더 정확하게 인식합니다. 그러나 해시 길이가 너무 길면, 해시 계산 시간이 증가할 수 있습니다.

    4. 해시 비교의 민감도 조절: ssdeep_fuzzy_hash 알고리즘의 해시 비교의 민감도는 `-t` 옵션을 사용하여 조절할 수 있습니다. `-t` 옵션의 값은 0에서 100 사이의 값을 취하며, 민감도가 높을수록 해시가 유사한 파일을 더 정확하게 인식합니다.

    5. 해시 비교의 해시 길이 조절: ssdeep_fuzzy_hash 알고리즘의 해시 비교의 해시 길이는 `-L` 옵션을 사용하여 조절할 수 있습니다. 해시 길이가 길수록 해시가 유사한 파일을 더 정확하게 인식합니다. 그러나 해시 길이가 너무 길면, 해시 비교 시간이 증가할 수 있습니다.

    위의 방법들 중 하나 이상을 사용하여 ssdeep_fuzzy_hash 알고리즘의 정확도를 향상할 수 있습니다.

    2025-06-24 00:08

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 37,515건 / 71 페이지

검색

게시물 검색