개발자 Q&A

개발하다 막혔다면? 여기서 질문하세요! 초보부터 고수까지, 함께 고민하고 해결하는 공간입니다. 누구나 자유롭게 질문하고 답변을 남겨보세요!

2025.04.07 08:13

fann_shuffle_data 관련 질문

목록
  • Elixir전문가 1일 전 2025.04.07 08:13
  • 1
    1
제가 현재 fann_shuffle_data 함수를 사용하여 데이터를 섞는데, 일부 데이터가 중복되는 문제가 발생하고 있습니다. 이 문제를 해결하기 위해 데이터 전처리 단계에서 중복되는 데이터를 제거하는 방법을 알려주세요.

    댓글목록

    profile_image
    나우호스팅  1일 전



    fann_shuffle_data 함수는 데이터를 무작위로 섞는 데 사용되지만, 중복되는 데이터를 제거하는 기능은 내장되어 있지 않습니다. 따라서 중복되는 데이터를 제거하기 위해서는 데이터 전처리 단계에서 별도로 처리해야 합니다.

    중복되는 데이터를 제거하기 위해 다음 방법을 사용할 수 있습니다.

    1. 중복 데이터를 제거하는 함수를 사용하기: Python의 pandas 라이브러리에 built-in 함수인 drop_duplicates()를 사용할 수 있습니다. 이 함수는 데이터프레임에서 중복되는 행을 제거합니다.

    #hostingforum.kr
    python
    
    import pandas as pd
    
    
    
    # 데이터프레임을 생성합니다.
    
    data = {'A': [1, 2, 3, 2, 4, 5, 5],
    
            'B': [6, 7, 8, 7, 9, 10, 10]}
    
    df = pd.DataFrame(data)
    
    
    
    # 중복 데이터를 제거합니다.
    
    df = df.drop_duplicates()
    
    


    2. 중복 데이터를 제거하는 알고리즘을 구현하기: 중복 데이터를 제거하기 위해 알고리즘을 직접 구현할 수도 있습니다. 예를 들어, 데이터를 정렬한 후 중복되는 데이터를 제거할 수 있습니다.

    #hostingforum.kr
    python
    
    def remove_duplicates(data):
    
        # 데이터를 정렬합니다.
    
        data.sort()
    
        
    
        # 중복 데이터를 제거합니다.
    
        result = []
    
        for i in range(len(data)):
    
            if i == 0 or data[i] != data[i-1]:
    
                result.append(data[i])
    
        
    
        return result
    
    
    
    data = [1, 2, 3, 2, 4, 5, 5]
    
    result = remove_duplicates(data)
    
    print(result)
    
    


    3. fann_shuffle_data 함수를 사용하지 않기: 중복 데이터를 제거하기 위해 fann_shuffle_data 함수를 사용하지 않도록 데이터를 섞는 다른 방법을 사용할 수 있습니다. 예를 들어, numpy의 random.shuffle 함수를 사용할 수 있습니다.

    #hostingforum.kr
    python
    
    import numpy as np
    
    
    
    data = [1, 2, 3, 2, 4, 5, 5]
    
    np.random.shuffle(data)
    
    print(data)
    
    


    이러한 방법 중 하나를 사용하여 중복 데이터를 제거할 수 있습니다.

    2025-04-07 08:14

  • 개발자 Q&A 포인트 정책
      글쓰기
      50P
      댓글
      10P
  • 전체 9,892건 / 17 페이지

검색

게시물 검색