데이터 정리9분 읽기실무업데이트 2026-05-25

중복 데이터 제거 전에 기준 열을 정하는 방법

엑셀의 중복 제거 버튼은 빠르지만 기준 열을 잘못 고르면 정상 데이터까지 사라집니다. 고객, 주문, 문의 데이터에서 중복 기준을 안전하게 정하는 법을 설명합니다.

핵심 요약

  • 중복은 행 전체가 같은 경우와 특정 키만 같은 경우를 나눠야 합니다.
  • 삭제 전에 중복 후보를 표시하고, 남길 행의 기준을 먼저 정해야 합니다.
  • 고객명처럼 변하기 쉬운 값보다 주문번호, 이메일, 고객ID 같은 안정적인 키를 우선합니다.

이런 상황에 읽어보세요

  • 고객 목록이나 주문 목록에서 중복 행을 제거해야 하는 사람
  • 중복 제거 후 집계 수가 달라져 불안했던 경험이 있는 사람
  • CRM, 쇼핑몰, 설문 응답 데이터를 보고서용으로 정리하는 사람

중복 제거는 삭제 작업이 아니라 기준 정의 작업입니다

엑셀의 중복 제거 기능은 버튼 하나로 끝나지만, 실무에서는 무엇을 중복으로 볼지가 훨씬 중요합니다. 이름이 같다고 같은 고객은 아니고, 이메일이 같아도 주문은 여러 건일 수 있습니다.

따라서 먼저 데이터의 한 행이 무엇을 의미하는지 정해야 합니다. 한 행이 고객인지, 주문인지, 문의인지, 결제인지에 따라 중복 기준 열이 달라집니다.

삭제 전에 중복 후보를 표시합니다

중복 제거 기능을 바로 실행하면 어떤 행이 사라졌는지 확인하기 어렵습니다. COUNTIFS, 조건부 서식, 피벗테이블을 사용해 중복 후보를 먼저 표시하고 필터로 눈으로 확인하는 과정이 필요합니다.

예를 들어 고객 목록에서는 이메일과 전화번호를 같이 보고, 주문 목록에서는 주문번호를 기준으로 봅니다. 기준 열이 여러 개인 경우에는 보조 열을 만들어 `이메일|전화번호`처럼 결합한 키를 만든 뒤 중복 여부를 확인할 수 있습니다.

남길 행의 기준도 함께 정합니다

중복 후보를 찾았다고 끝이 아닙니다. 최신 수정일을 남길지, 결제 완료 상태를 남길지, 정보가 더 많이 채워진 행을 남길지 결정해야 합니다.

이 기준 없이 중복 제거를 실행하면 엑셀이 위쪽 행을 남기는 식으로 처리하기 때문에 업무상 더 중요한 최신 데이터가 사라질 수 있습니다.

예시로 보면 더 빨라요

데이터 종류좋은 중복 기준주의할 기준
고객 목록고객ID, 이메일, 전화번호이름만 사용
주문 목록주문번호상품명과 금액만 사용
문의 목록문의ID, 접수일+연락처문의 내용 일부
설문 응답응답ID, 이메일+제출시각응답자 이름만 사용

실무 처리 순서

  1. 한 행이 무엇을 의미하는지 먼저 정의합니다.
  2. 중복 판단에 쓸 안정적인 키 열을 고릅니다.
  3. COUNTIFS나 조건부 서식으로 중복 후보를 표시합니다.
  4. 남길 행의 기준을 최신일, 상태, 정보 완성도 중에서 정합니다.
  5. 원본을 복사한 뒤 중복 제거를 실행하고 삭제 행 수를 기록합니다.

자주 놓치는 실수

  • 고객 이름만 기준으로 중복을 제거해 동명이인을 삭제하는 경우
  • 주문 데이터에서 고객ID를 기준으로 제거해 여러 주문을 하나로 줄이는 경우
  • 최신 수정일 정렬 없이 중복 제거를 실행해 오래된 행이 남는 경우

공유 전 체크리스트

삭제 전 원본 시트를 복사했는가
중복 기준 열을 업무 의미에 맞게 정했는가
남길 행의 우선순위를 정렬로 반영했는가
삭제 후 행 수와 집계 값 변화를 기록했는가

정정과 보완 기준

업무 도구와 스프레드시트 기능은 버전과 환경에 따라 다르게 보일 수 있습니다. 예제와 다른 결과가 나오면 사용한 프로그램, 파일 형식, 오류 메시지를 함께 보내주세요.

정정 요청하기

함께 보면 좋은 가이드