중복 데이터 제거 전에 기준 열을 정하는 방법
엑셀의 중복 제거 버튼은 빠르지만 기준 열을 잘못 고르면 정상 데이터까지 사라집니다. 고객, 주문, 문의 데이터에서 중복 기준을 안전하게 정하는 법을 설명합니다.
핵심 요약
- 중복은 행 전체가 같은 경우와 특정 키만 같은 경우를 나눠야 합니다.
- 삭제 전에 중복 후보를 표시하고, 남길 행의 기준을 먼저 정해야 합니다.
- 고객명처럼 변하기 쉬운 값보다 주문번호, 이메일, 고객ID 같은 안정적인 키를 우선합니다.
이런 상황에 읽어보세요
- 고객 목록이나 주문 목록에서 중복 행을 제거해야 하는 사람
- 중복 제거 후 집계 수가 달라져 불안했던 경험이 있는 사람
- CRM, 쇼핑몰, 설문 응답 데이터를 보고서용으로 정리하는 사람
중복 제거는 삭제 작업이 아니라 기준 정의 작업입니다
엑셀의 중복 제거 기능은 버튼 하나로 끝나지만, 실무에서는 무엇을 중복으로 볼지가 훨씬 중요합니다. 이름이 같다고 같은 고객은 아니고, 이메일이 같아도 주문은 여러 건일 수 있습니다.
따라서 먼저 데이터의 한 행이 무엇을 의미하는지 정해야 합니다. 한 행이 고객인지, 주문인지, 문의인지, 결제인지에 따라 중복 기준 열이 달라집니다.
삭제 전에 중복 후보를 표시합니다
중복 제거 기능을 바로 실행하면 어떤 행이 사라졌는지 확인하기 어렵습니다. COUNTIFS, 조건부 서식, 피벗테이블을 사용해 중복 후보를 먼저 표시하고 필터로 눈으로 확인하는 과정이 필요합니다.
예를 들어 고객 목록에서는 이메일과 전화번호를 같이 보고, 주문 목록에서는 주문번호를 기준으로 봅니다. 기준 열이 여러 개인 경우에는 보조 열을 만들어 `이메일|전화번호`처럼 결합한 키를 만든 뒤 중복 여부를 확인할 수 있습니다.
남길 행의 기준도 함께 정합니다
중복 후보를 찾았다고 끝이 아닙니다. 최신 수정일을 남길지, 결제 완료 상태를 남길지, 정보가 더 많이 채워진 행을 남길지 결정해야 합니다.
이 기준 없이 중복 제거를 실행하면 엑셀이 위쪽 행을 남기는 식으로 처리하기 때문에 업무상 더 중요한 최신 데이터가 사라질 수 있습니다.
예시로 보면 더 빨라요
| 데이터 종류 | 좋은 중복 기준 | 주의할 기준 |
|---|---|---|
| 고객 목록 | 고객ID, 이메일, 전화번호 | 이름만 사용 |
| 주문 목록 | 주문번호 | 상품명과 금액만 사용 |
| 문의 목록 | 문의ID, 접수일+연락처 | 문의 내용 일부 |
| 설문 응답 | 응답ID, 이메일+제출시각 | 응답자 이름만 사용 |
실무 처리 순서
- 한 행이 무엇을 의미하는지 먼저 정의합니다.
- 중복 판단에 쓸 안정적인 키 열을 고릅니다.
- COUNTIFS나 조건부 서식으로 중복 후보를 표시합니다.
- 남길 행의 기준을 최신일, 상태, 정보 완성도 중에서 정합니다.
- 원본을 복사한 뒤 중복 제거를 실행하고 삭제 행 수를 기록합니다.
자주 놓치는 실수
- 고객 이름만 기준으로 중복을 제거해 동명이인을 삭제하는 경우
- 주문 데이터에서 고객ID를 기준으로 제거해 여러 주문을 하나로 줄이는 경우
- 최신 수정일 정렬 없이 중복 제거를 실행해 오래된 행이 남는 경우
공유 전 체크리스트
정정과 보완 기준
업무 도구와 스프레드시트 기능은 버전과 환경에 따라 다르게 보일 수 있습니다. 예제와 다른 결과가 나오면 사용한 프로그램, 파일 형식, 오류 메시지를 함께 보내주세요.
정정 요청하기함께 보면 좋은 가이드
빈 셀, 0, 공백 문자를 보고서 전에 구분해야 하는 이유
빈 셀과 0은 보고서에서 완전히 다른 의미입니다. 공백 문자까지 섞이면 COUNT, AVERAGE, 피벗테이블 결과가 달라지므로 정리 전에 의미를 먼저 정해야 합니다.
피벗테이블로 월별 보고서를 만들기 전 원본 데이터 점검하기
피벗테이블은 원본이 깨끗할 때 강력합니다. 월별 매출이나 문의 수 보고서를 만들기 전에 날짜, 금액, 카테고리, 빈 행을 점검하는 기준을 정리했습니다.
엑셀 정렬 후 행이 섞이지 않게 하는 기본 원칙
정렬은 간단하지만 선택 범위를 잘못 잡으면 이름과 금액, 날짜가 서로 다른 행으로 섞일 수 있습니다. 표 전체 정렬과 필터 사용 기준을 정리했습니다.
엑셀 날짜가 45291 같은 숫자로 보일 때 고치는 순서
엑셀 날짜가 갑자기 숫자로 보이면 셀 서식만 바꿀 문제가 아닐 수 있습니다. 날짜 일련번호, 텍스트 날짜, CSV 가져오기 상태를 구분해서 안전하게 고치는 순서를 정리했습니다.