이 페이지에서 다루는 검색 주제
canonical은 “이 URL이 대표다”라고 힌트를 주는 태그입니다. 힌트이므로 검색엔진이 항상 따르지 않을 수 있고, **본문이 완전히 동일한 Thin URL**을 canonical만으로 양산 관리하는 전략은 위험합니다.
전략 1: 합치기
비슷한 의도의 URL이 여럿이면 **하나로 합치고 301**하는 편이 크롤·색인·운영 모두에 유리한 경우가 많습니다. 특히 “내용은 같은데 URL만 다른” 패턴은 합치기 후보 1순위입니다.
전략 2: 남기되 신호 정리
필터·정렬·태그 때문에 URL을 없앨 수 없다면:
- 대표 URL에 canonical을 모을지
- 저가치 URL을 noindex할지
- 파라미터를 Search Console/플랫폼 규칙으로 정리할지
를 조합해야 합니다. “전부 색인”과 “전부 noindex”는 둘 다 드문 극단입니다.
전략 3: 막기
세션 ID, 불필요한 추적 파라미터, 무의미한 정렬 조합이 URL에 붙는 구조는 **아예 만들지 않는 것**이 먼저입니다. 막지 않으면 canonical을 아무리 잘 써도 크롤 예산만 소모하는 경우가 반복됩니다.
canonical을 믿기 전에 확인할 것
- http/https, www/비www 혼재
- 동일 콘텐츠의 다른 경로
- 모바일/데스크톱 분리 URL(필요성 재검토)
이런 충돌이 있으면 canonical만으로는 신호가 계속 흐트러집니다.
cross-domain canonical
다른 도메인에 동일·유사 콘텐츠가 있을 때 특수하게 쓰이지만, 잘못 쓰면 **원치 않는 URL이 대표로 고정**될 수 있습니다. 법적·계약적 근거 없이 남발하지 않는 것이 안전합니다.
hreflang과의 관계
다국어·다지역 사이트에서 canonical과 hreflang이 엇박자면 색인이 꼬입니다. 같은 언어 내에서 canonical을 단일화하고, 언어 간 연결은 hreflang으로 맞춥니다.
운영 체크리스트
분기마다 “새로 생긴 중복 URL 패턴”을 Search Console과 로그 샘플로 점검합니다. 기능 릴리즈 때마다 필터가 하나 추가되면 URL 공간이 폭발하기 쉽기 때문입니다.
