CMP(Chemical Mechanical Polishing)는 반도체 공정에서 가장 민감한 단계 중 하나다. 수백 층이 쌓이는 반도체 구조에서 각 층의 평탄도를 확보하기 위해 반드시 필요한 공정이며, 평탄화 품질은 칩의 성능과 수율에 직접적인 영향을 미친다. 하지만 이 공정은 동시에 ‘오염(Contamination)’ 사고가 자주 발생하는 구간이기도 하다. 그중에서도 가장 위험한 사고는 바로 슬러리(Slurry) 오염이다. 슬러리는 CMP의 핵심 소재이며, 그 성질이 조금만 변해도 전체 라인에 대형 불량을 일으킨다.
1. 사고의 시작: 금속층 저항 값이 갑자기 증가
문제는 WAT 테스트에서 금속 배선의 저항 값이 비정상적으로 증가하는 현상으로 시작되었다. 여러 웨이퍼에서 공통적으로 저항 분포가 퍼지는 형태를 보였고, 일부는 오픈(Open) 결함까지 발생했다. 특이한 점은 불량이 특정 영역이 아닌 웨이퍼 전반에 걸쳐 나타났다는 것이다. 이는 장비나 Recipe보다 재료 쪽 문제 가능성이 높다는 신호였다.
2. 공정 로그 이상 없음 → 슬러리 상태 점검으로 초점 이동
CMP 장비 로그, 압력, 회전속도, 패드 컨디셔닝 기록 모두 정상 범위였다. 엔지니어들은 패드 표면 손상 여부도 확인했지만 문제가 없었다. 점검 과정에서 공정 엔지니어는 “슬러리 점도(Viscosity)가 예상치보다 약간 높다”는 자동 로그 메시지를 발견했다. 평소라면 큰 문제는 아니지만, 저항 증가와 함께 나타난 점도 이상은 의심할 만한 신호였다.
3. 원인: 슬러리 저장 탱크에 미세 금속 입자 혼입
슬러리를 분석한 결과, 슬러리 내에서 규정되지 않은 ‘금속성 미세 입자(Metallic Contaminant)’가 검출되었다. 크기는 50~200nm 수준으로 인간의 눈으로는 절대 보이지 않지만, CMP에서는 치명적이다. 이 미세 금속 입자는 슬러리 공급 라인 중 하나의 배관 내부 코팅이 마모되면서 떨어져 나온 것으로 밝혀졌다. 배관 내부의 내마모 코팅이 파손되기 시작해, 작은 금속 조각들이 슬러리 흐름에 섞인 것이다.
4. 사고가 발생한 메커니즘
슬러리 속의 금속 입자는 CMP 과정에서 패드와 함께 웨이퍼 표면을 긁어내며 미세 스크래치를 유발했다. 스크래치된 금속 표면은 저항을 증가시키고, 일부는 도전 금속 라인을 끊어버려 오픈 결함을 발생시켰다. 특히 금속 CMP에서는 표면 거칠기(Roughness)가 1nm만 증가해도 저항이 수배 이상 튀기 때문에, 오염 입자가 하나만 섞여도 치명적인 불량이 발생한다.
5. 피해 규모: Lot 전체 폐기 + 슬러리 탱크 교체 + 장비 3일 Shutdown
이 사고로 피해 규모는 매우 컸다. 먼저 슬러리 오염으로 인해 가공된 Lot은 모두 폐기 판정이 내려졌다. 이후 슬러리 공급 시스템 전체를 비우고, 탱크·배관·필터·패드를 모두 교체해야 했다. 장비는 총 72시간 동안 가동이 중단되었다. 장비 유지보수, 슬러리 폐기 비용, 생산 중단 비용을 포함하면 총 피해는 수억~수십억 원 규모였다.
6. 슬러리 오염 사고가 특히 위험한 이유
슬러리는 CMP 공정의 가장 핵심 소재이기 때문에, 오염은 곧바로 전체 수율에 치명타를 준다. 왜 이렇게 위험할까? 첫째, 슬러리는 CMP 중 웨이퍼 전면에 균일하게 분포되기 때문에 오염되면 모든 칩이 동시에 영향을 받는다. 둘째, 오염 입자는 CMP 과정에서 표면을 긁으며 연속적인 스크래치를 만든다. 셋째, 전기적 특성을 직접적으로 악화시켜 Rework가 사실상 불가능하다. 넷째, 오염을 실시간으로 감지하기 어렵기 때문에 발견 시점에는 이미 많은 웨이퍼가 처리된 경우가 많다.
7. 사고 재발 방지 대책
사고 이후 엔지니어링 팀은 슬러리 관리 기준을 강화했다. 대표적인 조치는 다음과 같다. 1) 슬러리 공급 배관의 정기 교체 주기 단축 2) 금속 입자 실시간 분석 센서 도입 3) 슬러리 점도 및 pH 모니터링 주기 2배 강화 4) 공급 라인 필터 2중화 5) AI 기반 슬러리 품질 예측 시스템 구축 6) 패드 컨디셔닝 패턴 변경으로 스크래치 감도 감소
8. 시사점: CMP는 공정 중 가장 ‘보이지 않는 위험’이 많은 단계
CMP는 반도체 공정 중 육안으로 확인하기 가장 어렵고, 데이터로도 실시간 감지하기 힘든 공정이다. 패드 마모, 슬러리 입자 크기 변화, 필터 오염 등 내부 변수들의 작은 변화가 즉시 불량으로 이어진다. 특히 첨단 공정(5nm 이하)에서는 CMP 평탄도가 소자 성능에 직접적인 영향을 미치기 때문에, 오염 사고가 발생하면 피해가 기하급수적으로 커진다.
9. 결론: 슬러리 오염은 작은 금속 입자 하나가 반도체 수율을 무너뜨린다
이번 사고는 CMP 공정이 얼마나 정밀하고 민감한지 보여주는 대표적 사례다. 눈에 보이지 않는 100nm 이하의 금속 입자 하나가 전체 Lot을 폐기하게 만들 수 있으며, CMP 장비를 멈추게 할 수 있다. 첨단 공정으로 갈수록 슬러리 품질 관리가 핵심 경쟁력으로 떠오르고 있으며, 이를 실시간으로 감지하고 예측하는 AI 기반 솔루션의 필요성이 커지고 있다. 다음 편에서는 반도체 공정을 정지시킬 수 있는 ‘포토레지스트 Bubble(기포)로 인한 대규모 Lithography 불량’ 사고를 다룬다. 노광 과정에서 발생하는 작은 기포가 어떻게 전층 불량을 만드는지 실제 사례로 살펴본다.
'반도체' 카테고리의 다른 글
| AI 서버가 공장을 늘리면 주가는 어떻게 움직일까? 반도체 시장의 메커니즘 (0) | 2025.11.24 |
|---|---|
| AI 서버 투자 확대가 반도체 산업 구조를 바꾸는 이유 (0) | 2025.11.21 |
| 이온주입 빔 Misalignment 사고 (0) | 2025.11.16 |
| 증착·식각 장비 내부 파티클 유입 사고 (0) | 2025.11.15 |
| 포토 공정 마스크 오염이 만든 대형 수율 참사 (0) | 2025.11.15 |