Tech

[DEEPTECH POWER] 성기석·박진우 RTM 대표 

반도체 공정, AI로 ‘불량 제로’ 도전 

지난 10년간 클라우드·사물인터넷(IoT)·빅데이터·AI 등과 같은 신기술이 전 세계 반도체 수요를 두 배 이상 끌어올렸다면, 이제는 신기술이 반도체 공정의 초고도화에 기여하고 있다. 특히 한 기업이 AI로 반도체 공정에서 ‘불량률 제로’에 도전하고 나섰다.

▎RTM은 1000여 개가 넘는 반도체 공정에 주목했다. 공정이 점차 복잡해지면서 기존 방법으론 쉽지 않는 데다 불량이 나 가동이 중단되면 수천억원 손실이 날 수 있다. 인공지능(AI)을 활용한 공정 진단 솔루션을 개발에 나선 이유다.
‘하루 평균 생산 가치 5000억원, 10분 중단 시 30억원 손실, 재가동에 걸리는 시간 2개월, 생산성 1% 개선 시 2000억원 절감.’

반도체 공정에 붙는 수치다. 업계 추산이라 정확한 액수는 알 수 없지만, 몇몇 사례만 봐도 중단 여파가 꽤 크다는 걸 짐작할 수 있다. 2019년 마지막 날 삼성전자 반도체 공장에 정전이 발생했다. 삼성전자 화성 사업장 인근 변전소 송전 케이블이 문제를 일으켜 1~2분 동안 멈춘 것. 반도체 제조공정은 웨이퍼 1장이 수백 개 공정을 거치면서 수백 개 칩으로 거듭나는 과정이기 때문에 잠시만 멈춰도 손실이 난다. 재가동을 한다 해도 중간 공정이 꼬이면 어김없이 불량이 나온다. 재가동도 꽤 오래 걸린다. 2017년 3월 평택 사업장 정전 때도 500억원 정도 피해가 났다. 물론 이날 삼성전자는 “피해 규모가 크지 않았다”며 정확한 피해 금액은 밝히지 않았다.

2018년 대만 TSMC에서 생산 장비가 악성 컴퓨터바이러스인 랜섬웨어에 감염된 적이 있다. 생산라인은 전면 중단됐고, 라인 과정에 물려 있던 원재료를 모두 폐기했다. 설비 재점검에 들어가 재가동까지 걸린 시간은 2개월. TSMC는 약 3000억원 넘게 손실을 봤다.

생산공정은 갈수록 고도화되고 있어 피해 규모도 더 커질 수밖에 없다. 지난 8월 13일 삼성전자가 3차원 적층 패키지 기술을 적용해 7나노 기반 반도체 양산을 본격화하겠다고 밝혔다. 생산 규모 면에서 1위를 달리는 대만 TSMC에 이은 양산 성공이라 공정 고도화 경쟁은 더 심해질 것으로 보인다. 8월 14일 서울 강남구 역삼로 사무실에서 만난 성기석(39) 알티엠(RTM) 대표는 “10 나노급 이하 3차원 적층 패키지 공정의 경우 제조 공정만 1000개에 달하고, 1개 웨이퍼가 최종 반도체로 나오는 데 약 2개월 정도 걸린다”며 “제조 설비만 수만 대, 100만 개 이상의 센서가 쏟아내는 데이터만 45억 개가 넘는다”고 설명했다.

복잡성이 더해져 예전 방법으로 문제를 해결하려다가는 혼란만 야기할 수 있다는 뜻이다. 성 대표는 이 점에 주목했고, 반도체, 디스플레이 등 하이테크 제조업의 복잡한 공정을 분석하는 회사인 RTM을 2018년 6월에 창업했다. 제조업 공정에 뛰어든 기업치곤 상당히 빠르게 자리를 잡아가는 편이다. 올해 블루포인트파트너스와 킹슬리벤처스로부터 투자 유치를 시작으로, 지난 8월 14일 국책과제 수행기업으로도 선정됐다. RTM이 반도체 건식 제거(드라이스트립·Dry strip)장비 세계 1위 기업 피에스케이, 빅데이터 플랫폼 구축 업체 유디에스와 구축한 공동연구 컨소시엄이 산업통상자원부가 주관하는 ‘2020년도 산업기술 챌린지트랙 차세대 지능형 반도체 기술개발’ 사업 중 ‘실시간 공정 제어가 가능한 원자층식각장비 개발’ 과제에 최종 선정됐다. RTM은 실시간으로 바뀌는 미세 반도체 공정 데이터를 기반으로 공정 상태를 진단하는 인공지능(AI) 솔루션 개발을 맡기로 했다. 세계 1위 장비업체와 머리를 맞댈 기회인 셈이다.

박진우(38) 최고전략책임자(CSO)의 추진력이 한몫했다. 성 대표와 박 이사는 한성과학고 시절부터 카이스트까지 학교 선후배 사이다. 박사과정에서 두 사람의 길이 갈렸다. 성 대표는 미국 텍사스 A&M대학교로 머신러닝(기계학습)을 공부하러 떠나고, 박 이사는 카이스트에서 경영공학을 택하면서다. 2018년 삼성생명에서 보험가입자 데이터를 분석하던 성 대표가 삼성전자 경영혁신 팀에서 일하던 박 이사에게 머신러닝을 공정 혁신에 어떻게 풀어낼지 고민을 털어놓으면서 사업은 시작됐다. 그들의 얘기를 더 들어봤다.


안정된 직장에서 나왔다.

성기석 대표(이하 성 대표): 공부했던 머신러닝과 AI 지식을 공정 혁신에 풀고 싶다는 생각을 항상 해왔다. 금융사에서 고객데이터를 분석하는 것도 매력적이었지만, 스마트팩토리 솔루션을 개발해야겠다는 생각을 떨칠 수가 없었다. 그래서 박 이사를 찾아가 설득했다. 생애 첫 창업이었고, 사업전략이나 연구개발 과제 관리에 탁월한 역량을 지닌 그가 필요했다.

공정 혁신의 첫 타깃이 반도체다. 너무 장벽이 높은 분야 아닌가.

박진우 CSO(이하 박 이사): 그렇다. 삼성전자, SK하이닉스를 비롯해 세계적인 장비 회사들이 한국에 포진해 있다. 처음엔 촘촘히 얽힌 반도체 생태계에 비집고 들어갈 틈은 없어 보였다. 반복된 작업을 수행하는 공장 자동화는 상당수 이뤄진 상태였다. 하지만 공정 수행 과정을 스스로 판단해서 결과를 알려주는 지능화 솔루션을 갖춘 곳은 거의 없었다. 특히 성 대표가 첫 진출 목표로 반도체를 잡았다고 했을 때 확신이 섰다.

지능화 정도가 낮다고 해도 벽은 높을 것 같은데.

성 대표: 진입장벽이 낮을 거라고 본 건 아니다. 수요가 있다고 판단했다는 게 좀 더 정확한 표현이다. 지능화 솔루션은 공장 자동화가 90% 이뤄진 곳에서 고도화를 꾀할 때 빛을 발한다. 삼성전자 반도체 공정 한 라인에 깔린 센서만 100만 개가 넘고, 이것들이 쏟아내는 데이터가 수십억 개다. 약간만 문제가 생겨도 생산 수율에 차질이 생긴다. 우리보다 기업이 더 골몰하는 이유다.

웨이퍼 휨 99.2%, 가스 누출 100% 이상탐지


어떤 이상 현상을 탐지할 수 있나.

박 이사: 지금까지 양산 검증 계획까지 들어간 건 크게 3가지다. 공정에 들어간 웨이퍼의 휨 현상을 탐지, 반도체 공정용 특수가스의 유출 여부, 웨이퍼의 박막을 만드는 화학기상증착법에 쓰이는 플라스마 탐지 기능 등이다. 웨이퍼는 패키징 과정에서 고온, 고압을 견디며 수백 개 공정을 거친다. 이 과정에서 웨이퍼가 휘기도 하는데 찾는 게 쉽지 않다. 기존엔 온도 변화를 측정해서 휜 정도를 측정했는데 정확도가 94.8%였다. 온도 외 243개 센터 데이터를 학습해 탐지하면 정확도 99.2%로 뛴다. 별 차이 없다고 느낄 수 있지만, 웨이퍼 정상 수율이 95% 미만이면 통으로 버려야 한다. 탐지를 조금이라도 빠르고 정확하게 해야 하는 이유다.

가스 누출 감지·플라스마 탐지 모델도 있다고 했다.

박 이사: 그렇다. 두 모델은 양산 검증 계획에 들어간 상태다. 우리가 비교적 빨리 진입한 이유가 있다. 반도체 공정 중 진공 체임버 내에서 생산용 특수가스가 많이 새면 바로 경고음이 울리지만, 미세하게 새면 알 방법이 없다. 기존엔 진공 밸브 위치만 잡았는데, 우리는 밸브 위치 외 23개 센터 데이터를 학습해 탐지해냈다. 탐지 모델 자체가 없어 기존 모델의 정확도 수치는 알 수 없지만, 우린 최대 정확도 100%로 가스 누출을 검증했다. 플라스마 공정의 경우 반도체 소자의 막을 입히고 깎는 ‘드라이 에칭(DRY etching)’ 공정과 자외선들이 형광체를 때려 원하는 화학 용액을 기화해 입히는 과정인데 100% 균일도를 장담할 수 없다. 플라스마 탐지 모델을 만든 이유다. 반도체 파티클(분진, 미세입자) 탐지 모델도 개발 중이다.

현장 기술자가 불량 탐지 결과를 납득하지 않으면 어떻게 하나.

성 대표: 그럴 수 있다. 딥러닝으로 최적의 모델을 찾는 것이지, 이게 정답이라고 확언할 수 없다. 그래서 개발한 게 ‘실시간 공정 진단’ 모델이다. 딥러닝 모델이 내놓은 결과에 관련 기술진의 의견이 분분하다면, 기존 공정 엔지니어의 지식을 더해 만든 모델이라는 데 의의가 있다. 회사마다, 공정마다 환경이 제각각이고, 붙인 장비가 다를 수 있다. 수율을 높이기 위해 공정 레시피도 조금씩 달라질 수 있다. 레시피나 설비, 공정 변화를 곧바로 적용할 수 있는 진단 모델이다. 모든 제조 공정에 응용할 수 있는 범용 솔루션이란 장점도 있다.

이상 탐지, 공정 진단 범위가 넓어지고 있다.

박 이사: 자연스러운 현상이다. 현장 엔지니어의 지식과 경험에 정교한 데이터 모델이 결합될때에 복잡한 고정밀 공정의 진단은 가능해진다. 하지만 장비가 여럿 붙기 시작하면 공정 자체를 진단하는 모델에 변수가 훨씬 더 늘어난다. 진단 범위를 확장하는 이유다. 설비 상태를 진단하는 모델도 개발했다. 보통 과거 설비가 출하하거나 정비한 이력을 엑셀과 텍스트 파일로 관리한다. 데이터의 패턴을 분석하고 장비 원인과 발생 가능한 정비를 예측해 기술진에게 보여준다. 기술진은 이걸 보고 예방 점검과 정비에 나설 수 있다.

업체가 거두는 효과는 뭔가.

성 대표: 비용이 줄어든다. 정비 횟수는 곧 돈이다. 반도체 기업의 경우 주기적으로 설비 점검을 실시하는데, 장비 1대(1일 기준)를 멈추면 기회비용 2억원, 파티클 검사 장비는 대당 20억원 정도 기회비용 손실이 발생한다. 정비 횟수를 줄이면 당연히 생산성도 높아진다. 장비 기업은 일단 장비를 납품한 후 클레임이 줄어 서비스 비용이 준다. 조사해보니 납품 설비 1종당 월 250건 이상의 클레임을 받았다. 공정 오류를 일으킨 장비에 클레임이 들어오면 납품업체는 문제해결에 2주나 달라붙어야 한다.

정말 RTM 솔루션을 도입하는 기업이 늘어날까.

박 이사: 확신한다. 예전엔 웨이퍼의 휜 정도를 판단할 때 온도 데이터 변수 하나만 봐도 단번에 알 수 있었다. 하지만 반도체 회사들이 초미세 공정 경쟁에 돌입하면서 공정 전체가 미세화됐고, 장비마다 불량을 판단하는 변수 데이터도 수십 가지로 늘어났다. 딥러닝 데이터 모델로 이상을 탐지하다 보면 장비 설계 초기부터 센서 위치나 개수를 바꿔야겠다는 생각까지 들더라. 공정 능력도 중요하지만, 세밀화된 공정을 모니터링하면서 관리하는 능력은 앞으로 더 중요해질 거다.

목표는 뭔가.

성 대표: 우린 반도체 장비에서 출발해 공정, 설비 분야로 확장해나갔다. 첫 번째 목표는 반도체 공정 전반에 적용할 수 있는 딥러닝 모델을 정교화하는 것이다. 더불어 디스플레이, 태양광 생산 분야에도 적용 가능한지 타진해볼 생각이다. 다음으로 AI 이상 탐지, 데이터 관리 솔루션을 라이선스 방식의 패키지 소프트웨어 형식으로 장비사에 납품하고자 한다. 벌써 솔루션 기업 UDS와 손잡고 AI 이상 탐지 솔루션 UDAP 개발에 들어갔다. 최종적으론 AI 솔루션을 탑재한 장비를 설계하는 게 목표다. 장비사와 설계 초기부터 같이 일하는 것도 언제든 환영한다.

두 사람은 “반도체 공정의 AI 진단 전문 기업이 되고 싶다”고 입을 모았다. AI가 고도화되기 위해선 역시 많은 양의 질 좋은 데이터를 학습하는 게 우선이다. 더군다나 제조업의 공정 데이터는 1000분의 1초(ms, 밀리초) 단위의 시계열 데이터를 분석해야 할 정도로 변수가 많고 복잡한 분야다. 반도체 분야의 경우 한술 더 뜬다. 초미세 공정에 원재료까지 다양해지면서 변수의 가짓수를 헤아릴 수 없을 정도다.

두 대표도 당분간 반도체 장비 기업과 파트너십을 체결하고, 다양한 데이터를 분석하고 학습하는 전략에 주력하고 있다. 박진우 이사는“가장 어려운 분야에서 AI 솔루션 모델이 안착해야 다른 제조업에도 응용할 수 있다는 생각에 반도체를 택했다”고 했다. 성기석 대표는 “클라우드·IoT·빅데이터·AI 등과 같은 신기술이 부상하면서 반도체 시장 규모는 500조원을 넘어섰고, 앞으로 더 커질 것”이라며 “AI가 제조업 장벽을 넘어 진화를 이끈 사례가 되고 싶다”고 말했다.

- 김영문 기자 ymk0806@joongang.co.kr·사진 원동현 객원기자

202009호 (2020.08.23)
목차보기
  • 금주의 베스트 기사
이전 1 / 2 다음