[특별기고] 데이터 기반 AI, 화학공정 안전의 디지털 혁신

민미미 아주대학교 환경안전공학과 연구교수(한국가스학회 이사)

2025-10-01     채제용 기자

사고 예측 한계와 새로운 접근…데이터 활용한 선제적 분석

데이터 기반 예측과 현장경험이 결합될 때 ‘안전 혁신’ 가능 

민미미 아주대학교 환경안전공학과 연구교수

[이투뉴스] 필자는 지난 10여 년간 화학사고 시뮬레이션 소프트웨어인 FLACS(FLame ACceleration Simulator)를 활용해 화학산업 시설의 폭발·화재 위험성 평가를 연구해왔다. FLACS는 3차원 전산유체역학(CFD, Computational Fluid Dynamics) 기반으로 화학물질 누출 시 바람, 지형, 장애물 등을 고려해 폭발 범위와 피해 정도를 정량적으로 계산할 수 있는 상용 도구다. 이러한 정밀성 덕분에 석유화학 플랜트와 같은 고위험 산업시설에서 학계와 연구기관이 널리 활용해 왔다.

연구적 관점에서는 ‘보다 안전한 공정’과 ‘더 보수적인 설계’가 당연한 결론으로 이어진다. 그러나 실제 산업 현장에 들어서면 상황은 달라진다. 특히 중소기업 입장에서는 안전 투자가 불확실성을 담보로 한 일종의 보험이자 동시에 ‘효과가 불분명한 투자’처럼 느껴질 수 있다. 

모든 사고 시나리오를 대비하는 것은 현실적으로 막대한 비용 부담이 따르고, 특정 사고 가능성에만 선택적으로 투자하기에도 근거가 불충분하다. 결국 ‘사고는 언제, 어떤 조건에서 일어날지 알 수 없다’는 근본적 한계에 부딪히게 된다. 실제 사례를 통해서도 이러한 문제의식은 분명해진다. 지난 2019년 울산 석유화학공장 화재, 2020년 구미 불산 누출사고 등은 사후 분석보다 사전 예측이 훨씬 필요했다는 사실을 보여주었다.

본 기고에서는 이러한 필요성으로 필자가 새롭게 시도하는 AI연구에 대해 간략히 소개하고 이에 따른 제언방향을 논하고자 한다. 

◇ 데이터 분산과 통합의 필요성

AI 기반 사고 예측의 핵심은 과거 데이터를 활용한 선제적 분석이다. 그러나 현실적으로 가장 큰 장애물은 ‘데이터의 분산’이다. 각국 기관은 사고 데이터를 서로 다른 방식으로 분류·관리하고 있어 통합 분석이 어렵다.

예컨대 한국산업안전보건공단(KOSHA)은 주로 인명 피해를 기준으로 사고를 분류하지만, 유럽의 EMARS 데이터는 환경 피해를 더 세분화해 기록한다. 미국은 또 다른 분류 체계를 사용한다. 같은 화재 사고도 한국에서는 ‘화재’, 유럽에서는 ‘열 복사’, 미국에서는 ‘Fire Explosion’으로 기록되는 식이다. 이처럼 제각각인 데이터로는 아무리 많은 사고사례를 수집해도 종합적이고 체계적인 데이터로 활용하기 어렵다.

◇ 화학사고의 ‘공통 언어’ 온톨로지

이를 해결하기 위해 필자가 선택한 방법은 ‘온톨로지(Ontology)’다. 온톨로지는 특정 분야의 개념과 관계를 구조적으로 정리한 ‘지식 지도’라 할 수 있다. 예를 들어 ‘화재’라는 사고 유형이 어떤 장비와 물질, 원인에 의해 발생하고, 결과적으로 어떤 피해를 초래하는지 까지 체계적으로 연결해 표현하는 것이다. 

본고에서는 한국, 미국, 유럽, 독일 등에서 수집한 3,134건의 화학사고 데이터를 온톨로지 방식으로 재구성했다. 국별·기관별로 달랐던 분류 체계를 하나의 ‘공통 언어’로 번역해 서로 다른 사고 데이터가 연결될 수 있는 기반을 마련한 셈이다. [그림1 참조] 

◇ 그래프 신경망, 관계를 학습하는 AI

온톨로지를 통해 데이터를 통합한 뒤에는 AI 분석으로 이어진다. 기존 머신러닝은 개별 요인만을 고려하기 때문에 한계가 있었다. 화학사고는 물질, 장비, 공정, 원인 등이 얽혀 발생하는 ‘관계의 문제’이기 때문이다. 

이에 따라 ‘그래프 신경망(GNN, Graph Neural Network)’을 도입했다. GNN은 개별 요소 간의 연결과 상호작용을 학습하는 기술이다. 예를 들어 ‘노후 배관’과 ‘고압 공정’이 동시에 존재하고, 여기에 ‘가연성 물질’까지 포함되면 위험도가 급격히 높아진다는 '인과 관계'를 학습시킬 수 있다. [그림2 참조] 

◇ 안전 우선의 ‘보수적 접근법’

AI 모델 개발에서 가장 중요한 원칙은 ‘안전 우선’이다. 화학공정안전에서는 사고를 놓치는 것이 부정확한 예측보다 훨씬 위험하다. 따라서 불확실성이 존재할 경우 더 안전한 쪽으로 판단하는 ‘보수적 접근법’을 적용했다. 예측 위험도가 애매하더라도 확신의 정도(확률)가 낮을 경우 자동으로 고위험으로 상향 조정해 심각한 사고를 놓칠 가능성을 최소화 하는 것이다.

◇ 현장 적용을 위한 조건

AI 안전 모델이 연구를 위한 연구 즉, 이론적 연구에 머물지 않고 실제 현장에서 작동할 수 있기 위해서는 몇 가지 조건이 필요하다.

첫째, 실시간 데이터 연동이다. 이미 많은 공정 시설에는 DCS(분산제어시스템)와 IoT 센서가 설치되어 있다. 이를 AI와 연결하면 디지털 트윈 개념처럼 실시간 위험 예측에 보다 동적으로 활용할 수 있다.

둘째, 기존 안전관리 체계와의 연계다. 새로운 시스템이 기존의 HAZOP, SIL 등을 대체한다는 것이 아니다. 전통적으로 사용되어왔고 그 나름의 역할과 노하우 등이 존재하는 기존 판단도구를 보완하는 도구로 융합해 활용되어야 한다.

셋째, 설명 가능한 AI다. 현장 운전원과 안전 담당자가 “AI가 위험하다고 한다”는 결과만 보는 것이 아니라, “압력이 급상승하고 과거 유사 조건에서 사고가 있었다”는 식으로 그 근거를 함께 이해하고 분석할 수 있어야 한다. AI가 현장에서 작동하기 위해서는 현장 사람들과의 협력을 기반으로 쉽게 소통하고 신뢰받을 수 있어야 한다.

◇ 남은 과제와 제언

이런 연구를 진행하며 가장 크게 느낀 한계는 데이터 접근성이었다. 기업들은 보안과 영업비밀을 이유로 사고 데이터를 공유하지 않는 경우가 많다. 이 때문에 연구자들은 사고 후 공개되는 제한적 정보에 의존할 수밖에 없다. 선제적 예방을 위해서는 정부 차원에서 데이터 표준화와 공유 체계를 마련해야 한다. 

또한 산업계의 적극적인 참여도 필수적이다. AI는 아무리 정교해도 현장 경험과 결합되어야 실질적인 힘을 발휘한다. 현장 관리자의 직관과 경험, 그리고 AI의 분석 능력이 만날 때 비로소 ‘안전 혁신’이 가능할 것이다.

필자가 FLACS 중심의 위험성 평가에서 AI 기반 안전연구로 전환한 이유는 단순한 기술적 호기심이 아니다. 기업 자문을 통해 숱하게 경험한 '현장'의 입장에서 절실히 느낀 필요성 때문이다. 사고는 사후에 분석하는 것보다 사전에 예측하고 예방하는 것이 더 중요하다. 누구나 안다고 하는 한 문장일 수 있으나, 이를 실현하기 위해서는 과거의 경험과 미래의 기술이 만나는 혁신적 노력이 필요하다.

정부의 정책 방향이 바뀔 때마다 안전투자 여건도 흔들리는 것이 현실이다. 특히 중소기업은 불확실성 때문에 적극적인 안전투자가 쉽지 않다. 그러나 데이터 기반 예측과 현장 경험이 결합된다면 안전 분야에서도 디지털 혁신은 충분히 실현 가능하다. 그것이야말로 기업과 사회 모두가 바라는 지속가능한 안전의 길일 것이다.