• 페이스북
  • 트위터
  • 유튜브

"언젠가 터졌을 일"…IT 전문가들이 바라본 정부행정망 먹통사고

등록 2023.11.20 16:21:27수정 2023.11.20 17:27:30

  • 이메일 보내기
  • 프린터
  • PDF

전자정부 출범 이후 사상초유 행정망 셧다운…디지털플랫폼정부의 민낯 여실

네트워크 장비 이상이라면서 명확한 원인 파악 못해…'유명무실' DR시스템

IT 전문가들 "총체적 부실…근본적인 혁신없으면 또다시 일 터질 수도"


[서울=뉴시스] 권창회 기자 = 이상민 행정안전부 장관이 19일 서울 종로구 청운효자동 주민센터를 방문해 정부 행정전산망인 '새올'과 사회보장통합정보시스템 '행복이음'의 정상 작동 여부를 확인하고 있다. (공동취재) 2023.11.19. photo@newsis.com

[서울=뉴시스] 권창회 기자 = 이상민 행정안전부 장관이 19일 서울 종로구 청운효자동 주민센터를 방문해 정부 행정전산망인 '새올'과 사회보장통합정보시스템 '행복이음'의 정상 작동 여부를 확인하고 있다. (공동취재) 2023.11.19. [email protected]


[서울=뉴시스]송혜리 기자 = 2002년 전자정부 출범 이후 사상 초유의 행정망 셧다운 사태에 정보기술(IT) 전문가들은 '언젠가 터졌을 일'이라고 꼬집는다.

사고 발생 시를 대비한 이중화 장비가 있었음에도 불구하고, 복구에 사흘이나 걸릴 것은 재해복구(DR)시스템 설계·운영 측면에서 상당한 허점이 있음을 방증한다. 지난해 카카오톡 먹통 대란 당시 DR 시스템이 부실했다며 민간기업을 혹독한 잣대로 채찍질했던 정부가 정작 대국민 서비스와 직접 관련된 DR 시스템 운영은 너무 허술하게 관리한 것 아니냐는 비판이 나온다.

정부 정보기술(IT) 발주 제도에도 문제가 많다고 지적한다. 전문인력의 즉시 투입과 위기 대응 능력 부족을 초래한 대기업참여제한 제도가 대표적이다. 정부가 최저가 입찰제를 폐지하고 혁신기술 등 비가격 측면을 강조한 종합심사입찰제를 도입했지만, 현실은 여전히 가격 위주로 입찰이 진행되고 있는 것도 폐단으로 꼽힌다.

근본적으로 전체 전자정부 시스템을 세부적으로 이해하고 리스크·품질을 관리·통제할 수 있는 정부 컨트롤타워가 없다는 게 문제라고 전문가들은 진단한다.

카카오 먹통때 "재해복구(DR) 시스템 허술하다"고 난리 친 정부…정부 DR 시스템이 더 큰 문제

지난 17일 발생한 전국 행정 전산망 '먹통' 사태는 20일 대부분 정상화됐다. 정부는 '새올' 행정 전산 시스템에 접속하는 GPKI 인증 시스템의 장비 에러가 직접적인 원인이라고 밝혔다. 지난 19일 행정안전부는 해당 GPKI인증시스템의 서버 등을 모두 점검 분석한 결과, 인증시스템의 일부인 네트워크 장비(L4스위치)에 이상이 있는 것으로 확인돼 이를 18일 새벽에 교체하고 안정화 작업을 한 이후 테스트를 거쳐 서비스를 정상적으로 재개했다고 설명했다.

GPKI인증시스템은 지자체 공무원들이 새올에 로그인할 때 '인증서' 역할을 하는 프로그램이다. 해당 시스템의 일부인 L4스위치는 인터넷과 같은 네트워크를 통해 주고받는 정보들을 어디로 보낼지 결정해 주는 역할을 하는 통신 장비다. 이 장비에 에러가 발생했다는 얘기다. 그러나 어떤 이유로 에러가 났는지 여부에 대해서는 명확하게 밝혀내지 못했다. 그러면서 장비가 노후화됐거나 해킹 등 다른 외부공격 가능성은 없다고 했다. 원인을 밝혀내지 못했기 때문에 언제든 다시 유사한 문제가 발생할 가능성이 없지 않다.

IT 전문가들은 어떤 이유에서든 백업 시스템이 제대로 가동되지 않았다는 걸 심각한 문제로 보고 있다. 불과 1년 전인 카카오톡 불통 사태 당시 정부가 상시 재해복구(DR)시스템을 강조했으면서, 정작 정부 DR 시스템은 제대로 작동되지 않았다는 점을 이해할 수 없다고 말한다. 카카오톡 불통 사태를 계기로 정부가 '카카오 먹통 방지법'까지 만들어 이중화 시스템을 사실상 의무화했다.

행안부는 이중화시스템이 있었지만 이마저 오류가 있었다고 해명했다. 현재 정부 행정전산망을 관리하는 국가정보자원관리원은 대전, 광주, 대전 등 세 곳으로 나뉘어 있으며, 이들은 장애 발생 시 서로를 백업할 수 있도록 구성돼 있다. 서보람 행안부 디지털정부실장은 "장비가 문제가 발생하지 않도록 하기 위해서 장비를 이중화해서 운영하고 있다"면서 "하지만 당일에는 이중화돼 있는 두 개의 장비가 순차적으로 계속 문제를 일으켰다"고 설명했다. 전문가들은 윈도의 백업 시스템처럼 특정 소프트웨어 업데이트와 같이 시스템을 변경할 때 이전 시스템 환경이 유지되도록 해야 하는데, 이 프로세스에 문제가 있는 것 아니냐고 지적한다.

정보통신정책연구원(KISDI)원장을 지낸 권호열 강원대학교 교수는 "현재 정확한 원인을 파악하지 못하고 넘어가게 되면 이와 비슷한 사고가 또다시 발생할 가능성이 높다"며 "기본적인 부분부터 짚고 넘어가는 것이 중요한 시점"이라고 지적했다.

권 교수는 "정부 행정망 시스템은 여러 계층으로 나뉜 여러 시스템이 각각 맡은 기능을 수행하며, 각기 다른 팀들이 유지보수를 담당하는 형태라 시스템들이 서로 영향을 줄 수밖에 없단 점을 간과해선 안 된다"면서 "무엇보다 일관된 유지보수 작업이 됐는지 확인하고, 시스템 안정성을 보장하는 것이 필요하다"고 말했다.

운영 홀대하는 관행 개선해야…근본적인 정부 IT발주 제도 확 바꿔야

근본적으로는 정부의 IT발주 시스템에 문제가 있다는 지적도 나온다. 대부분의 사업 예산 배정이 시스템 설계와 구축에 맞춰져 있고  운영과 유지보수에는 비교적 소홀한 관행이 이 같은 사고를 불렀다는 지적이다.

IT제품은 공급 이후 지속적인 시스템 업데이트 등의 운영지원이 필요하다. 이런 특성을 반영해 공공기관 IT사업에서도 제품 구축 이후 유지보수에 대한 비용을 별도로 책정하나, 외산제품과 국산제품 간 요율 차이는 10% 이상 나는 것으로 알려졌다. 관련 업계에 따르면 현행 공공기관에서 SW 제품 구매 시 외산 제품은 제품가격의 22%, 국산은 10% 내외를 유지보수비용으로 지급한다.

'부실한 운영 감리'도 문제점으로 지적됐다. 현재 서비스 품질관리를 위해 5억원이상 정부사업에는 '개발 감리'를 받도록 하고 있지만, 운영 상태를 정기적으로 점검하는 감리는 제대로 활성화되지 않고 있다.

익명을 요구한 모 교수는 "통상 정부 발주 IT 사업들이 시스템 구축에만 관심 있고 정작 운영에 대해선 소홀한 경향이 있다"며 "결과적으로 구축에 따른 운영까지 함께 봐줘야 하는데 시스템 운영과 유지보수 분야는 홀대하니, 이 같은 일이 발생할 수밖에 없다"고 지적했다.    

관련 업계 관계자도 "건축에서도 원래 설계한 대로 시공이 되는지 감리를 통해 확인하는데, 감리가 제대로 가동되지 않으면 그야말로 '순살아파트'가 돼 버리는 것"이라며 "정부 시스템도 규모가 큰 시스템이다 보니, 계획적인 구축감리와 이후 철저한 모니터링 장애 감지 등을 위한 운영 감리가 이뤄져야 한다"고 말했다.

지난 10년간 실효성 논란이 이어졌던 대기업참여 제한 제도의 병폐도 보는 시각도 있다. 정부 공공 IT 프로젝트에 대기업 참여가 제한됨에 따라 정작 위기 상황 시 대응 능력이 상당히 떨어진다는 게 이유다. 중소기업에선 인력 이직이 잦아 긴급 사태 당시 제대로 된 대응을 맡아줄 전문인력이 부족하다. 여기에 정부 발주처도 사업의 품질 관리를 위한 선택 폭도 줄어들 수 있다는 이유다.

관련 업계 관계자는 "중소기업이 맡았다고 프로젝트 품질이 떨어지는 건 아니지만, 중소기업은 전문인력의 이직이 잦아 시스템 사고가 터지면 투입하는 인력이 대기업에 비해서 제한될 수밖에 없다는 게 현실"이라고 말했다. 이와 관련해 국민 생활과 직접적인 시스템의 경우 우 대기업 진출을 전면 허용해야 한다는 의견도 나오고 있다.

일각에선 최저가 입찰제 대신 혁신기술 등을 먼저 고려할 수 있도록 정부가 주요 IT 프로젝트 입찰제를 바꿨지만, 여전히 써낸 입찰가격이 당락을 결정하는 구조도 문제점이라고 꼬집는다. IT업계의 한 원로인사는 "결국 회사 규모와 기술력 등이 비슷하면 결국 입찰가격에 의해 정해질 수밖에 없고, 이는 최저가 입찰 폐단이 입찰제 개편 뒤에도 계속 이어지는 이유"라고 지적했다.

정부의 행정전산망 시스템이 워낙 다양하게 이뤄지고 통합되다 보니 발생할 수밖에 없는 필연적 재앙으로 이번 사태를 보고 있다. 이에 따라 전체 시스템을 세부적으로 이해하고 큰 틀에서 리스크·품질을 관리·통제할 수 있는 정부 PM(프로젝트 매니저)을 둬야 한다는 의견도 나오고 있다.

권호열 교수는 "이번과 같은 일이 재발하지 않도록 앞으로 한 달 정도는 전문가들을 투입해, 유사한 사례를 찾고 또 총체적 점검 등 철저한 원인 분석이 있어야 한다"며 "이전의 몇 년 치를 재검토 하고, 앞으로는 어떻게 안전성을 보장할 수 있는지 대응책을 마련해야 한다"고 말했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사