• 페이스북
  • 트위터
  • 유튜브

24시간 자율주행 로봇이 돌며 서버룸 관리…KT 목동 데이터센터 가보니

등록 2025.12.12 06:00:00수정 2025.12.12 06:28:24

  • 이메일 보내기
  • 프린터
  • PDF

D2C 수냉식 국내 첫 상용화…최대 60% 전력 절감 효과

로봇이 24시간 서버룸 순찰…"운영 인력 3분의 1로 감축 목표"

최지웅 대표 KT클라우드 대표 "데이터센터 기술 혁신 새로운 기준 제시"

[서울=뉴시스]오동현 기자 =
서울 목동에 위치한 KT 클라우드 'AI 이노베이션 센터'를 24시간 점검하는 자율주행 로봇. (사진=KT클라우드 제공) *재판매 및 DB 금지

서울 목동에 위치한 KT 클라우드 'AI 이노베이션 센터'를 24시간 점검하는 자율주행 로봇. (사진=KT클라우드 제공) *재판매 및 DB 금지


#. KT클라우드가 서울 목동에 문을 연 'AI 이노베이션 센터'는 자율주행 로봇이 24시간 서버룸을 관리한다. 정해진 스케줄대로 AI 인프라 랙을 돌면서 온도·습도·조도·가스 등 환경 데이터를 실시간으로 수집하고 분석한다. 로봇의 위치는 관제 시스템에서 실시간 확인할 수 있고, 구역별 이상 징후가 감지되면 자동으로 알림이 발생해 운영자가 즉시 대응할 수 있다.

#. 현재 센터 내 D2C(다이렉트 투 칩)  수냉식 시스템은 부하량 10kW에서 온도 33도를 안정적으로 유지하고 있으며, 부하를 120kW까지 올려도 35도에서 안정적인 냉각 성능을 유지하는 것으로 나타났다.


KT클라우드가 11일 서울 목동에서 리퀴드 쿨링(액체냉각)과 인공지능(AI) 기반의 자동화 운영 시스템을 갖춘 'AI 이노베이션 센터'를 공개했다.

이날 센터에서는 국내 최초로 상용화한 D2C 수냉식 냉각 시스템의 실제 작동 모습과 함께 자율주행 로봇을 활용한 서버룸 순찰, AI 기반 장애 예측 시스템 등 차세대 데이터센터 운영 기술이 총망라됐다.

최지웅 KT클라우드 대표는 "AI 이노베이션 센터는 단순한 쇼룸이 아니라, 차세대 데이터센터 기술을 실증하고 고객 가치 중심의 AI 인프라를 구현하기 위한 핵심 플랫폼"이라며 "KT클라우드는 데이터센터 기술 혁신의 새로운 기준을 제시하고, 국내 AI 생태계의 성장을 선도할 것"이라고 말했다.

 *재판매 및 DB 금지


D2C 수냉식 국내 첫 상용화…"최대 60% 전력 절감 효과 확인"

센터에서 가장 눈길을 끈 것은 1kW급 모듈 8개(총 8kW)로 구성된 서버형 수냉식 부하기 기반의 D2C 수냉식 시스템이다. 가산 AI 데이터센터에 국내 최초로 적용한 기술이다.

 허영만 KT클라우드 데이센터본부장(전무)은 "리퀴드 쿨링(액체 냉각)의 상용화 사례가 국내에서는 KT클라우드가 처음"이라며 "내년 상반기 실제 상용 운영을 목표로 구축을 진행하고 있다"고 말했다.

이범민 DC기술팀장은 "엔비디아 B200, NVL72 규격에 맞춰 냉각수 유량, 압력, 온도 등 조건을 지속적으로 실증하며 기술 내재화를 진행했다"며 "프로필렌글리콜 25% 용액에 부식성 억제 첨가제와 살생제를 넣어 배관 재질 반응성 테스트를 진행 중"이라고 설명했다.

센터에는 AI 서버를 특수 액체에 직접 담가 열을 식히는 액침 냉각(Immersion Cooling) 기술의 실제 모형도 전시됐다. KT클라우드는 PoC(기술 검증)를 통해 최대 60%의 전력 절감 효과를 확인했다고 밝혔다.

허 본부장은 "리퀴드 쿨링을 요구하는 고객들은 비용 절감보다 GPU 서버의 안정적 운영에 더 중점을 둔다"며 "AI 기반 서비스는 랙당 100kW, 200kW를 넘어가면 공냉식으로는 냉각이 불가능해 액체 냉각이 필수"라고 말했다.

다만 "공냉식과 수냉식은 당분간 병존할 것"이라며 "고객 요구에 따라 두 방식을 모두 제공할 수 있는 유연한 설계를 유지하고 있다"고 덧붙였다.

D2C 냉각장치가 실제 구현된 모습. (사진=kt 클라우드 제공) *재판매 및 DB 금지

D2C 냉각장치가 실제 구현된 모습. (사진=kt 클라우드 제공) *재판매 및 DB 금지


로봇이 24시간 서버룸 순찰…"운영 인력 3분의 1로 감축 목표"

KT클라우드는 AI 기반 지능형 자동화 기술로 데이터센터 운영 효율화도 추진한다. 센터에서는 자율주행 로봇이 서버룸을 순찰하는 시연이 진행됐으며, 자체 개발한 AI 솔루션들의 작동 모습도 공개됐다.

허 본부장은 "24시간 스케줄 기반의 자율주행을 통해 인간과 로봇이 협력하는 안정적인 데이터센터 운영을 구현하고자 한다"며 "현재 데이터센터 운영에 20명에서 70명 정도의 인력이 필요하지만, 지능형 자동화를 통해 3분의 1 이하로 줄이는 것이 목표"라고 밝혔다.

특허 등록을 완료한 '패스파인더(Path Finder)'는 디지털트윈 기반 시뮬레이션으로 자율형 전력 제어를 구현한다. 부하·안정성·중복성을 고려한 최적 경로 선택으로 운영 신뢰성을 강화한다.

'DIMS 인사이트'는 FMS(전력·냉각·보안 등 주요 설비 통합 관리 시스템) 데이터를 기반으로 AI 자동화 분석을 통해 장애 예측과 예지 정비를 지원한다.

그는 "AI 기반 분석과 예지 기능을 시스템화해 운영 효율성을 개선하고, 이후 단계적으로 인력을 축소할 계획"이라며 "100% 무인화는 시간이 더 필요하지만, 업무를 분류해 단계적으로 무인화를 추진하겠다"고 설명했다.

B200 GPU 기반 AI 학습 모델이 실제 동작하는 모습. (사진=kt 클라우드 제공) *재판매 및 DB 금지

B200 GPU 기반 AI 학습 모델이 실제 동작하는 모습. (사진=kt 클라우드 제공) *재판매 및 DB 금지


RoCEv2 기반 차세대 AI 네트워크 구축

센터에는 글로벌 AI 네트워크 전문기업 아리스타와 협력해 구축한 RoCEv2(RDMA over Converged Ethernet v2) 기반의 AI 전용 네트워크도 공개됐다.

이 네트워크는 AI 서버 간 초고속 데이터 전송을 지원하며, 기존 인피니밴드(고성능 컴퓨팅 환경에서 사용되는 초고속 네트워크 기술) 대비 비용 효율성과 확장성을 높인 차세대 이더넷 RDMA 기술을 적용했다.

RDMA는 서버 간 데이터 전송 시, 중앙처리장치(CPU)를 거치지 않고 메모리에서 직접 처리해 지연을 줄이고 속도를 높이는 기술이다.

KT클라우드가 자체 개발한 표준 랙 기반의 AI 전력 인프라도 소개됐다. 이 표준 랙은 20kW 이상의 AI 서버를 안정적으로 지원하는 고밀도 전력 공급 구조를 갖추고 있으며, DC 48V 전원을 적용해 에너지 효율성과 안정성을 강화했다. 글로벌 OCP(오픈 컴퓨트 프로젝트) 표준을 준수해 호환성도 확보했다.

조현재 KT클라우드 DC기술전략팀장은 "OCP와 오픈 소스를 채용한 이유는 고객사에게 범용성을 제공하기 위한 것"이라며 "이노베이션 센터에서 최적화된 세트를 찾는 데 주력했다"고 말했다.

허 본부장은 "기술을 선제적으로 연구하고 실증해 고객들이 빠르게 의사결정할 수 있도록 지원하는 것이 KT클라우드의 경쟁력"이라며 "국내 AI 생태계 성장을 선도하겠다"고 강조했다.


◎공감언론 뉴시스 [email protected]

많이 본 기사