GPU 다음 전쟁터는 냉각이다
AI 이야기를 하면 보통 두 가지가 먼저 나옵니다. 엔비디아의 GPU, 그리고 전력.
그런데 지금 업계에서 조용히 다음 문제로 넘어가고 있습니다. 바로 열입니다.
전기를 확보하는 것만큼이나, 그 전기가 만들어내는 열을 어떻게 처리하느냐가 AI 데이터센터의 실질적인 한계가 되고 있기 때문입니다.
서버 한 줄이 내뿜는 열이 얼마나 될까
데이터센터에는 서버들이 랙(Rack)이라는 선반 구조물에 빽빽하게 꽂혀 있습니다.
예전에는 랙 하나가 소비하는 전력이 5~10kW 수준이었습니다. 작은 에어컨 한 대 정도의 전력입니다.
그런데 AI 연산에 특화된 최신 GPU 서버가 들어가면 이야기가 달라집니다. 지금은 랙 하나가 50kW, 경우에 따라서는 100kW 이상을 요구하기도 합니다. 불과 몇 년 사이에 10배 가까이 뛴 겁니다.
전력이 올라가면 열도 같이 올라갑니다. 이건 피할 수 없는 물리 법칙입니다.
그리고 그 열이 지금 데이터센터 설계자들의 가장 큰 골칫거리가 됐습니다.
팬으로 바람 불어넣는 시대는 끝나가고 있다
기존 데이터센터는 공랭 방식으로 열을 식혔습니다. 말 그대로 찬 공기를 서버 사이로 흘려보내는 방식입니다.
구조가 단순하고 비용이 낮아서 오랫동안 표준처럼 쓰였는데, 문제는 공기가 열을 흡수하는 능력이 생각보다 낮다는 겁니다.
랙 전력이 10kW일 때는 어떻게든 버텼습니다. 그런데 50kW, 100kW가 되면 팬을 아무리 빠르게 돌려도 한계가 옵니다.
팬을 더 빠르게 돌리면 어떻게 될까요. 소음이 커지는 것은 물론이고, 팬 자체도 전기를 먹습니다. 냉각을 위해 쓰는 전력이 늘면 또 열이 납니다. 악순환입니다.
실제로 현재 대형 데이터센터에서 냉각에 쓰이는 전력은 전체 소비 전력의 30~40%에 달하는 경우도 있습니다. 서버를 돌리는 전기의 절반 가까이를 서버를 식히는 데 쓰고 있는 셈입니다.
이 구조로는 AI 서버 밀도를 더 높이는 것 자체가 불가능에 가까워집니다.
그래서 서버를 물에 담그기 시작했다
이 한계를 넘기 위해 등장한 방식이 액침냉각입니다.
말 그대로 서버를 특수 냉각 액체 속에 통째로 담가버립니다. 처음 들으면 이게 말이 되나 싶지만, 액체는 공기보다 열을 흡수하는 능력이 수천 배 이상 뛰어납니다.
서버가 아무리 뜨거워져도 액체가 그 열을 빠르게 빨아들이기 때문에 온도가 안정적으로 유지됩니다.
당연히 팬이 필요 없어집니다. 팬이 없으니 팬이 쓰는 전기도 사라집니다. 소음도 없습니다.
그리고 가장 중요한 것, 같은 공간에 훨씬 더 많은 서버를 집어넣을 수 있게 됩니다. 공기가 지나갈 통로를 확보할 필요가 없으니까요.
마이크로소프트는 이미 액침냉각 방식을 적용한 데이터센터를 테스트해왔고, 구글과 아마존도 비슷한 방향으로 움직이고 있습니다. 엔비디아는 자사의 최신 GPU 서버 블랙웰 아키텍처가 액침냉각 환경에 최적화되어 있다는 점을 대놓고 강조하고 있습니다.
이게 일부 선진 기업의 실험이 아니라, 업계 전체가 움직이기 시작했다는 신호입니다.
아직 해결 안 된 문제들
그렇다면 왜 아직 모든 데이터센터가 액침냉각으로 바꾸지 않는 걸까요.
현실은 간단하지 않습니다.
우선 비용이 문제입니다. 액침냉각 시스템은 기존 공랭 방식보다 초기 투자 비용이 훨씬 높습니다. 특수 액체도 비싸고, 그 액체를 순환시키는 장치도 복잡합니다.
유지보수도 쉽지 않습니다. 서버에 문제가 생겼을 때 공랭 방식이라면 그냥 꺼내서 교체하면 됩니다. 액침 방식은 액체 속에서 꺼내야 하고, 액체가 묻은 서버를 처리하는 절차도 따로 있습니다.
표준도 아직 없습니다. 어떤 액체를 써야 하는지, 온도 관리는 어떻게 해야 하는지, 업체마다 방식이 다르다 보니 호환성 문제도 있습니다.
그래서 지금은 완전한 액침냉각과 기존 공랭 방식의 중간 단계인 ‘Direct-to-Chip 수랭’이라는 방식도 함께 확산되고 있습니다. 칩에 직접 냉각수를 흘려보내는 방식으로, 공랭보다 효율이 높으면서 액침보다 도입이 쉬운 절충안입니다.
업계는 지금 한 가지 방식이 아니라 여러 방식을 상황에 따라 조합하는 방향으로 가고 있습니다.
심지어 바다 밑에 서버를 넣자는 이야기도 나온다
냉각 문제가 얼마나 심각하게 받아들여지고 있는지 보여주는 사례가 있습니다.
마이크로소프트는 실제로 수중 데이터센터 프로젝트를 진행한 적이 있습니다. ‘프로젝트 나틱(Project Natick)’이라는 이름으로, 방수 처리된 서버 컨테이너를 바닷속에 가라앉혀서 테스트했습니다. 바닷물의 냉각 효과를 이용하면서 동시에 부지 문제도 해결하겠다는 발상이었습니다.
결과는 흥미로웠습니다. 육상 데이터센터보다 고장률이 낮았습니다. 바닷속이 온도·습도 변동이 없는 안정된 환경이었기 때문입니다.
아직 상용화 단계는 아니지만, 업계가 냉각 문제를 해결하기 위해 얼마나 다양한 방향을 탐색하고 있는지를 잘 보여주는 사례입니다.
한국은 이 흐름에서 어디쯤 있나
냉각 산업은 국내 투자자들에게도 의미 있는 흐름입니다.
국내에는 산업용 냉각 시스템, 열교환기, 특수 유체, 펌프 및 순환 장치를 만드는 기업들이 있습니다. 이 기업들이 글로벌 AI 데이터센터 공급망에 편입될 수 있는 가능성이 열리고 있습니다.
다만 여기서 냉정하게 볼 부분이 있습니다.
냉각이 구조적으로 성장하는 산업이라는 건 맞습니다. 하지만 지금 시장에서는 그 기대가 이미 상당 부분 주가에 반영된 기업들도 있습니다. 기대감만으로 올라간 주가는 실제 수주와 실적이 뒷받침되지 않으면 흔들립니다.
냉각 기술이 빠르게 표준화되면 가격 경쟁이 시작됩니다. 초기에 높은 마진을 누리던 기업들도 경쟁자가 늘어나면 수익성이 달라질 수 있습니다.
AI 연산 효율이 예상보다 빨리 개선되면 발열 자체가 줄어들 가능성도 있습니다. 딥시크 사례처럼, 더 적은 자원으로 비슷한 성능을 내는 방향의 기술 발전이 냉각 수요 증가 속도를 늦출 수도 있습니다.
결국 다음 병목은 여기다
AI 경쟁의 구조를 큰 그림으로 보면 이렇습니다.
처음엔 GPU를 누가 더 많이 확보하느냐였습니다. 그 다음엔 전력을 누가 먼저 확보하느냐로 넘어갔습니다. 그리고 지금은 그 전력이 만들어내는 열을 누가 더 잘 처리하느냐가 조용히 떠오르고 있습니다.
AI 모델이 커질수록, 데이터센터가 조밀해질수록, 냉각은 선택이 아니라 AI 인프라의 필수 조건이 됩니다.
화려한 알고리즘 뒤에서 서버를 묵묵히 식혀주는 기술이 다음 경쟁의 숨겨진 중심이 되고 있습니다.