AI 인프라 버블의 균열: 비용 폭발, 거대 자본의 질주, 그리고 '인간적인 것'으로의 회귀

고지서가 날아왔다

우버(Uber)의 2026년 AI 코딩 예산이 4월에 이미 동났다. 마이크로소프트는 개발자들에게 지급했던 클로드 코드(Claude Code) 라이선스를 수개월 만에 회수했다. 프라이스라인(Priceline) 직원은 커서(Cursor) 계약 갱신가가 4~5배 뛰어서 돌아왔다고 털어놓았다.

숫자가 말하는 현실은 냉혹하다. 토큰 단가는 분명히 내려갔다. 그런데 청구서는 오히려 늘어나고 있다. 소비량이 단가 하락 속도를 가볍게 추월한 탓이다. 기업들이 2025년 초 '뷔페식 구독' 모델로 AI를 무제한 흡입하던 시절은 끝났고, 이제는 예산 잔해 속에서 ROI를 건져내려는 처절한 재정 정산이 시작됐다. 동시에 반대편에서는 월 수천억 원 단위 컴퓨트 거래가 조용히 체결되고, 인도에는 30조 원대 데이터센터 투자가 쏟아지고 있다. AI 산업 안에서 두 개의 세계가 동시에 충돌하는 순간이다.

토큰 경제의 역설: 싸질수록 더 많이 쓴다

솔직히 말해, 이 문제의 핵심은 기술이 아니라 행동경제학이다.

TechCrunch가 보도한 것처럼, OpenAI 엔터프라이즈 총괄 알렉산더 엠비리코스(Alexander Embiricos)는 기업 고객과의 대화가 완전히 달라졌다고 밝혔다. 6개월 전 "이게 뭘 할 수 있죠? 충분히 좋은가요?"를 묻던 고객들이 지금은 "우리가 너무 많이 쓰고 있는데, 가시성은? 감사 기능은? 토큰 통제는? 모델 효율은?"을 묻는다. 구매 대화가 성능 검증에서 비용 통제로 완전히 무게중심을 옮긴 것이다.

이 흐름의 배경에는 자율 에이전트(Autonomous Agent) 확산이 있다. 단순한 챗봇 질의는 토큰 소비가 제한적이지만, 복잡한 다단계 에이전트가 작업을 수행하면 동일한 목적에도 수십 배의 토큰이 소모된다. 저단가 모델을 도입했지만 에이전트 사용을 늘린 기업들은 결국 비용이 증가하는 아이러니한 상황에 빠졌다.

이에 대응해 리눅스 재단(Linux Foundation)은 **토크노믹스 재단(Tokenomics Foundation)**이라는 새 표준화 기구 설립을 발표했다. 기업들이 AI 지출을 추적하고 감사하며 통제할 수 있는 공통 언어와 도구를 만드는 것이 목표다. 스타트업들과 기존 벤더들도 같은 수요를 노리고 시장에 몰려들고 있다. 비용 가시성(Cost Visibility)이 2026년 엔터프라이즈 AI의 핵심 화두로 떠오른 셈이다.

조 단위 컴퓨트 거래: 스페이스X의 조용한 변신

한편 그 비용이 어디로 흘러가는지를 보면, 그림이 더 선명해진다.

TechCrunch 보도에 따르면 구글(Google)은 2026년 10월부터 2029년 6월까지 스페이스X(SpaceX)에 **월 9억 2,000만 달러(약 1조 2,600억 원)**를 지불하기로 했다. 엔비디아(NVIDIA) GPU 약 11만 개, CPU, 메모리 등 관련 컴퓨트 자원에 접근하는 조건이다. 5월에 앤트로픽(Anthropic)이 체결한 월 12억 5,000만 달러 계약과 유사한 구조로, 앤트로픽은 테네시주 멤피스 인근 콜로서스 1(Colossus 1) 데이터센터의 전체 컴퓨트를 2029년까지 임대한다.

주목할 만한 건, 이 두 거래가 스페이스X의 IPO를 앞두고 규제 당국 제출 서류에 공개됐다는 점이다. 스페이스X는 로켓 회사에서 AI 컴퓨트 임대 사업자로 변신 중이다. 일론 머스크가 콜로서스 2(Colossus 2)는 xAI를 위해 남겨두겠다고 언급한 점을 감안하면, 구글이 접근하게 될 데이터센터의 위치는 아직 불분명하다.

흥미로운 점은 구글이 단순한 컴퓨트 부족 기업이 아니라는 것이다. 일부 추정에 따르면 구글은 세계 최대의 AI 컴퓨트 단일 보유자로 꼽힌다. 그럼에도 이 거래를 "최근 출시한 AI 제품에 대한 예상치 못한 수요 때문"이라고 설명했다. 즉, 세계 최강의 인프라를 가진 기업조차 수요 폭발 앞에서 외부 조달이 불가피한 상황이 됐다.

인도 데이터센터 붐: 5GW, 30조 원의 도박

같은 날 또 다른 거대한 숫자가 등장했다.

블랙스톤(Blackstone) 계열 데이터센터 운영사 에어트렁크(AirTrunk)가 2030년까지 인도에 **300억 달러(약 41조 원)**를 투자해 5GW 규모의 AI 데이터센터를 구축하겠다고 밝혔다. TechCrunch 보도에 따르면 인도 데이터센터 용량은 현재 약 1.5GW에서 2030년 8GW까지 성장할 것으로 버스타인(Bernstein)이 전망한다. 에어트렁크는 마하라슈트라주 라이가드 펜 성장 센터(Raigad Pen Growth Center)에 약 3GW 규모, 투자액 약 2조 루피(약 21억 달러) 규모의 데이터센터 부지를 이미 확보한 상태다.

인도 정부는 이 흐름에 적극 올라탔다. 해외 클라우드 사업자가 인도 데이터센터에서 처리한 해외 서비스 매출에 대해 2047년까지 세금 면제를 제공하는 정책을 발표했다. 조세 인센티브의 기간이 20년을 넘는다는 건 단순한 유치 경쟁이 아니라 국가 전략 차원의 승부수다. 아시아 AI 인프라 경쟁이 중동, 동남아를 넘어 인도 아대륙으로 전선을 넓히는 모양새다.

'같이 있고 싶다'는 반격: Together Tech 웨이브

이 모든 스케일의 자본 움직임 한편에서, 전혀 다른 신호가 조용히 울리고 있다.

TechCrunch 이퀴티 팟캐스트는 이른바 **'투게더 테크(Together Tech) 웨이브'**를 2026년 가장 흥미로운 스타트업 베팅으로 꼽았다. 미러(Mirror) 창업자 브린 퍼트남(Brynn Putnam)이 오프라인 게임과 사교 경험 중심의 스타트업 보드(Board)에 투자를 유치했고, 사이버덱(Cyberdeck) 창작자들이 직접 만든 DIY 컴퓨터로 바이럴을 타고 있다. 이들의 공통점은 AI로부터 의도적으로 멀어지는 것이 아니라, 단지 더 인간적인 것에 끌린다는 점이다.

전 메타(Meta) CTO 마이크 슈뢰프퍼(Mike Schroepfer)가 기후 테크에 2억 5,000만 달러를 조성했고, 로켓 엔진 스타트업 임펄스(Impulse)는 5억 달러를 유치하면서 자금이 AI가 아닌 사람에게 쓰인다고 공개적으로 강조했다. 앤트로픽의 기밀 IPO 제출 서류가 공개되면서 AI 랩들의 실제 재무가 처음으로 비교 가능한 수준이 될 전망이다. 알파벳의 800억 달러 AI 투자 발표와 맞물려, 과연 거대한 돈이 소수 빅테크에 다시 집중되는 것은 아닌지 묻는 시선도 커졌다.

K-AI·K-방산이 잡아야 할 좌표

이 일련의 흐름은 한국에 매우 구체적인 기회의 창을 열어준다. 세 가지 방향에서 읽어야 한다.

첫째, AI 비용 가시성 솔루션 시장. 토크노믹스 재단의 등장은 표준이 아직 공백 상태임을 의미한다. 이 공백은 후발주자에게도 진입 기회다. 한화시스템은 AI 기반 지휘통제체계(C2) 개발에서 대규모 LLM 추론을 운용하며 토큰 비용 최적화 문제를 이미 내부적으로 직면하고 있다. 군 전용 프라이빗 LLM 운용 노하우를 민간 AI 비용 관리 솔루션으로 전환한다면, 방산과 민간 AI 사이를 잇는 독특한 포지셔닝이 가능하다.

둘째, 국산 AI 인프라 자립. 구글조차 외부 컴퓨트를 조달하는 상황에서, 한국 방산·국방 분야의 AI 인프라 의존도 문제는 더 이상 미래의 과제가 아니다. **국방AI센터(CDAI)**와 방위사업청(DAPA)이 추진 중인 국방 AI 클라우드 구축 사업은 국내 GPU 클러스터 자립 역량 확보를 핵심 아젠다로 삼아야 한다. 인도가 2047년까지의 세제 혜택으로 외자를 유치하는 방식처럼, 한국도 국산 AI 인프라에 장기 투자 인센티브를 설계할 필요가 있다.

셋째, AI 자율 무기체계의 비용 효율화. LIG넥스원의 LAMD 저고도 레이저 대드론 체계, 현대로템의 자율주행 무인 지상차량(UGV)은 모두 온보드 AI 추론을 필요로 한다. 토큰 소비 폭발과 에이전트 비용 문제는 민간만의 이야기가 아니다. 전장에서 실시간으로 동작하는 AI 에이전트의 추론 비용 최적화—즉 '군사용 토크노믹스'—는 **ADD(국방과학연구소)**가 선제적으로 연구 어젠다로 가져가야 할 분야다.

균열 이후가 진짜 게임이다

지금 우리가 목격하는 것은 AI 산업의 위기가 아니라 성숙기로의 전환이다. 버블이 꺼지는 것이 아니라, 버블의 껍질이 두꺼워지는 과정에 가깝다.

단기적으로는 비용 관리 툴링, 에이전트 효율화, 온디바이스 추론(On-device Inference) 시장이 빠르게 성장할 것이다. 중기적으로는 스페이스X·에어트렁크 같은 '컴퓨트 임대업자'가 클라우드 빅3와 나란한 인프라 플레이어로 부상할 가능성이 높다. 장기적으로는 인도, 동남아, 중동 중심의 지역화된 AI 인프라가 미-중 중심의 현재 구조를 재편할 것이다.

다만 리스크도 있다. 앤트로픽 IPO 서류가 공개되면서 AI 랩들의 실제 수익성이 드러날 경우, 투자 심리가 급격히 냉각될 수 있다. 투게더 테크 웨이브가 단순한 니치 트렌드에 그칠지, 아니면 AI 피로감(AI Fatigue)이 소비자 시장에서 구조적 역풍이 될지도 지켜볼 지점이다.

결국 AI 산업의 다음 승자는 '가장 강력한 모델'을 만든 곳이 아니라, '가장 효율적으로 쓰이는 모델'을 만든 곳에서 나올 가능성이 크다.

자주 묻는 질문 (FAQ)

Q1. 토큰 단가가 내려갔는데 왜 AI 비용이 오히려 늘어나나요?

A. 자율 에이전트 확산으로 작업당 토큰 소비량이 급증하고, 기업들이 더 많은 용도에 AI를 적용하면서 총 사용량이 단가 하락 속도를 초과하기 때문입니다. 단가 하락이 소비 증가를 유발하는 '리바운드 효과'와 유사한 구조입니다.

Q2. 구글이 세계 최대 AI 컴퓨트 보유자인데도 스페이스X에서 추가 컴퓨트를 빌리는 이유는 무엇인가요?

A. 구글은 최근 출시한 AI 제품들의 수요가 예상을 초과했다고 밝혔습니다. 자체 인프라 증설에는 수년이 걸리므로, 즉각적 용량 확보를 위해 외부 조달을 선택한 것으로 보입니다.

Q3. 투게더 테크(Together Tech) 웨이브는 AI 반발(backlash)과 다른가요?

A. 단순한 반감이 아닌, 오프라인 연결과 인간적 경험 자체에 대한 긍정적 수요로 해석됩니다. AI를 거부하는 것이 아니라 AI 외부의 가치에 자발적으로 끌리는 움직임이라는 점에서 구조적으로 다릅니다.

Q4. 한국 국방부문에서 AI 비용 최적화가 왜 중요한가요?

A. 전장 실시간 AI 추론은 클라우드 의존 없이 온보드 또는 에지(edge)에서 처리해야 합니다. 토큰 효율이 낮으면 배터리·대역폭·반응속도에 직접 영향을 미쳐 전투 효과가 저하되므로, 군사용 AI 비용 최적화는 성능 문제이기도 합니다.

Q5. 에어트렁크의 인도 30조 원 투자, 한국과의 경쟁 관계는 어떻게 보나요?

A. 직접 경쟁보다는 상호 보완적 관계에 가깝습니다. 인도가 대규모 범용 컴퓨트 허브를 지향한다면, 한국은 반도체 설계·제조와 연계한 고성능 특화 인프라로 차별화할 수 있는 여지가 있습니다.

여러분은 AI 비용 폭발 문제가 일시적 성장통인지, 아니면 엔터프라이즈 AI 도입 속도 자체를 구조적으로 늦출 분기점인지에 대해 어떻게 보십니까?

AI 인프라 버블의 균열: 비용 폭발과 기업들의 재정 정산