AI 인프라 전쟁의 진짜 전선: 메모리·통신·엣지를 장악하는 자가 미래를 쥔다

핵심 요약

2026년 5월, AI 업계에서 동시다발로 터진 네 가지 소식은 각각 별개처럼 보이지만 하나의 거대한 구조적 전환을 가리킨다. 엔터프라이즈 AI 검색 기업 Glean은 ARR 3억 달러를 돌파하며 '비용 절감'을 핵심 무기로 내세웠고, 한국계 스타트업 XCENA는 메모리 병목을 정면 돌파하는 근처연산(Processing-in-Memory, PIM) 칩으로 1억 3,500만 달러를 조달했다. 자율주행 연구 전선에서는 지연-정확도 트레이드오프를 실시간으로 해결하는 다중해상도 신경망이 발표됐으며, 통신 분야에서는 파일럿 오버헤드 없이 스펙트럼 효율을 높이는 딥러닝 수신기 설계가 제안됐다. 이 모든 움직임의 교집합은 하나다. AI가 실제 현장에 배치되는 순간, 연산 비용·지연·통신 효율이라는 세 가지 벽이 동시에 무너져야 한다는 것.

'구글 포 엔터프라이즈'가 3억 달러를 번 진짜 이유

솔직히 말해, ARR 3억 달러라는 숫자 자체보다 그 성장 속도가 더 충격적이다. TechCrunch에 따르면 Glean은 불과 15개월 만에 1억 달러에서 3억 달러로 ARR을 3배 끌어올렸다. 스타트업 세계에서도 보기 드문 수직 상승이다.

흥미로운 점은 Glean이 지금 '성장'이 아니라 '비용 절감'을 셀링 포인트로 내세우고 있다는 사실이다. CEO Arvind Jain은 자사의 컨텍스트 그래프(Context Graph) — 기업 내부 소프트웨어 시스템 전체를 연결·학습하는 지식 구조 — 가 AI 연산 비용 자체를 줄여준다고 주장한다. AI 모델에 맥락을 미리 제공함으로써 불필요한 토큰 소모와 반복 쿼리를 줄이는 방식이다.

경쟁 환경도 급변했다. 창업 초기 4~5년간 사실상 독주하던 Glean 앞에 이제 Google, Microsoft, OpenAI, Anthropic, Salesforce, Atlassian이 줄지어 서 있다. 거인들의 진입이 오히려 시장 자체를 키우고 있다는 역설. Jain이 "퍼스트 무버 이점과 제품 우위를 모두 가져야 한다"고 강조하는 이유가 여기 있다.

메모리가 병목이다 — XCENA가 던지는 질문

ChatGPT에 질문 하나를 입력하면 무슨 일이 벌어질까. 데이터는 메모리 → CPU → GPU → 메모리의 왕복 릴레이를 단어 하나가 생성될 때마다 반복한다. 이 구조적 비효율이 AI 인프라 전력 소비와 비용의 상당 부분을 차지한다.

TechCrunch가 보도한 XCENA의 접근법은 단순하면서도 근본적이다. DRAM — 프로세서가 현재 사용 중인 데이터를 저장하는 고속 단기 메모리 — 바로 옆에 연산 기능을 붙여버리는 것. CPU와 GPU의 왕복 없이 메모리 근처에서 루틴 연산을 처리한다. PIM(Processing-in-Memory) 또는 CIM(Compute-in-Memory) 개념의 상용화 시도다.

2022년 설립된 XCENA의 CEO Jin Kim, CTO Dohun Kim, CPO Harry Juhyun Kim은 모두 삼성전자와 SK하이닉스 출신이다. "CPU와 GPU는 수십 년에 걸쳐 스마트해졌다. 메모리는 그렇지 않았다"는 Jin Kim의 발언은 단순한 마케팅 문구가 아니다. 이번 시리즈 B 1억 3,500만 달러 조달로 누적 투자액은 1억 8,500만 달러, 기업가치는 5억 7,000만 달러에 달한다.

이 수치는 단순한 투자 이벤트가 아니라, 실리콘 레벨에서 AI 인프라 비용 구조를 재편하려는 시장의 의지를 보여주는 숫자다.

자율주행과 통신: 엣지에서 벌어지는 두 개의 전투

지연이 곧 생명 — 다중해상도 자율주행 신경망

arXiv에 발표된 연구는 자율주행 AI의 아킬레스건을 정면으로 다룬다. 문제의 핵심은 **지연-정확도 트레이드오프(Latency-Accuracy Tradeoff)**다. 정확한 예측을 위해 고해상도 입력을 쓰면 처리가 느려지고, 빠른 반응을 위해 저해상도를 쓰면 정확도가 떨어진다. 교차로에서 0.1초가 사고와 안전의 경계가 되는 환경에서 이 문제는 이론이 아니라 생사의 문제다.

Qitao Weng과 Heechul Yun이 제안한 다중해상도 엔드투엔드 심층 신경망은 **해상도별 배치 정규화(Per-Resolution Batch Normalization)**를 통해 단일 모델이 여러 입력 해상도를 지원하도록 설계됐다. 주행 환경의 복잡도와 현재 가용 연산 자원에 따라 런타임에서 최적 해상도를 동적으로 선택한다. CARLA 도심 주행 시뮬레이터에서 검증됐으며, 원본 학습 데이터셋 없이도 다중해상도 학습이 가능한 '해상도 재타겟팅(Resolution Retargeting)'도 포함됐다.

파일럿 없이 데이터를 보내라 — 딥러닝 수신기의 도전

arXiv의 또 다른 논문은 무선 통신의 숨겨진 비효율을 파고든다. 현재 통신 시스템은 채널 상태를 파악하기 위해 '파일럿 신호' — 데이터 전송에 쓰이지 않는 참조 신호 — 를 별도로 전송한다. 이것이 스펙트럼 자원의 상당 부분을 잠식한다.

중첩 파일럿(Superimposed Pilot, SIP) 방식은 파일럿과 데이터를 동시에 전송해 오버헤드를 없애지만, 파일럿-데이터 간 간섭이 심각하다. 연구진이 제안한 데이터 종속 중첩 훈련(Data-Dependent Superimposed Training, DDST) 기반 딥러닝 수신기는 대수적 구조를 활용해 비반복적 디커플링을 달성하고, 빠르게 변하는 채널 환경에서는 직교 파일럿과 SIP를 혼합하는 전략으로 강인성을 확보한다. 5G/6G 시대 드론·로봇·자율 무기체계의 통신 효율에 직결되는 연구다.

네 가지 소식이 그리는 하나의 지형도

영역	핵심 문제	해결 접근법	방산·AI 적용
엔터프라이즈 AI 검색	토큰 비용·맥락 부재	Context Graph	전장 정보 통합, C4I 비용 절감
AI 반도체	메모리-연산 왕복 병목	PIM/CIM	온보드 AI 처리, 전력 절감
자율주행 AI	지연-정확도 트레이드오프	다중해상도 DNN	자율 무기체계 실시간 결심
무선 통신	파일럿 오버헤드	DDST + 딥러닝 수신기	드론 군집·전술통신 효율

네 개의 연구·사업 흐름이 모두 같은 방향을 가리키고 있다. 실제 현장 배치(Deployment)에서의 효율. 실험실 정확도가 아니라, 전력 제약·지연 제약·비용 제약이 동시에 걸린 환경에서의 성능이 곧 경쟁력이다.

K-방산·K-AI가 잡아야 할 좌표

이 흐름은 한국에게 꽤 구체적인 기회를 열어준다.

반도체 측면에서 XCENA의 사례는 국내 기업에 직접적인 시사점을 던진다. XCENA의 창업진이 삼성전자·SK하이닉스 출신이라는 사실은 상징적이다. 쉽게 말해, PIM 기술의 핵심 인재 풀이 이미 한국에 있다는 뜻이다. 한화시스템이 추진 중인 AI 기반 전자전(EW) 체계와 위성 탑재 컴퓨팅 고도화에는 저전력·고효율 온보드 연산이 필수이며, PIM 아키텍처는 이 요구를 정확히 충족할 수 있는 방향으로 발전하고 있다. 한화시스템이 PIM 스타트업과의 기술 협력 또는 자체 R&D 투자를 통해 위성·드론용 엣지 AI 가속기 개발에 나선다면, 이 분야의 조기 주도권 확보가 가능하다.

자율 무기체계 측면에서 다중해상도 자율주행 신경망 연구는 현대로템의 무인 지상차량(UGV) 플랫폼과 직접 연결된다. 현대로템이 개발 중인 HR-Sherpa 계열 무인 전투차량은 실시간 영상 기반 장애물 회피와 표적 식별을 동시에 수행해야 하는데, 지연-정확도 동적 최적화 기술은 제한된 엣지 컴퓨팅 자원 아래서 이 두 요구를 동시에 만족시키는 핵심 알고리즘이 될 수 있다.

통신 인프라 측면에서 DDST 기반 딥러닝 수신기 연구는 LIG넥스원의 전술통신 및 링크-16 호환 데이터링크 체계 고도화와 맞닿아 있다. LIG넥스원이 개발하는 전술 데이터링크 체계에 SIP 기반 고효율 수신기를 적용하면 동일 주파수 자원으로 더 많은 드론·무인체계를 동시에 운용하는 네트워크 중심전(NCW) 역량이 실질적으로 향상된다.

정보·C4I 측면에서 Glean의 Context Graph 모델은 **국방AI센터(DAIC)**가 추진하는 전군 지식관리 체계와 유사한 구조 문제를 다루고 있다. DAPA(방위사업청)의 신속획득 제도를 활용해 국내 스타트업이 Glean형 전장 정보 검색 엔진을 개발·실증한다면, 장병 정보 접근 속도와 C2(지휘통제) 결심 효율을 동시에 높이는 아이템이 될 수 있다. ADD(국방과학연구소) 역시 이 영역에서 연구 과제를 발굴해 산업 연계 R&D로 전환할 여지가 충분하다.

다만 한 가지 현실적 과제가 있다. 국내 방산 체계의 소프트웨어 정의 전환 속도가 하드웨어 도입 속도를 따라가지 못하는 경향이 있다. 알고리즘이 아무리 좋아도 체계 통합이 뒷받침되지 않으면 무의미하다. DAPA의 소프트웨어중심무기체계(SOWS) 로드맵이 이 간극을 메우는 역할을 해야 한다.

다음 18개월, 주목해야 할 변수들

AI 인프라 효율화 경쟁은 이제 시작 단계다. XCENA가 PIM 칩을 실제 데이터센터 규모에서 검증하는 데 성공한다면, Nvidia의 GPU 중심 생태계에 처음으로 의미 있는 균열이 생길 수 있다. 반면 기존 GPU 공급사들이 HBM(고대역폭메모리) 기반 PIM을 자체 통합하는 속도가 더 빠를 경우, 독립 PIM 스타트업의 시장 공간은 예상보다 좁아질 수 있다.

Glean 모델의 복제 가능성도 변수다. Context Graph의 가치는 사용 데이터가 쌓일수록 커지는 네트워크 효과에 있는데, 거대 플랫폼 기업들이 동일 전략으로 대형 기업 고객을 선점하기 시작하면 Glean의 성장 곡선이 꺾일 수 있다.

자율주행 AI 측면에서는 CARLA 시뮬레이터 성능이 실제 도로 또는 전장 환경으로 얼마나 전이될지가 여전히 미지수다. 시뮬레이션과 현실 사이의 도메인 갭(Domain Gap)은 자율 무기체계 신뢰성 인증의 가장 큰 장벽으로 남아 있다.

통신 연구는 6G 표준화 논의가 본격화되는 2026~2028년 사이에 상용 적용 가능성이 급격히 높아질 것으로 보인다. ITU와 3GPP 표준 트랙에 DDST 계열 기법이 포함될 경우, 이를 선점한 기업과 기관이 특허·표준 양면에서 이익을 가져간다.

자주 묻는 질문 (FAQ)

Q1. Glean의 Context Graph와 일반 RAG(검색증강생성)의 차이는 무엇인가요?

RAG가 단순히 문서를 검색해 LLM에 넣는 방식이라면, Context Graph는 기업 내부 시스템 전반을 연결해 사람·프로젝트·데이터 간 관계를 학습한 지식 구조다. 맥락의 깊이와 비용 효율에서 차이가 난다.

Q2. PIM(Processing-in-Memory) 기술이 기존 GPU를 대체할 수 있나요?

단기간 내 완전 대체는 어렵다. 그래픽 처리나 대규모 행렬 연산은 여전히 GPU가 유리하다. PIM은 메모리 집약적 루틴 연산의 왕복 비용을 줄이는 보완적 역할로, 병렬 채택 가능성이 더 현실적이다.

Q3. 다중해상도 자율주행 신경망이 군사 드론에도 적용될 수 있나요?

가능성은 높다. 드론의 엣지 컴퓨팅 자원이 제한적인 환경에서 비행 상황에 따라 해상도를 동적 조정하면 처리 지연을 줄이면서 임계 상황의 정확도를 유지할 수 있어, 무인 전투기·정찰 드론에 직접 응용될 수 있다.

Q4. DDST 기반 통신 기술은 5G와 6G 중 어디에 더 적합한가요?

두 세대 모두에 적용 가능하지만, 스펙트럼 효율이 한계에 달하는 6G 고밀도 환경에서 가치가 극대화된다. 특히 드론 군집이나 자율 무기체계처럼 동시 접속 노드가 많은 환경에서 오버헤드 절감 효과가 두드러진다.

Q5. 한국 스타트업이 XCENA처럼 PIM 분야에서 도전하려면 어떤 조건이 필요한가요?

삼성·SK하이닉스의 메모리 설계 인력 풀, DAPA의 국방 R&D 연계 자금, 그리고 팹리스 스타트업을 위한 MPW(다중 프로젝트 웨이퍼) 지원 인프라가 삼박자를 이뤄야 한다. 현재 한국은 인력 측면에서 전 세계 최고 수준의 출발선에 서 있다.

여러분은 AI 인프라의 다음 병목이 메모리·통신·소프트웨어 중 어느 쪽에서 먼저 돌파될 것이라고 보시나요?

AI 인프라 전쟁의 핵심: 메모리·통신·엣지 기술이 미래를 결정한다