
수십억 달러 어치의 토큰을 낭비한 후, 실리콘밸리 대기업들이 직원들의 토큰 사용량을 제한하기 시작했다.
작자| 화린우왕
편집| 정우
며칠 전, 기크파크(GeekPark)는 AI에 막대한 투자를 단행한 마이크로소프트(Microsoft)가 내부적으로 대부분 직원의 클로드 코드(Claude Code) 라이선스를 조용히 중단했다고 보도했다.
이 사건은 매우 이상하다. 현재 AI 실용화 열풍 속에서 기업 고객을 대상으로 한 최대 마케팅 포인트는 바로 ‘생산성 향상’이기 때문이다. 그런데 생산성을 높일 수 있다면, 왜 마이크로소프트는 직원들이 클로드 코드를 사용하는 것을 중단시킨 것일까?
마이크로소프트만 그런 것은 아니다. ‘토큰 사용량 축소’ — 즉 직원들의 무분별한 Vibe Coding을 더 이상 장려하지 않는 것이 실리콘밸리 대기업들 사이의 새로운 트렌드가 되고 있다.
우버(Uber)는 4개월 만에 연간 AI 토큰 예산을 모두 소진했다. 세일즈포스(Salesforce)는 앤트로픽(Anthropic)에 매년 약 3억 달러를 지불한다. 어떤 AI 컨설턴트는 자신의 고객 중 한 곳이 단 한 달 동안 AI에 5억 달러를 지출했다고 밝혔다. 메타(Meta)는 심지어 내부 ‘토큰맥싱(tokenmaxxing) 랭킹’을 조용히 폐지하기까지 했다—그 랭킹은 원래 직원들이 AI를 더 많이 사용하도록 유도하려는 목적이었다.
이제 기업들은 몇 년 전만 해도 상상조차 하지 못했던 일을 하고 있다:
직원들의 AI 사용을 제한하고, 감시하기 시작한 것이다.
왜 대기업들이 갑자기 방향을 틀었을까?
01 「토큰맥싱(tokenmaxxing)」, 시대의 축영
오늘날의 비용 위기를 이해하려면 먼저 ‘토큰맥싱’이 무엇인지 알아야 한다.
이 용어는 대략 2025년부터 유행하기 시작했으며, 문자 그대로 ‘토큰 사용량 극대화’를 의미한다. 이는 일종의 경영 철학을 반영한다—즉, 회사가 막대한 자금을 들여 AI 도구를 구입했으므로, 직원들은 가능한 한 많이 써야 한다는 것이다. 사용량이 많을수록 ‘디지털 전환’이 성공적이라는 증거가 되고, 적을수록 자원 낭비라는 비난을 받는다. 그래서 많은 기업들이 사용량 할당량, 랭킹, 심지어 성과 평가 지표까지 도입해 직원들이 AI를 적극 활용하도록 강압적으로 유도했다.
그 결과는 어땠을까?
직원들은 기업용 AI 모델로 날씨를 확인하거나 생일 축하 메시지를 작성하고, 오늘 점심으로 무엇을 먹을지 물어보기까지 하게 되었다.
2,444개 기업을 대상으로 한 연구에 따르면, 기업이 AI 토큰에 1달러를 지출할 때마다, 0.44달러는 AI가 생성한 버그 수정에, 0.27달러는 AI 산출물의 코드 재작성에, 0.11달러는 검토 및 병합 지연에 소비된다.
즉, 1달러의 AI 구매 비용 뒤에는 약 80%에 달하는 은닉된 손실이 숨어 있는 것이다.
투자자 슈루티 간디(Shruti Gandhi)는 이를 정확하게 표현한 비유를 하나 제시했다: “토큰맥싱 기업은 생산성을 측정하기 위해 모든 전등을 켜놓는 회사와 같다—돈을 더 쓴다고 해서 반드시 더 많은 산출물을 얻는 것은 아니다.”
더 풍자적인 사실은, 이러한 기업 대부분이 직원들이 AI로 정확히 무엇을 하는지 전혀 모른다는 점이며, 그 작업들이 실제로 AI 덕분에 완료되었는지도, 또 그 완료가 어떤 변화를 가져왔는지도 알지 못한다는 점이다.
이 ‘돈 태우기 경쟁’은 2024년부터 2025년까지 이어졌고, 올해 들어 집중적으로 폭발했다. JP모건(JPMorgan)은 제목만으로도 불편함을 주는 엄격한 보고서를 발표했는데, 그 제목은 바로 《AI 토큰 비용이 인터넷 이익을 잠식하고 있다》였다.
쇼피파이(Shopify), 스포티파이(Spotify), 서비스나우(ServiceNow), 로쿠(Roku) 등은 실적 발표 전화회의에서 모두 AI가 운영비 증가의 주요 원인이 되고 있다고 언급했다. 업계 전체 분위기는 이제 ‘AI를 얼마나 멋지게 쓰느냐’에서 ‘이 돈을 쓰는 게 정말 가치 있는가’로 서서히 전환되고 있다.
02 CEO가 ROI를 의문시하기 시작할 때
CFO 중 단지 14%만이 AI 투자에서 명확하고 측정 가능한 수익률(ROI)을 확인했다고 답했다.
우버의 최고운영책임자(COO) 앤드류 맥도널드(Andrew Macdonald)는 팟캐스트 인터뷰에서 솔직한 발언을 했다—그는 직원 개인의 생산성 향상과 기업 전체의 사업 영향력을 연결시키기 어렵다는 점을 발견했다고 말했다. “AI 덕분에 사용자에게 얼마나 유의미한 기능을 제공했는지 알 수 없다면, 토큰 비용을 정당화하기는 더욱 어렵다.”
이 한마디는 기업의 AI 도입 어려움의 핵심을 꿰뚫고 있다: 개인의 효율성 향상은 곧바로 기업 수익 증가로 이어지지 않는다.
직원이 AI로 주간 보고서 작성을 3배 빠르게 하더라도, 기업의 매출은 변하지 않는다. 개발자가 AI로 코드 생성 속도를 2배로 높였지만, 그 코드의 ‘유출률’—즉 폐기되거나 재작성되는 비율—은 800%나 급증했다.
마이크로소프트 전 최고AI책임자(Sophia Velastegui)는 많은 관리자들에게 불편한 진실을 말했다: “대부분의 사람들은 자신이 싫어하는 업무를 자동화하는 데는 자동화를 선택하지만, 기업에 가장 큰 가치를 주는 업무는 그렇지 않다.”
즉, 기업이 자동화하는 건 직원들이 ‘싫어하는 일’이지, ‘돈을 버는 일’이 아니라는 것이다.
이는 기술 문제라기보다는 우선순위 설정의 문제다. 그래서 약 30%의 생성형 AI 프로젝트가 개념 검증(PoC) 단계에서 중단되는 것이다—비용 산정도, 가치 산정도 불투명하니, 경영진이 계약 연장을 거부하는 건 당연한 일이다.
세일즈포스 CEO 마크 베니오프(Marc Benioff)의 대응 방식은 상징적이다. 매년 3억 달러에 달하는 앤트로픽 청구서 앞에서, 그가 바라는 건 ‘지능형 라우터’다—즉, 어떤 쿼리는 고성능 모델을 써야 하고, 어떤 쿼리는 저렴한 소형 모델로도 충분한지를 판단해주는 시스템이다.
이 아이디어 자체는 새롭지 않다—클라우드 컴퓨팅 시대부터 ‘필요할 때만 과금’, ‘자원 최적화’는 표준 운영 방식이었다. 그러나 이번 AI 열풍은 너무 급작스럽게 몰아쳐, 기업들은 먼저 구입하고 나중에 생각하기를 반복했고, 지금에서야 ‘숙제’를 하기 시작한 것이다.
03 이성적인 회귀, 혹은 추운 겨울의 전조?
마이크로소프트는 최근 대부분의 클로드 코드 기업 라이선스를 취소했는데, 공식적인 이유는 비용 문제다. 이 사건은 업계에서 상당한 논란을 불러일으켰다—왜냐하면 마이크로소프트 자체가 오픈AI(OpenAI)의 최대 투자자임에도 불구하고, 경쟁사 제품의 구독을 차단하고 있기 때문이다. 여기서 비용 고려가 어느 정도이고, 전략적 배치가 어느 정도인지는 분명히 알기 어렵다.
하지만 어쨌든 이는 하나의 신호를 전달한다: 기업들이 ‘발로 투표’하기 시작했다는 것이다.
허네스(Harness)와 클라우드제로(CloudZero)는 거의 같은 날—5월 28일—각각 AI 비용 관리 도구를 발표했다. 하나는 AI 지출과 ROI를 실시간으로 모니터링하는 데 초점을 맞추고 있고, 다른 하나는 ‘AI 재무 통제 평면(AI financial control plane)’을 출시해, 기업이 AI에 쓰는 1달러마다 구체적인 비즈니스 성과를 연결할 수 있도록 지원한다.
이 두 제품의 출현 자체가 이미 문제를 말해준다: 시장에 수요가 있고, 그것도 매우 긴박한 수요가 있다는 것이다.
후브스팟(HubSpot)은 올해 4월부터 AI 에이전트의 요금제를 조정하기 시작해, 기존의 ‘토큰 기반 과금’에서 벗어나 ‘해결된 대화 수’ 또는 ‘생성된 리드 수’를 기준으로 요금을 책정하기로 했다—이는 방향 전환의 신호다. 즉, 공급자의 이익과 구매자의 실제 산출물을 정렬시키는 것이다. 서비스나우 역시 유사한 조정을 진행 중이다. AI 공급업체들은 ‘사용량’이 아니라 ‘결과’를 판매하지 않으면, 기업 고객들이 결국 집단적으로 반발할 것임을 깨닫고 있다.
이러한 조정은 AI 산업화 과정에서 반드시 겪어야 할 성장통일까, 아니면 더 큰 위기의 서막일까?
필자는 전자라고 믿는다. 그러나 하나의 사소해 보이는 세부 사항이 다소 걱정스럽다: 글로벌 AI 소프트웨어 지출액은 2026년에 2.59조 달러에 달할 것으로 예측되며, 전년 대비 47% 증가할 전망이다. 그러나 동시에, 94%의 엔지니어링 책임자들이 여전히 핵심 ROI 지표가 부재하다고 응답했다. 돈은 점점 더 많이 쓰이는데, 어디에, 왜 쓰이는지 아무도 모른다—이 모순이 해결되지 않으면, 다음 ‘토큰맥싱 순간’은 시간문제일 뿐이다.
포춘(Fortune) 잡지의 한 분석 기사는 매우 직설적으로 말한다: “토큰맥싱은 쉽다. 그러나 업무 프로세스를 다시 설계하는 건 어렵다.” 대부분의 기업이 지금 하고 있는 건 기존 프로세스를 최적화하는 것이지, 비즈니스 모델을 재창조하는 것이 아니다. 이것이 바로 AI의 진정한 가치가 존재하는 자리이자, 대부분의 기업이 아직 도달하지 못한 지점이다.
이성적인 회귀는 좋은 일이다. 그러나 이성적인 회귀 이후 기업들이 더 어려운 질문에 답해야 한다: AI는 우리 비즈니스에 대해 단지 ‘망치’일 것인가, 아니면 ‘새로운 사고 프레임워크’가 될 것인가?
만약 AI를 단지 오래된 일을 더 빠르게 처리하는 데만 사용한다면, 언젠가 청구서가 당신을 이 질문 앞에 다시 서게 만들 것이다.
TechFlow 공식 커뮤니티에 오신 것을 환영합니다
Telegram 구독 그룹:https://t.me/TechFlowDaily
트위터 공식 계정:https://x.com/TechFlowPost
트위터 영어 계정:https://x.com/BlockFlow_News













