세상에서 가장 많은 데이터를 움직이는 회사가 있다.
하지만 그 데이터는 눈에 보이지 않는다.
그 주인공은 물류와 쇼핑의 대명사인 아마존(Amazon) 이다.
많은 사람들은 아마존을 ‘전자상거래 기업’으로만 기억하지만,
실제로 아마존의 진짜 핵심 사업은 AWS(Amazon Web Services),
즉 클라우드다.
지금의 인터넷 서비스 중 40% 이상이 AWS 위에서 돌아간다.
이 거대한 인프라의 중심에는,
엔비디아나 인텔이 아닌 아마존이 직접 설계한 반도체 칩이 있다.
CPU의 한계, 클라우드의 병목
2010년대 후반, 아마존의 내부 엔지니어들은 커다란 문제에 직면했다.
AI와 클라우드 서비스의 폭발적 성장으로
서버당 연산량이 급격히 늘어났는데,
인텔의 범용 CPU로는 감당이 안 되기 시작한 것이다.
아마존은 단순한 서버 공급자가 아니었다.
검색, 영상 스트리밍, AI 추천, 쇼핑 데이터, 물류 시뮬레이션 등
모든 서비스가 동시에 AWS 위에서 돌아간다.
그 속도를 끌어올리지 못하면
아마존 전체 비즈니스가 병목에 걸릴 수 있었다.
그래서 2015년, 아마존은 결단을 내린다.
“남이 만든 칩으로는 우리의 속도를 유지할 수 없다.”
이 결정이 바로 아마존의 반도체 역사,
그리고 클라우드 전용 칩 혁명의 시작이었다.
Graviton ― 클라우드의 근육을 설계하다
2018년, 아마존은 첫 번째 자체 설계 칩 Graviton 을 공개했다.
이 칩은 ARM 아키텍처를 기반으로 만들어진 서버용 CPU였다.
Graviton의 목표는 단순했다.
인텔·AMD CPU보다 전력 효율을 40% 이상 개선하면서
동일한 연산 성능을 유지하는 것.
AWS는 전 세계 수백만 대의 서버를 운용하기 때문에
전력 소모를 1%만 줄여도 수억 달러가 절약된다.
따라서 Graviton은 단순히 ‘더 빠른 칩’이 아니라
“더 오래 버티는 칩”,
즉 클라우드의 지속 가능성을 높이는 핵심 설계였다.
현재 Graviton3는
AWS EC2 인스턴스에서 가장 많이 사용되는 CPU로,
인텔 Xeon보다 가격 대비 성능이 뛰어나
수많은 기업이 AWS 내 워크로드를 Graviton으로 전환하고 있다.
Inferentia ― AI 추론의 보이지 않는 두뇌
AI의 핵심 과정은 두 가지다.
첫째는 학습(Training), 둘째는 추론(Inference).
학습은 방대한 데이터를 이용해 모델을 만드는 과정이고,
추론은 완성된 모델을 이용해 실제 서비스를 제공하는 단계다.
2019년, 아마존은 AI 추론 속도를 높이기 위해
자체 칩 Inferentia 를 선보였다.
이 칩은 엔비디아 GPU보다 훨씬 적은 전력으로
AI 모델을 실행할 수 있었다.
예를 들어,
아마존의 Alexa 음성인식, 추천 알고리즘, 물류 최적화 시스템 등
AI 추론이 필요한 모든 영역이 Inferentia로 돌아간다.
덕분에 AWS는 클라우드 비용을 줄이고,
AI 서비스를 더 빠르고 저렴하게 제공할 수 있게 되었다.
Inferentia는 “GPU의 시대가 끝나면 무엇이 올까?”라는 질문에
아마존이 내놓은 첫 번째 대답이었다.
Trainium ― AI 학습의 심장을 직접 설계하다
Inferentia가 추론용이었다면,
Trainium은 AI 모델을 학습시키는 전용 칩이다.
2021년, 아마존은 엔비디아의 H100 같은 GPU 대신
자체 학습용 칩 Trainium을 공개했다.
이 칩은 TensorFlow, PyTorch 등
AI 프레임워크에 최적화되어 있으며,
비슷한 성능의 GPU 대비 40% 이상 저렴하고
30% 이상의 에너지 효율을 자랑한다.
Trainium은 특히 대형 언어 모델(LLM) 훈련에 사용된다.
ChatGPT와 같은 모델을 학습시키는 과정에서
GPU를 수천 장 연결할 필요 없이
Trainium 클러스터로 처리할 수 있다.
이 칩의 등장은
“AI 학습의 인프라도 클라우드가 장악할 수 있다”는
아마존의 선언이었다.
반도체가 된 비즈니스 모델
아마존은 이 칩들을 판매하지 않는다.
AWS 내에서만 사용된다.
사용자는 Graviton, Inferentia, Trainium 기반의 인스턴스를 선택해
자연스럽게 아마존의 칩을 사용하게 된다.
즉, 칩은 상품이 아니라 서비스의 구조다.
이게 아마존의 독특한 반도체 철학이다.
“우리는 칩을 팔지 않는다.
우리는 칩 위에서 세상을 움직인다.”
이 구조 덕분에 AWS는
엔비디아나 인텔에 의존하지 않고
AI 시대의 핵심 속도를 스스로 통제할 수 있게 되었다.
효율로 세상을 설계하는 기업
아마존의 반도체 전략은
화려한 기술보다 경제적 효율을 중심에 둔다.
그들은 빠름보다 “싸고 오래가는 연산”을 추구한다.
Graviton은 서버의 심장이고,
Inferentia는 AI의 두뇌이며,
Trainium은 학습의 엔진이다.
이 세 가지가 합쳐져
AWS 전체를 하나의 거대한 AI 플랫폼으로 만든다.
아마존은 세상에서 가장 많은 컴퓨터를 가지고 있으면서도
그것을 “보이지 않게 작동시키는” 기업이다.
그들의 칩은 판매되지 않지만,
세상의 데이터 흐름은 그 위에서 움직인다.
보이지 않지만, 어디에나 있는 두뇌
아마존은 더 이상 단순한 유통회사가 아니다.
그들은 세계 최대의 컴퓨팅 인프라 기업이자,
가장 효율적인 반도체 설계 집단이다.
Graviton, Inferentia, Trainium —
이 세 가지 칩은 모두 한 철학으로 연결된다.
“속도가 아니라 효율,
기술이 아니라 지속.”
AI의 시대가 가속될수록,
아마존의 칩은 세상의 보이지 않는 두뇌로 작동할 것이다.
그들은 반도체를 팔지 않는다.
대신, 세상을 반도체 위에서 움직이게 만든다.
'반도체' 카테고리의 다른 글
| Apple ― 통합 설계로 생태계를 완성하다 (0) | 2025.10.24 |
|---|---|
| Meta ― AI 추천 알고리즘의 뇌를 직접 만들다 (0) | 2025.10.23 |
| Google ― TPU로 AI의 속도를 재정의하다 (0) | 2025.10.22 |
| AMD ― 혁신보다 생존으로 강해지다 (0) | 2025.10.22 |
| NVIDIA ― GPU로 AI의 신경망을 설계하다 (0) | 2025.10.21 |