본문 바로가기

반도체

한국판 엔비디아의, 퓨리오사AI가 그리는 AI칩의 미래

반응형

한국 AI 반도체의 혁신

퓨리오사AI 개요 및 창업자 이력

퓨리오사AI(대표 백준호)는 2017년 설립된 한국의 팹리스 AI 반도체 스타트업으로, 데이터센터용 AI 추론(NPU) 가속기를 개발한다. 백준호 대표는 서울대학교 전자공학과를 졸업한 뒤 미국 조지아공대에서 석사 학위를 받았으며, AMD의 GPU 개발팀과 삼성전자 메모리 사업부에서 엔지니어로 근무한 경험이 있다. 퓨리오사AI는 국내외 AI 시장에서 전력 효율이 높은 반도체를 개발해 엔비디아 GPU에 대한 대체 수요를 노리고 있다. 이 회사는 데이터센터 서버용 AI 추론 연산에 특화한 NPU 칩을 만드는 것으로 평가받고 있다.

1세대 워보이(Warboy) 및 2세대 RNGD 칩 소개

퓨리오사AI의 첫 제품인 워보이(Warboy)는 2021년 출시된 AI 칩으로, 컴퓨터 비전 분야 용도로 설계되었다. 이 칩은 삼성전자 14나노 핀펫 공정으로 제조되었으며, 최대 64TOPS의 연산 성능을 제공한다. 이어서 2024년 8월에 공개된 2세대 칩 레니게이드(RNGD)는 대규모 언어 모델(LLM) 및 멀티모달 추론에 특화된 제품이다. RNGD는 전작 대비 전력 효율을 300% 이상 개선했으며, 대용량 데이터를 단시간에 처리할 수 있어 실시간 추론에 강점을 갖는다. 특히 엔비디아의 하이엔드 GPU와 비교할 때 와트당 처리 성능이 2배 이상 우수한 것으로 평가된다.

TCP 아키텍처, 성능 및 HBM3 메모리

2세대 RNGD 칩은 독자 개발한 'Tensor Contraction Processor(TCP)' 아키텍처를 채택했다. 이 TCP 구조는 딥러닝의 핵심 연산인 텐서 축약을 효율적으로 수행하도록 설계되었으며, 기존 GPU가 고정 크기의 행렬곱 연산에 의존하는 것과 달리 유연한 텐서 연산을 기본으로 한다. 이러한 구조적 차별화 덕분에 RNGD는 병렬 연산 효율과 데이터 재사용성을 극대화해 에너지 효율을 높였다. RNGD의 주요 사양은 8개의 프로세싱 요소로 총 512TFLOPS(FP8 기준)의 연산 성능을 가지며, 48GB의 HBM3 메모리가 탑재되어 있다. 메모리 대역폭은 1.5TB/s로 고속이며, 칩의 소비 전력(TDP)은 180W로 설계되어 대부분의 데이터센터 환경에서 공랭으로 운용할 수 있다.

전력 효율 및 와트당 성능, LG AI 연구원 테스트 결과

퓨리오사AI의 칩은 뛰어난 전력 효율을 갖는 것으로 평가된다. LG AI연구원과의 공동 테스트에서 RNGD는 기존 GPU 시스템 대비 와트당 성능이 2.25배 높게 나타났다. 실제로 오픈AI 코리아 개소식에서 공개된 데모에서는, 48GB HBM3 메모리를 탑재한 RNGD 카드 두 장(총 96GB)을 사용해 EXAONE 120B 모델을 구동했다. 이때 두 RNGD 카드의 총 소비전력은 약 360W에 불과했다. 반면 엔비디아 H100 GPU는 한 장으로 350~400W, 두 장은 700W 이상을 소모한다. 즉, GPU와 동일 작업을 수행할 때 RNGD는 성능은 H100의 절반 수준이지만 소비전력은 4분의 1에 불과해, 와트당 처리 성능이 약 2배 높다는 평가다.

하드웨어-소프트웨어 통합 전략 (SDK, 런타임)

퓨리오사AI는 칩 개발뿐만 아니라 소프트웨어 통합에도 주력한다. 자체 SDK에는 모델 압축기, 서빙 프레임워크, 런타임, 컴파일러, 프로파일러, 디버거 등 다양한 개발 도구가 포함되어 있어 개발자가 NPU를 쉽게 활용할 수 있게 돕는다. 또한 PyTorch 2.x와 네이티브 통합을 지원해, 기존 딥러닝 모델을 RNGD에서 곧바로 실행할 수 있다. 이러한 통합 전략으로 퓨리오사AI는 AI 모델 개발부터 배포까지 전 과정을 아우르는 생태계를 구축하고 있다.

투자 유치 이력, 메타 인수 제안, 독립 전략

퓨리오사AI는 누적 투자금이 수천억 원에 이르는 성장 단계 기업으로 평가된다. 최근 시리즈 C 브릿지 라운드에서는 1700억 원 규모의 투자 유치를 완료하며 기업가치를 1조 원으로 끌어올렸다. 이 투자에는 산업은행·기업은행·카카오벤처스 등 기존 투자자뿐 아니라 PE 자금도 참여했다. 앞서 산업은행의 300억 원 규모 투자유치 의향서 등을 통해 약 700억 원을 확보한 바 있다. 한편 2024년 말 페이스북 모회사인 메타가 약 8억 달러 규모로 인수를 제안했으나, 백준호 대표는 독자 노선을 유지하기 위해 이를 거절했다. 이로써 퓨리오사AI는 자체 자금 조달을 통해 글로벌 경쟁력을 강화하려는 전략을 선택했다.

미국/일본 등 글로벌 확장 전략과 파트너십

퓨리오사AI는 북미와 일본 등 해외 시장 진출에도 속도를 내고 있다. 이미 실리콘밸리 내 R&D 사무소를 운영하고 있으며, 최근에는 미국 산호세에 세일즈 및 사업개발 전담 법인 설립을 검토 중이다. 이를 통해 북미의 기업 고객을 확보하고 글로벌 추론 인프라 시장에 진출할 계획이다. 또한 일본에서는 ERP 솔루션 기업 더존비즈온과 협력해 RNGD 기반 AI 서비스 실증 프로젝트를 진행하고 있다. 이 프로젝트에 사용되는 RNGD는 대형 엔터프라이즈 및 클라우드 환경의 고성능·고효율 추론용 칩으로, LG AI연구원의 평가에 따르면 기존 GPU 대비 와트당 성능이 약 2.25배 높다. 이처럼 다양한 국제 협력을 통해 퓨리오사AI는 글로벌 파트너십을 확대하고 있다.

NXT RNGD 서버 제품 계획

퓨리오사AI는 2025년 9월 자사의 첫 통합 서버 솔루션 ‘NXT RNGD Server’를 선보였다. 이 시스템은 최대 8개의 RNGD 가속기와 384GB HBM3 메모리, 1TB DDR5 시스템 메모리를 탑재했으며, 전체 시스템 전력은 3kW로 설계되었다. 서버에는 출하 시점부터 Furiosa SDK와 LLM 런타임이 미리 탑재되어 있어, 설치 후 곧바로 AI 모델 서빙이 가능하다. 실제 성능 검증도 이뤄졌다. 예를 들어 LG AI연구원은 단일 서버에 EXAONE 3.5 32B 모델을 탑재하여 배치 크기 1일 때 초당 60토큰을 처리하는 성과를 달성했다. NXT RNGD Server는 2026년 1월부터 고객에게 공급될 예정이다.

경쟁사(엔비디아, Graphcore, Tenstorrent 등)와의 비교 분석

AI 가속기 시장에서 엔비디아의 GPU는 여전히 약 70~80% 이상의 시장 점유율을 확보하고 있다. 그밖에 영국의 Graphcore(인텔리전스 프로세싱 유닛)나 캐나다의 Tenstorrent(RISC-V 칩 기반) 같은 스타트업들도 유사한 AI 칩을 개발 중이다. 퓨리오사AI는 이들과 달리 TCP 기반 칩 설계와 풍부한 소프트웨어 도구를 앞세워 차별화한다. 실제로 퓨리오사AI는 SDK를 제품과 함께 공개하고 있으며, MLPerf 추론 벤치마크에도 엔비디아를 제외한 전 항목에 도전해 성능을 입증할 계획이다. 이러한 노력을 통해 퓨리오사AI는 ‘엔비디아의 대안’으로 주목받기 시작했다.

한국 반도체 스타트업으로서의 상징성, 시장 파급력

퓨리오사AI의 성공은 국내 AI 반도체 기술의 잠재력을 보여주는 상징적 사례다. 국내 기술로 글로벌 빅테크의 관심을 받은 것은 한국 반도체 업계의 기술력을 입증하는 계기다. 특히 LG와 같은 국내 대기업이 퓨리오사AI의 칩을 도입하면서, 국산 AI 하드웨어의 위상이 높아졌다. 예를 들어 LG AI연구원이 공개한 결과에서는 RNGD가 GPU 대비 와트당 성능이 2.25배 높게 나타났는데, 이는 데이터센터의 에너지 제약 속에서도 높은 성능을 구현할 수 있음을 보여준다. 이러한 성과는 국내 기술에 대한 자신감을 높이고, 더 많은 스타트업에게 영감을 줄 것으로 기대된다.

출처

  • 퓨리오사AI 공식 홈페이지
  • 국내 주요 언론 보도 자료
  • 기술 전문 미디어 기사, LG AI 연구원 발표 자료 등
반응형