메타, AWS 그래비톤 대규모 도입…에이전트 AI 인프라 CPU 전환 확대

by newsit posted Apr 29, 2026
Extra Form
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

- 수천만 코어 기반 도입 시작, 실시간 추론·코드 생성 워크로드 대응

- 그래비톤5 적용, CPU 중심 AI 처리 성능·효율 개선

 

메타, AWS 그래비톤 대규모 도입…에이전트 AI 인프라 CPU 전환 확대.jpg

AWS가 메타(Meta)에 그래비톤 프로세서를 대규모로 공급하며 에이전트 AI 환경에서 CPU 기반 워크로드 처리 비중을 확대하고 인프라 운영 효율을 높인다.

 

AI 워크로드 변화에 따른 CPU 활용 확대

메타는 수천만 개 그래비톤 코어 도입을 시작으로 AI 인프라 적용 범위를 넓힌다. 대규모 모델 학습은 GPU가 담당한다. 실시간 추론, 코드 생성, 검색, 다단계 작업 수행과 같은 워크로드는 CPU 사용 비중이 빠르게 증가하며 그래비톤은 이를 처리해 응답 지연을 줄이고 처리 효율을 높인다.

 

그래비톤5로 에이전트 AI 처리 성능 개선

그래비톤5(Graviton5)192개 코어와 확장된 캐시를 적용해 코어 간 통신 지연을 줄이고 데이터 처리 속도를 높인다. 다단계 작업을 반복 수행하는 에이전트 AI 환경에서 연산 병목을 줄이고 처리량을 안정적으로 유지해 대규모 사용자 요청을 동시에 처리하는 서비스 운영 성능을 개선한다.

 

니트로 시스템 기반 인프라 운영 효율 확보

그래비톤은 AWS 니트로 시스템(AWS Nitro System) 위에서 동작해 베어메탈 인스턴스 수준의 성능 접근을 제공한다. 네트워크와 스토리지 환경을 유지한 상태에서 가상 머신을 운영해 대규모 환경에서도 성능 저하를 줄이고 고가용성과 보안을 유지해 AI 서비스 운영 범위를 안정적으로 넓힌다.

 

저지연 네트워크로 분산 처리 성능 확보

그래비톤5 인스턴스는 EFA(Elastic Fabric Adapter)를 적용해 인스턴스 간 저지연·고대역폭 통신을 지원한다. 다수의 프로세서에 작업을 분산하는 환경에서 데이터 전달 시간을 줄이고 병렬 처리 효율을 높여 대규모 AI 워크로드 실행 속도를 개선한다.

 

3나노 공정 기반 성능·전력 효율 개선

3나노미터(nm) 공정을 적용한 그래비톤5는 이전 세대 대비 성능을 높이면서 전력 효율을 유지한다. 칩 설계와 서버 아키텍처를 통합해 연산 효율을 높이고 에너지 사용량을 줄여 대규모 AI 인프라 운영에서 비용과 전력 소비를 낮춘다.

 

아마존웹서비스 나페아 브샤라(Nafea Bshara) 부사장은 그래비톤과 AI 스택을 결합해 에이전트 AI 처리 성능을 확장하고 있다고 밝혔다. 메타 산토시 자나단(Santosh Janardhan) 인프라 책임자는 그래비톤 도입을 통해 CPU 중심 AI 워크로드를 대규모 환경에서 효율적으로 처리하고 있다고 덧붙였다.

 

#AWS #메타 #그래비톤 #Graviton5 #에이전트AI #AI인프라 #CPU워크로드 #클라우드컴퓨팅 #데이터센터 #AI플랫폼