- 딥마인드·EMBL 협력, 단백질 상호작용 분석·신약 연구 활용 확대
![[GTC 2026] 엔비디아, 단백질 데이터셋 확장…170만 복합체·3,000만 구조 공개.jpg](/files/attach/images/2026/03/19/6561fce5a06892843097befbe982cee0.jpg)
엔비디아가 GTC 2026에서 구글 딥마인드, EMBL-EBI, 서울대학교 연구진과 함께 알파폴드 단백질 구조 데이터베이스를 확장했다고 공개했다. 약 170만 개의 단백질 복합체와 3,000만 개의 추가 구조 데이터를 포함해 단백질 간 상호작용을 분석할 수 있는 데이터 범위를 크게 넓혔다.
단일 단백질에서 복합체 중심으로 확장
데이터베이스에는 170만 개의 고신뢰 단백질 복합체 예측 데이터가 검색 가능한 형태로 추가됐다. 여기에 3,000만 개 규모의 추가 구조 데이터가 일괄 다운로드 형태로 제공되며, 연구자는 단일 단백질을 넘어 복합체 수준에서 결합 구조와 기능을 함께 분석할 수 있다. 기존 데이터가 개별 단백질 중심이었다면, 이번 확장은 상호작용을 전제로 한 분석 환경을 제공하는 데 초점을 맞춘다.
AI 모델과 GPU 최적화로 연산 구조 개선
구조 예측에는 알파폴드 멀티머(AlphaFold-Multimer) 모델이 활용됐다. 오픈폴드(OpenFold) 추론 파이프라인에 텐서(Tensor)와 cu이퀴바리언스cu(cuEquivariance)를 적용하면서 연산 효율을 높였고, 이 조합을 통해 기존 대비 100배 이상의 추론 속도를 확보했다. 대규모 단백질 구조를 빠르게 생성할 수 있는 환경이 마련되면서 계산 비용 부담이 줄어들고, 데이터 생성과 활용 속도도 함께 개선된다.
신약 개발과 감염병 연구 적용 범위 확대
데이터셋은 참조 프로테옴과 WHO 우선순위 병원체를 중심으로 구성됐다. 연구자는 사전 계산된 단백질 구조를 기반으로 가설을 설정하고 실험 검증 단계를 단축할 수 있으며, 초기 후보 물질 탐색과 질병 메커니즘 분석 속도도 함께 높일 수 있다. 고성능 컴퓨팅 자원이 제한된 환경에서도 동일한 데이터를 활용할 수 있다는 점은 연구 접근성을 넓히는 요소다.
엔비디아는 이번 데이터셋 확장을 통해 AI 기반 생명과학 연구 인프라를 강화하고 글로벌 연구 협력을 지속 확대할 계획이다.
#GTC2026 #엔비디아 #알파폴드 #단백질구조 #신약개발 #바이오AI



