- 32H100 텐서 코어 GPU 탑재한 엔비디아 DGX 시스템에서 훈련

- 미세 조정과 소량의 데이트 통해 사전 훈련 없이도 작업 처리

- 개별적인 명령어 결합과 세밀한 제어 통해 보다 창의적인 결과물 생성

 

엔비디아, 텍스트만으로 오디오 생성하는 AI 모델 ‘푸가토’ 공개.jpg

엔비디아텍스트만으로 오디오 출력을 제어할 수 있는 생성형 AI 모델 ‘푸가토(Fugatto, Foundational Generative Audio Transformer Opus 1)’를 개발했다고 밝혔다.

 

엔비디아 생성형 AI 연구팀이 개발한 푸가토는 노래를 작곡하거나 음성을 수정할 수 있는 일부 AI 모델보다 뛰어난 정교함을 자랑하며, 텍스트와 오디오 파일의 조합을 사용해 프롬프트에 설명된 음악과 음성, 사운드의 모든 조합을 생성하거나 변형할 수 있다.

 

예를 들어, 텍스트 프롬프트에 따라 음악 스니펫(snippet)을 생성하고, 기존 노래에서 악기를 제거하거나 추가하고, 목소리의 억양이나 감정을 바꿀 수 있다. 심지어 이전에 들어본 적 없는 소리를 만들어낼 수도 있다.

 

멀티 플래티넘 프로듀서이자 작곡가인 이도 즈미슬라니(Ido Zmishlany)는  “이 기술은 정말 대단하다. 사운드는 내 영감의 원천이며 그것이 내가 음악을 만들게 하는 원동력이다. 스튜디오에서 즉석으로 완전히 새로운 사운드를 만들 수 있다는 생각은 정말 놀라운 일”이라고 밝혔다.

 

 

사운드에 대한 깊은 이해
엔비디아의 응용 오디오 연구 관리자이자 푸가토를 개발한 라파엘 발레(Rafael Valle)는 “우리는 사람처럼 소리를 이해하고 생성하는 모델을 만들고 싶었다”고 설명하고, "
다양한 오디오 생성과 변형 작업을 지원하는 푸가토는 여러 훈련된 능력의 상호 작용에서 나타나는 창발성(emergent property)을 보여주는 최초의 기초 생성형 AI 모델이며, 자유 형식의 지시를 결합할 수 있는 능력도 가지고 있다"고 밝혔다. 또한,  푸가토는 데이터와 모델 규모에 따라 오디오 합성과 변형에서 비지도 멀티태스크 학습이 가능한 미래를 향한 첫걸음”이라고 덧붙였다. 

 

다양한 푸가토 사용 사례
음악 프로듀서들은 푸가토를 사용해 노래에 대한 아이디어를 빠르게 프로토타입으로 만들거나 편집할 수 있으며, 다양한 스타일, 목소리, 악기를 시도해 볼 수 있다. 또한, 효과를 추가하고 기존 트랙의 전체 오디오 품질을 향상시킬 수도 있다.

 

이도 즈미슬라니는 “음악의 역사는 곧 기술의 역사이기도 하다. 일렉트릭 기타는 로큰롤을 탄생시켰고, 샘플러가 등장하면서 힙합이 태어났다. AI와 함께 우리는 음악의 다음 장을 쓰고 있다. 음악을 만들기 위한 새로운 도구와 새로운 악기가 생겼고, 이는 매우 흥미로운 일”이라고 밝혔다. 

 

광고 대행사는 푸가토를 적용해 기존 캠페인을 여러 지역이나 상황에 맞게 빠르게 조정하고, 음성 해설에 다양한 억양과 감정을 적용할 수 있다. 언어 학습 도구는 사용자가 선택한 목소리를 사용하도록 개인화할 수 있다. 가령, 가족이나 친구의 목소리로 온라인 강의를 들을 수 있다. 비디오 게임 개발자들은 이 모델을 사용해 게임을 플레이하면서 변화하는 동작에 맞게 타이틀에 미리 녹음된 애셋을 수정할 수 있다. 또한, 텍스트 지침과 선택적 오디오 입력을 기반으로 즉석에서 새로운 애셋을 생성할 수도 있다.

 

즐거운 소음 만들기
라파엘 발레는 “우리가 특히 자랑스럽게 여기는 모델 기능 중 하나는 ‘아보카도 의자’라고 부르는 것”이라고 말하며, 이미지용 생성형 AI 모델이 만든 독특한 비주얼을 언급했다. 

 

예를 들어, 푸가토는 트럼펫에서 강아지 소리를 내게 하거나, 색소폰에서 고양이 소리를 내도록 할 수 있다. 사용자가 묘사할 수 있는 것은 무엇이든 모델이 생성할 수 있다. 연구팀은 미세 조정과 소량의 노래 데이터를 통해 텍스트 프롬프트에서 고품질의 노래 음성을 생성하는 등 사전 훈련되지 않은 작업도 처리할 수 있음을 발견했다.

 

예술적인 제어 기능 제공

푸가토의 참신함을 더하는 몇 가지 기능이 있다.

 

푸가토는 추론하는 동안 컴포저블아트(ComposableART)라는 기술을 사용해 훈련 중에 개별적으로만 보였던 명령어를 결합한다. 예를 들어, 프롬프트의 조합으로 ‘슬픈 감정’의 ‘프랑스어 억양으로’ 말하는 텍스트를 요청할 수 있다. 모델의 명령어 간 보간 기능을 통해 사용자는 억양의 강약이나 슬픔의 정도 등과 같은 텍스트 명령어를 세밀하게 제어할 수 있다.

 

푸가토의 이러한 측면을 설계한 AI 연구원 로한 바들라니(Rohan Badlani)는 “사용자가 주관적이거나 예술적인 방식으로 속성을 조합할 수 있도록 하고, 각 속성을 얼마나 강조할지 선택할 수 있게 하고 싶었다”고 설명하고, “테스트 결과 종종 놀라운 결과가 나왔고, 내가 컴퓨터 과학자이지만 예술가가 된듯한 기분이 들었다”고 밝혔다.

 

아울러 푸가토는 시간이 지남에 따라 변화하는 소리를 생성하는데,  기능을 시간적 보간(temporal interpolation)이라고 한다. 예를 들어, 천둥소리가 점점 크게 들리다가 점차 멀어지며 지역을 통과하는 폭풍우 소리를 만들 수 있다. 또한 사용자가 사운드스케이프의 진행 방식을 세밀하게 제어할 수 있다. 또한, 노출된 훈련 데이터만 재현할 수 있는 대부분의 모델과 달리, 푸가토를 사용하면 새소리와 함께 새벽녘으로 잦아드는 뇌우와 같이 이전에 들어본 적 없는 사운드스케이프를 만들 수 있다.

 

푸가토는 연구팀이 음성 모델링, 오디오 보코딩, 오디오 이해와 같은 분야에서 쌓아온 이전 작업을 기반으로 하는 기초 생성형 트랜스포머 모델이다.

 

정식 버전은 25억 개의 파라미터를 사용하며, 32개의 엔비디아 H100 텐서 코어(Tensor Core) GPU가 탑재된 엔비디아 DGX 시스템을 통해 훈련됐다. 푸가토 제작에는 인도, 브라질, 중국, 요르단, 한국 등 전 세계의 다양한 사람들이 함께했다. 이들의 협업으로 푸가토의 다중 억양과 다국어 기능이 더욱 강화됐다.

 

이 작업에서 가장 어려운 부분 중 하나는 훈련에 사용된 수백만 개의 오디오 샘플로 구성된 혼합 데이터 세트를 생성하는 것이었다. 연구팀은 데이터와 지침을 생성하기 위해 다각적인 전략을 사용했다. 이를 통해 모델이 수행할 수 있는 작업의 범위를 크게 확장하는 동시에, 더 정확한 성능을 달성하고 추가 데이터 없이도 새로운 작업을 수행할 수 있게 했다.

 

아울러 기존 데이터 세트를 면밀히 분석해 데이터 간의 새로운 관계를 밝혀냈다. 전체 작업은 1년 이상이 소요됐다.

 

#엔비디아#푸가토#AI#

 

 

?

  1. 안랩 V3, ‘AV-TEST’ 최신 평가에서 종합점수 만점으로 인증 통과

    - 올해 참여한 PC용 백신 평가(2월, 6월, 10월)에서 전(全)회 종합점수 만점 기록 및 ‘Top Product(우수제품)’ 선정 안랩의 PC용 백신 솔루션 V3가 글로벌 보안제품 성능 테스트인 ‘AV-TEST’의 2024년 10월 평가에서 종합점수 만점으로 인증을 통과했다. 안랩 ...
    Date2024.12.09 Bynewsit Views153
    Read More
  2. 가민, ‘MARQ 어드벤처러 2세대 - 다마스커스 스틸 에디션’ 출시

    - 최고급 소재로 새롭게 탄생한 럭셔리 모던 툴 워치 - 수작업을 통해 다마스커스 스틸로 제작된 최첨단 프리미엄 모던 툴 워치 - 탁월한 장인정신으로 완성된 독창적이고 세련된 디자인 - 탐험을 위한 최적의 기능과 일상을 위한 피트니스 및 건강 모니터링 ...
    Date2024.12.09 Bynewsit Views162
    Read More
  3. 레노버-아이크래프트, HPC/AI 파트너십 체결…“국내 수냉식 서버 시장 공략 박차”

    - 레노버 글로벌 테크놀로지 코리아(ISG), 아이크래프트를 HPC/AI 파트너사로 선정 - 엔비디아 GPU 및 슈퍼칩 지원하는 씽크시스템(ThinkSystem) 수냉식 서버의 국내 시장 공략 - 차세대 넵튠(Neptune) 액체 냉각 기술 기반해 고성능컴퓨팅(HPC) 및 AI 분야 혁...
    Date2024.12.09 Bynewsit Views441
    Read More
  4. 로지텍, 래피드 트리거 게이밍 키보드 「PRO X TKL RAPID」 출시

    - 최고 수준의 반응성을 제공하는 마그네틱 아날로그 스위치, 정밀하고 빠른 동작을 지원하는 래피드 트리거 기능 탑재 - G HUB를 통한 KEYCONTROL, LIGHTSYNC RGB 조명 커스텀 기능으로 다이내믹한 플레이 환경 제공 선사 로지텍코리아는 신규 게이밍 키보드 ...
    Date2024.12.09 Bynewsit Views147
    Read More
  5. 포티넷 코리아, 연말연시 ‘사랑의 밥차’와 함께 무료 급식 나눔 활동 전개

    - 강동구 어울림복지관에서 직접 음식 만들어 장애인 300여 명에게 제공 포티넷 코리아는 오늘, 연말 연시를 맞아 ‘사랑의 밥차’와 함께 무료 급식 나눔 활동을 펼쳤다고 밝혔다. 포티넷 코리아 임직원 30여명은 서울 강동구 어울림복지관을 방문해 직접 음식...
    Date2024.12.09 Bynewsit Views172
    Read More
  6. 엔비디아, 베트남 R&D 센터 개소…“AI 개발 역량 강화”

    - AI 소프트웨어 개발과 베트남 STEM 엔지니어 인재 활용해 AI 도입 가속화 - 동남아시아 혁신 생태계와 첨단 산업 미래 위한 초석 마련 - 엔비디아 인셉션 프로그램 등으로 100개 이상 베트남 스타트업, 65개 대학과 지속적 협업 엔비디아가 베트남 정부와 협...
    Date2024.12.09 Bynewsit Views423
    Read More
  7. 뷰소닉, 4K 게이밍 빔프로젝터 「VX250-4K」 쿠팡 와우 특별 할인 이벤트

    - 뷰소닉, VX250-4K 쿠팡 와우 회원 대상 40만원 이상 할인 프로모션 진행 - 뷰소닉, 게이밍 빔프로젝터 7종 구매자 전원 호매틱스 동글 G 증정 뷰소닉(ViewSonic)이 12월 연말을 맞아 게이밍 빔프로젝터 VX250-4K 프로모션을 진행한다. 쿠팡 와우 회원에게만 ...
    Date2024.12.06 Bynewsit Views129
    Read More
  8. 안랩, 안랩 EDR 맥 지원 등 기능 업그레이드…“솔루션 활용도 및 사용자 편의성 강화”

    - ▲맥 지원 에이전트 출시로 운잉체제 지원 범위 확대 ▲전용 콘솔 ‘안랩 EDR 애널라이저’의 데이터 관리 효율성 향상 ▲안랩의 차세대 위협 인텔리전스 ‘안랩 TIP’ 연동 고도화 ▲위협 그룹핑 기능 추가 등 솔루션 활용도 및 편의성을 강화 - 안랩 EDR, 고객의 ...
    Date2024.12.06 Bynewsit Views154
    Read More
  9. 캔바, 맞춤형 인쇄 서비스 ‘캔바 프린트’ 국내 출시

    - 디자인부터 인쇄까지 지원하는 원스탑 솔루션 입지 강화 올인원 비주얼 커뮤니케이션 플랫폼 캔바(Canva)가 맞춤형 인쇄 서비스 ‘캔바 프린트’를 국내 출시했다. 사용자는 이제 캔바를 통해 디자인한 제작물을 캔바 플랫폼 상에서 바로 인쇄 의뢰하고 문 앞...
    Date2024.12.06 Bynewsit Views522
    Read More
  10. 엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화

    - AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능 - AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공 - 소프트서브, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개...
    Date2024.12.06 Bynewsit Views377
    Read More
  11. HS효성인포메이션시스템, ‘VSP One Block’에 All QLC 플래시 탑재…“AI 시대 데이터 경쟁력 강화 지원”

    - 듀얼 포트 30TB QLC 미디어 VSP One Block에 탑재 - 확장성∙비용 효율성 높이고 향상된 재해복구, 하이브리드 클라우드 지원 HS효성인포메이션시스템이 ‘VSP One Block’ 스토리지 컨트롤러에 All-QLC 플래시를 탑재한다고 밝혔다. 이를 통해 손쉬운 확장과 ...
    Date2024.12.06 Bynewsit Views133
    Read More
  12. 로지텍, 클로버추얼패션 오피스에 스마트 워크플레이스 솔루션 구축

    - 로지텍 스마트 워크플레이스 솔루션 도입으로 자유롭고 창의적인 업무 및 협업 공간 마련 - 총 13개의 다양한 규모의 회의실에 올인원 화상회의 솔루션 ‘랠리 플러스’ 및 ‘랠리 바’ 설치 - ‘사이트’와 ‘Tap’ 더한 한층 완성도 있는 구성으로 회의 참여자 전...
    Date2024.12.06 Bynewsit Views153
    Read More
  13. No Image

    퓨어스토리지-키옥시아, 하이퍼스케일 데이터센터용 차세대 올플래시 스토리지 솔루션 개발

    - 퓨어스토리지의 데이터 스토리지 플랫폼과 키옥시아의 QLC 플래시 메모리 결합해 하이퍼스케일 데이터센터용 차세대 올플래시 스토리지 솔루션 개발 - 하이퍼스케일 데이터센터 확장성·효율성·성능 향상 협력 퓨어스토리지는 메모리 반도체 선도기업 키옥시...
    Date2024.12.06 Bynewsit Views139
    Read More
  14. 한국레노버, ‘아이디어센터 타워 데스크톱’ 출시…“슬림한 디자인에 높은 공간 활용성”

    - 최신 인텔 코어 i7 프로세서인〮텔 UHD 770 그래픽 탑재 - 레노버 스마트 스토리지다〮양한 연결 단자 지원…사용자 편의성 향상 - 재활용 ABS 소재 활용한 환경 친화적 제품 한국레노버가 공간 활용성이 뛰어난 타워 데스크톱 신제품 ‘아이디어센터 타워 데...
    Date2024.12.05 Bynewsit Views156
    Read More
  15. Qt그룹, 'Qt LTS 릴리스' 지원 기간 최대 5년으로 연장

    - 사이버복원력법(CRA) 준수 위해 유지보수 지원 서비스 5년으로 연장 - CRA 규정 준수를 위해 보안 및 취약점 관리 강화하고 SBOM 문서 제공 Qt그룹이 자체 개발 솔루션인 Qt 프레임워크의 장기 지원 정책(LTS) 기간을 5년으로 연장한다고 밝혔다. 최근 유럽 ...
    Date2024.12.05 Bynewsit Views463
    Read More
  16. 생성형 AI 스타트업 트웰브랩스, AWS와 협력으로 텍스트 검색하듯 영상 검색 지원

    - 트웰브랩스, 자연어 사용해 영상 검색 가능케 해…가장 방대한 데이터 소스인 영상을 접근 가능한 정보 소스로 탈바꿈 - 대화형 쿼리 통해 수십 년 분량 영상 아카이브에서 특정 영화 장면을 찾거나 운동선수들의 경기 영상을 평가 가능 - 트웰브랩스, AWS 사...
    Date2024.12.04 Bynewsit Views375
    Read More
  17. 스노우플레이크, 내년 상반기 한국에서 ‘마이크로소프트 애저’ 지원

    - AWS에 이어 마이크로소프트 애저 환경에서 AI 데이터 클라우드 서비스 제공 - 국내 고객 대상 ‘크로스 클라우드’ 서비스 제공 예정 - 멀티 클라우드 데이터 전략을 실현하며 일관되고 유연한 관리 가능 스노우플레이크(Snowflake)가 2025년 상반기부터 국내 ...
    Date2024.12.03 Bynewsit Views367
    Read More
  18. 텐스토렌트, 삼성증권과 AFWP에서 시리즈 D 투자 유치…“한국과 협력 강화”

    텐스토렌트(Tenstorrent)는 국내 대표적인 벤처캐피털 회사인 삼성증권과 AF W파트너스( AFWP)가 주도한 6억 9,300만 달러 규모의 시리즈 D 펀딩 라운드를 발표했다. 두 회사는 텐스토렌트와 깊은 관계를 유지하고 있으며, 혁신적이고 성공적인 기술 기업에 투...
    Date2024.12.03 Bynewsit Views210
    Read More
  19. 마우저, <10명의 전문가들이 제시하는 GaN 기술에 대한 고찰> 전자책 발간

    - GaN 기반 전력전자장치의 이점을 분석 마우저 일렉트로닉스는 아나로그디바이스(ADI) 및 번스(Bourns)와 협력하여 효율성과 성능, 지속가능성 측면에서 질화갈륨(GaN) 기술이 제공하는 이점과 도전 과제 등을 탐구한 새로운 전자책을 발간했다고 밝혔다. 전...
    Date2024.12.03 Bynewsit Views183
    Read More
  20. 유아이패스, 조달청 나라장터에 ‘자동화 솔루션’ 등록

    - 정부 조달시스템 통해 유아이패스 엔터프라이즈 자동화 솔루션 직접 구매 가능 유아이패스가 정보보안 선도기업 에이텍정보기술(ATEK)과 함께 조달청 나라장터에 자사의 자동화 솔루션을 등록 완료했다고 밝혔다. 이를 통해 공공기관들이 간소화된 조달 프로...
    Date2024.12.03 Bynewsit Views386
    Read More
Board Pagination Prev 1 ... 87 88 89 90 91 92 93 94 95 96 ... 270 Next
/ 270
CLOSE