디지털 시대에 AI(인공 지능)는 더욱 보편화되어 다양한 분야에서 응용 프로그램을 찾고 있습니다. 최근 우리는 간단한 '프롬프트'에서 음악을 생성하는 Google 프로젝트의 진행 상황을 보았습니다. 오늘날 우리도 그것을 발견합니다. 메타 이 모험을 시작했고, 창조 할 수 있는 언어 모델 텍스트 설명에서 오디오 생성. 이 혁신적인 도구의 이름은 '오디오 공예'.
Meta Audiocraft: 모든 사람(또는 거의)이 사용할 수 있는 음악 세대의 새로운 지평
Audiocraft는 AI 기반 도구입니다. 세 가지 언어 모델: AudioGen, EnCodec 및 MusicGen. 목표는 사용자가 듣고 싶은 내용에 대한 간단한 텍스트 설명에서 시작하는 오디오 트랙을 얻을 수 있도록 하는 것입니다. Audiocraft는 음악과 사운드를 생성하고 압축 기능을 제공하는 데 사용할 수 있습니다.
세 가지 모델 중, MusicGen은 텍스트에서 음악을 생성하도록 특별히 훈련된 것입니다.. 이를 위해 Meta에서 라이선스를 부여한 수천 개의 음악 작품이 사용되었습니다. 가장 흥미로운 소식은 세 가지 모델 모두 열 수 즉, 누구나 이를 사용하여 도구와 응용 프로그램을 만들 수 있습니다. Meta에 따르면 이러한 템플릿은 "영감 제공"을 목표로 음악 아티스트와 사운드 디자이너를 위해 특별히 설계되었습니다.
또한 읽기 : 타겟 광고를 위한 메타의 새로운 전략: 사용자 권한
템플릿은 이미 사용 가능하며 해당 코드는 다음을 통해 다운로드할 수 있습니다. 포옹하는 얼굴 또는 관련 페이지 깃허브. MusicGen은 AI가 생성한 노래 스니펫을 얻는 데 사용할 수 있습니다. AudioGen은 음악 제작에 유용한 사운드를 제공할 수 있습니다.. 반면 EnCodec은 AI 기반 압축 도구입니다.
한 곡의 음악을 생성하려면 그것으로 충분합니다. 원하는 음악을 설명하고 '생성' 버튼을 누릅니다. 또한 모델이 생성하려는 음악 유형을 보다 정확하게 처리할 수 있도록 오디오 파일이나 마이크 녹음과 함께 설명을 첨부할 수 있습니다.
생성된 오디오는 약 12초 길이의 트랙입니다. 더 완전한 스니펫을 생성할 수 있는 도구를 얻으려면 일부 개발자가 이러한 템플릿을 기반으로 앱을 빌드할 때까지 기다려야 합니다. 메타 제공 도구를 사용하여 무엇을 할 수 있는지 알아보는 것은 이제 커뮤니티의 몫입니다.