Fashion

Google releases GenAI tools for music creation

GenAI 도구가 음악 산업을 놀라운 방식으로 변형하고 때로는 윤리적 문제가 발생하는 가운데 Google이 AI 기술에 대한 투자를 강화하여 새로운 노래와 가사를 만들어내고 있습니다.

오늘 검색 엔진 거장은 MusicLM의 업그레이드인 MusicFX를 공개했습니다. MusicFX는 기존보다 더 높은 품질과 빠른 음악 생성을 제공하여 최대 70초까지의 소품과 음악 루프를 생성할 수 있습니다.

MusicFX는 Google의 AI 테스트 키친에서 이용할 수 있으며 사용자들이 회사 연구소의 실험적 AI 시스템을 시도해볼 수 있는 앱입니다. 기술적으로는 MusicFX가 지난 12월 일부 사용자에게 출시된 바 있지만 이제 일반적으로 사용할 수 있습니다.

이미지 제공: Google

그리고 그것이 나쁘지 않다고 말해야 할 것 같습니다.

...
...

이전 버전과 마찬가지로 MusicFX를 사용하면 사용자가 생성하려는 노래를 설명하는 텍스트 프롬프트("플라멩코 스타일로 연주되는 나일론 줄 기타 두 대")를 입력할 수 있습니다. 이 도구는 기본적으로 30초 짜리 두 개의 버전을 생성하며 트랙을 연장(50 또는 70초까지)하거나 자동으로 시작과 끝을 묶어 루프시킬 수 있는 옵션이 있습니다.

새로 추가된 기능은 프롬프트에서 대체 설명어를 제안하는 것입니다. 예를 들어, "컨트리 스타일"을 입력하면 "록빌리 스타일" 및 "블루그래스 스타일"과 같은 장르가 포함된 드롭다운이 표시될 수 있습니다. "캐치(입에 맴도는)"라는 단어에 대한 드롭다운에는 "치유하다" 및 "멜로디"가 포함될 수 있습니다.

이미지 제공: Google

프롬프트 필드 아래에는 관련 설명어, 악기 및 템포에 대한 추가 권장사항의 워드 클라우드가 제공됩니다("아방가르드", "빠른", "흥미진진", "808북칙 드럼" 등).

...

딱히 나쁘지 않아 보입니다. 사실 저자에게는 애매한 상태입니다. 현재 최신 기술은 놀라울 정도로 깨끗하고 선명한 트랙을 만들어냅니다. 그러나 지루하고 영감이 부족하며 멜로디가 초점을 잃은 트랙들이 나오는 경향이 있습니다.

아마도 저에게는 그게 영향을 미친 것 같습니다. 저의 테스트 용도로 사용한 프롬프트 중 하나는 "춤추기 좋은 여름 옥상 분위기를 갖춘 펑키 비트의 하우스 음악"이었습니다. MusicFX가 결과물을 제공했고, 트랙들은 별로없었습니다. 하지만 최근 들은 더 나은 DJ 세트와 비교해 볼 수는 없습니다.

직접 들어보십시오:

현악기를 사용한 노래는 싸구려 MIDI 샘플처럼 들립니다. 이는 MusicFX의 한정된 훈련 세트를 반영한 것 일 수 있습니다. "강렬한 멜로디 중심적인 오케스트라 스타일로 연주되는 감성적인 멜로디"라는 프롬프트로 생성된 두 트랙이 있습니다:

그리고 변화를 주기 위해 여기에 "눈물을 흘리며 연주되는 기타 노래, 우울하고 느리면포, 달빛이 비출 밤"의 MusicFX 해석이 있습니다.(맞춤법 오류를 용서해 주십시오.)

MusicFX가 생성하지 않는 특정한 것들이 있고 생성된 트랙에서 삭제할 수 없는 요소들이 있습니다. 저작권에 어긋나지 않기 위해 Google은 특정 아티스트나 보컬이 포함된 프롬프트를 걸러냅니다. 그리고 DeepMind 부서에서 개발한 인증될 수 없는 워터마킹 기술인 SynthID를 사용하여 어떤 트랙이 MusicFX에서 나왔는지 분명하게 합니다.

어떤 마스터 목록을 사용하여 아티스트 및 노래명을 필터링하는 것인지는 확실하지 않지만 저는 그것을 격파하는 데 그렇게 어렵지 않았습니다. MusicFX는 SZA와 The Beatles 스타일의 노래를 생성하는 것을 거부했지만, Lake Street Dive에 대한 참조를 사용하여 프롬프트를 전달하였습니다. 하지만 그 트랙들은 기대 이하였다고 말할 수 있습니다.

가사 생성

Google은 AI 테스트 키친에서 음악을 만들기 위한 도구인 TextFX를 출시했습니다. MusicFX와 마찬가지로 TextFX는 일정 사용자 그룹에게 장시간 동안 사용 가능했지만 이제 보다 광범위하게 사용할 수 있으며, Google은 사용자 경험 및 내비게이션 측면에서 업그레이드되었다고 합니다.

AI 테스트 키친 앱에서 Google이 설명하면 TextFX는 랩 아티스트이자 음반 프로듀서인 Lupe Fiasco와 함께 협력하여 만들어졌습니다. 이는 구글의 텍스트 생성 AI 모델 중 하나인 PaLM 2로 작동하며 Fiasco가 그의 경력 중에 개발한 가사 및 언어 기술에서 영감을 받았다고 합니다.

이미지 제공: Google

이 기자는 TextFX가 자동 가사 생성기라고 생각했으나 그렇지 않다는 것을 알았습니다. TextFX는 사용자들이 가사 작성 프로세스를 돕기 위한 모듈의 스위트로, 선택한 문자로 시작하는 카테고리의 단어를 찾아내거나 관련 없는 두 가지 사이의 유사점을 찾아내는 모듈을 포함하고 있습니다.

이미지 제공: Google

TextFX를 사용하는 데는 시간이 걸리지만, 가사 작사가들 및 일반적으로 쓰는 사람들에게 유용한 자원이 될 수 있다는 것을 알 수 있습니다. 그러나 그 출력물을 신중하게 검토해야합니다. Google은 TextFX가 "사람에 관한 부정확한 정보를 표시할 수 있으며, 기후 변화가 "중국 정부가 미국 기업을 해치기 위해 만드는 거짓말"이라고 제안하게 할 수 있습니다."라고 경고합니다.

이미지 제공: Google

남아있는 질문

MusicFX와 TextFX를 통해 Google은 GenAI 음악 기술에 크게 투자하고 있음을 시사하고 있습니다. 그러나 GenAI 음악 주변의 어려운 문제를 다루기보다 Joneses와 따라가려는 Google의 집착이 최종적으로는 그를 섬기는데 도움이 될지 의문입니다.

최근에는 익숙한 소리와 보컬을 만들어내어 진짜로 혹은 적어도 충분히 가까운 것으로 속일 수 있는 GenAI를 사용한 홈메이드 트랙들이 확산되고 있습니다. 음악 레이블은 저작권 문제를 인용하여 Spotify 및 SoundCloud와 같은 스트리밍 파트너에게 AI 생성 트랙을 신고해왔으며 일반적으로 승리를 거뒀습니다. 그러나 "딥페이크" 음악이 아티스트, 레이블 및 다른 권리 보유자의 저작권을 위반하는지 여부에 대해 명확한 가이드가 아직 존재하지 않습니다.

판사는 지난 8월 AI 생성 예술은 저작권을 행사할 수 없다고 판결했습니다. 그러나 미국 저작권국은 아직 입장을 취하지 않았으며, 최근 AI와 관련된 저작권 문제에 대한 대중 의견을 적극 수렴하기 시작했습니다. 다른 아티스트의 스타일로 생성된 음악을 상업화하려는 사용자가 저작권법을 위반할 수 있는지 여부 또한 불분명합니다.

Google은 DeepMind와 협력하여 Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia 및 T-Pain과 같은 아티스트들과 함께 AI 모델을 테스트하는 YouTube 사업 부문에 GenAI 음악 도구를 배치하려는 주의 깊은 이동을 시도하고 있습니다. 이는 Google의 일부 GenAI 경쟁사들인 Stability AI 같은 기술 거인들에 대한 언급을 초월합니다. 이 회사는 "공정한 이용"이 작성자의 허락 없이 콘텐츠 학습을 정당화한다는 입장을 취하고 있습니다.

그러나 레이블들은 훈련 데이터에 저작권 가사가 포함되어있는 GenAI 공급 업체에 대해 소송을 조작하고, 아티스트들이 불만을 등록할 때 Google은 많은 일을 뒷바침해야 하며, 불편한 사실이 그들의 속도를 늦추지 않습니다.

Related Articles

Back to top button Back to top button