A Google létrehozott egy új mesterséges intelligenciát (AI) MusicLM néven, amely képes bármilyen műfajú zenét előállítani egy szöveges leírásból.
A technológiai óriás azonban egyes médiajelentések szerint etikai kérdések miatt nem tette nyilvánosan elérhetővé a rendszert.
„Hú, ez nekem nagyobb dolog, mint a ChatGPT. A Google majdnem megoldotta a zene generálást” – tweetelte pénteken Keunwoo Choi, a Gaudio Lab mesterséges intelligencia kutatója.
Bár a MusicLM nem az első yenei generatív AI-rendszer lenne, de az első, amely „nagy pontosságú” és bonyolult kompozíciójú dalokat hoz létre.
Az algoritmus „jelentős összetettségű” leírásokhoz értelmes dalokat képes előállítani, miután egy 280 000 órányi zenéből álló adathalmazon tanították be. A rendszer képes meglévő dallamokra építeni, akár fütyülve, dúdolva, énekelve vagy hangszeren játszva. A Google kutatói szerint a rendszer képes egymás után írt leírások sorozatát is zenei „történetté” vagy narratívává alakítani.
Emellett a MusicLM-et egy kép és egy felirat kombinációja is irányíthatja, illetve olyan zenét is előállíthat, amelyet egy bizonyos hangszer „játszik” egy adott stílusban. Bár a rendszer technikailag képes vokálok szintetizálására is, az eredmények messze nem ideálisak és olyan problémákkal küzdenek, mint a torzított minták.
A szerzői jogi kérdések
A Google számára a legfontosabb probléma az, hogy a MusicLM olyan képzési adatokat használhat fel, amelyek szerzői jogvédelem alatt álló anyagokat tartalmaznak az előállított dalokban. Egy kísérlet során a kutatók felfedezték, hogy a rendszer által előállított zenék egy százaléka közvetlenül másolta azokat a dalokat, amelyek alapján betanították.
Ez a szám elég magas ahhoz, hogy a vállalat hezitáljon a MusicLM jelenlegi formájában történő kiadásától – jegyezte meg a TechCrunch pénteki beszámolója.
A kutatók kiemelték, hogy a jövőben több erőfeszítésre van szükség a zenei generálással kapcsolatos veszélyek kezeléséhez, és hangsúlyozták a felhasználási módhoz kapcsolódó potenciális kreatív tartalom eltulajdonításának kockázatát.
Néhányan azonban még mindig el vannak ájulva a Google által kiadott AI-hangfalatokatól.
„Lenyűgözött, hogy az automatikusan generált énekhangok minősége sokat javult! Igazinak hangzik, de idegen nyelven” – írta egy Twitter-felhasználó.
Nem ez az első alkalom
Nem ez az első eset, hogy az AI által generált zene jogi aggályokat vet fel.
Jay-record Z cége 2020-ban szerzői jogi panaszt nyújtott be a Vocal Synthesis ellen, miután a YouTube-csatorna mesterséges intelligenciával olyan dalok Jay-Z általi feldolgozását készítette el, mint Billy Joel „We Didn’t Start the Fire” című dala.
A filmeket kezdetben levették, de a YouTube később úgy döntött, hogy a törlési kérelmek „hiányosak” voltak, így újra online kerültek.
Eric Sunray, a Music Publishers Association jelenlegi jogi gyakornoka egy fehér könyvben azt állítja, hogy a MusicLM-hez hasonló AI-zenegenerátorok megsértik a szerzői jogokat azzal, hogy „összefüggő hangszöveteket” szőnek a képzés során elfogyasztott zeneszámokból – idézte a TechCrunch beszámolója.
Ahhoz, hogy az AI által generált zenét a zeneszerzők és a felhasználók számára egyaránt tisztességes módon lehessen felhasználni, az iparágnak az AI-technológia fejlődésével párhuzamosan foglalkoznia kell ezekkel az etikai és jogi kihívásokkal. Azonban még eltarthat egy ideig, amíg tisztázódik, hogy a bíróságok hogyan fognak dönteni az AI által generált zene felhasználásáról.
A Google „MusicLM: Zene generálása szövegből” című tanulmánya itt, az A által generált szövegből zenévé alakított zenei minták pedig itt találhatók.