🚀 采用创新方法生成大规模音乐指导数据集,展示出色的音乐生成和编辑能力。
【AiBase提要】@Meta研究员Martin Signoux
据悉,这份名单被称为“Midjourney风格列表”,其中包含超过16,000名艺术家的名字。除了著名的现代艺术家外,名单还包括2021年为医院创作绘画的六岁儿童等各个领域的艺术家。该列表详细指定了这些艺术家的时间段、艺术运动、媒介、流派以及与视频游戏软件相关的信息。
据悉,M2UGen采用了创新的方法,生成了大规模的多模态音乐指导数据集,用于训练模型。这包括MU-LLaMA模型生成的1.2k多小时音乐字幕数据集。模型结合了MU-LLaMA、BLIP图像字幕模型、MPT-7B-Chat模型以及VideoMAE字幕模型,以在各个领域生成对应的指导。