近期,Adobe Research 与西北大学携手推出了名为 Sketch2Sound 的人工智能系统,该系统有望革新声音设计师的工作流程。Sketch2Sound 允许用户通过哼唱、模拟声音或简单文本描述来制作专业的音效和氛围音。
该系统通过分析用户声带输入的三个关键因素:音量、音色(影响声音的明亮或暗淡)和音高,将这些特征与用户的文本描述相结合,生成所需的声音。例如,当用户输入“森林氛围”并发出短促声响时,系统会自动识别这些声响为鸟鸣,无需具体指令。
Sketch2Sound 的另一亮点是其对上下文的理解能力。在制作音乐时,用户可以输入“低音鼓、军鼓”并通过哼唱节奏。系统会智能地将低音鼓置于低音音符,军鼓置于高音音符,极大地简化了声音设计过程。
为满足专业人士需求,研究团队还内置了特殊过滤技术,允许用户根据需要调整生成声音的精确度。声音设计师可选择精确控制或更轻松、近似的方式,这种灵活性可能使 Sketch2Sound 成为 Foley 艺术家的首选。这些艺术家负责为电影和电视节目创作音效,借助此工具,他们能通过声音和文本描述快速创作效果,无需再操作实物发声。
尽管研究人员指出,输入录音中的空间音频特性有时会对生成的声音产生负面影响,但他们正在努力解决这个问题。目前,Adobe 尚未公布 Sketch2Sound 是否将推出商业产品或具体发布时间。
项目入口: https://hugofloresgarcia.art/sketch2sound/
划重点:
🎵 Sketch2Sound 是一款新开发的 AI 工具,可通过哼唱和文本描述制作音效。
🔊 系统分析音量、音色和音高,结合用户声音输入与文本生成目标音效。
🎬 特别适合 Foley 艺术家使用,可快速生成影视音效,提高工作效率。
暂无评论