数字艺术的进步使得自动化图像处理技术备受瞩目。近期,清华大学与腾讯ARC实验室的研究团队推出了一种名为ColorFlow的新图像序列上色模型。该模型旨在解决黑白图像序列上色时保持角色和物体身份一致性的问题,满足漫画、动画等行业的实际需求。

ColorFlow采用三阶段的扩散基础框架,充分利用上下文信息,通过参考图像池为黑白图像序列精确上色。例如,该模型能高效地为角色的发色和服装上色,确保与参考图像的色彩匹配。与以往需针对每个角色进行微调的技术相比,ColorFlow通过创新的检索增强上色管道,大幅简化了色彩生成的过程。

image.png

ColorFlow的设计包含两个主要分支:一个用于提取色彩身份,另一个负责实际的上色。这种双分支设计充分利用了扩散模型的优势,通过自注意力机制实现强大的上下文学习和色彩身份匹配。为验证ColorFlow的有效性,研究团队还推出了ColorFlow-Bench,这是一项专门针对基于参考图像的上色任务的综合基准测试。

image.png

在对比实验中,ColorFlow在多项指标上超越了现有先进模型,展现出更高的美学质量,其生成的颜色更贴近原始图像。研究团队展示了ColorFlow在不同艺术场景中的应用效果,包括黑白漫画、线条艺术、真实世界照片及卡通故事板等,均取得了令人满意的成果。

ColorFlow的推出不仅为图像序列的自动上色技术树立了新标杆,也为艺术产业的进一步发展提供了强有力支持。研究团队希望这一技术能在实际应用中实现更广泛的推广,推动数字艺术创作的创新与进步。

项目入口:https://zhuang2002.github.io/ColorFlow/

划重点:

🌟 ColorFlow是一个创新的黑白图像序列上色模型,能保持角色身份一致性。

🎨 该模型采用双分支设计,分别用于色彩身份提取和实际上色,提升了上色的效果和效率。

🏆 ColorFlow在多项指标上超越了现有先进模型,展现出更高的美学质量和实用性。