达摩院“寻光”平台评测:视觉技术新体验

本文于 2024-12-26 23:00 更新,部分内容具有时效性,如有失效,请留言

今日收到“寻光”内测申请通过的消息,晚间简单分享一些个人评测。

该平台定位于达摩院的“视觉技术能力应用平台”,目前应用相对较少(与发布会相比),期待未来能逐步开放更多视觉类应用。


(adsbygoogle=window.adsbygoogle||[]).push({});

寻光有两个地址:

https://xunguang.damo-vision.com/ (寻光AI)

https://damo-vision.com/ (看起来是对不太成熟的功能进行测试的平台,后续会讲解,暂且称为“寻光AI小功能测试”)

寻光AI

功能列表繁多,一屏难以全部展示,似乎旨在应用最新技术覆盖各类**视觉编辑**场景。寻光似乎要成为国内的RunwayML。

达摩院“寻光”视频创作平台首测-1

口型控制

我们分别使用真人、动漫形象、图片、视频四类素材测试口型同步效果。

注意:当前测试视频/图片素材分辨率总像素数(长*宽)要求为(256*256~2048*2048)。

一般使用动漫形象,小幅循环视频生成效果最佳,先从这里开始:

<img decoding="async" class="aligncenter size-full wp-image-16525" title="达摩院“寻光”视频创作平台全面评测-1" src="https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b.png" alt="达摩院“寻光”视频创作平台全面评测-1" width="1920" height="911" srcset="https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b.png 1920w, https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b-300x142.png 300w, https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b-1024x486.png 1024w, https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b-768x364.png 768w, https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b-1536x729.png 1536w, https://www.aisharenet.com/wp-content/uploads/2024/12/5356b96eeadf42b-18x9.png 18w" sizes="(max-width: 192

相关推荐

暂无评论

发表评论