近期,字节跳动旗下豆包应用升级,新增了图片理解功能。在豆包APP和PC端,用户现在可以看到照片及相机按钮,通过上传图片,系统便能识别并理解图片内容。豆包的这项功能不仅包括文字识别,还能深入解析图像,甚至能够解读笑话。

字节跳动抖音豆包大模型

豆包作为字节跳动的大模型AI助手,已具备文本生成、图片生成等多种强大功能。

值得一提的是,豆包正在内测的视频生成功能。据豆包官网介绍,该功能可以将图片和文字快速转化为生动逼真的视频,用户可以根据需求选择不同风格和比例,添加动态效果和运镜,实现多镜头一致性,打造个性化视频内容。