首页 科技文章正文

国内各大产品功能横向对比及使用建议():图片生成&图片处理篇

科技 2024年08月18日 15:09 760 admin

本文旨在深入分析国内各大AI产品在“图片生成&图片处理”领域的功能对比,帮助用户更好地理解各产品特性,并作出适合自己需求的选择。

2022年OpenAI发布了ChatGPT3.5,标志着以AI大模型为主体的人工智能时代到来。自此之后,国内各个传统大厂、AI独角兽纷纷下场,各类AI大模型及其对应的产品纷纷如雨后春笋般问世。

在带来行业繁荣的同时,也为普通用户带来了不少选择的困惑。究竟国内各大AI产品有什么差异?我们应该如何选择?

要对比各大AI产品,我们可以粗略分为内、外两层,内在是其内核的大模型智能程度,外在是各团队研发的产品功能。对于大模型,市面上已有不少报告进行测评。但对于外在产品功能的梳理对比,似尚未有过多关注。

有感于此,我计划从对“文本生成”、“图片生成&图片处理”、“智能体”三个当下AI最为热门的领域入手,梳理目前国内各大AI产品功能的横向对比。

当然,我的主要关注点是“有无”,而非“优劣”,即我主要着眼在某一项功能在各大AI产品上是“有”还是“没有”,而不会具体比对该功能的具体表现“好”还是“不好”,因此也不会涉及到功能的具体评分。

我的目标是通过对国内各大AI产品功能横向对比,为不同使用场景、使用诉求的人群提供产品选择上的建议。

横向对比采集时间:2024年8月(目前设想可能每3个月更新对比一轮,并视情况是否更新使用建议)。如果有朋友们感兴趣但我没有涵盖的AI产品,或者对于本文的任何批评建议,欢迎在评论区里留言。

本篇是这个系列的第二篇——“图片生成&图片处理”篇

一、【对比产品及项目】

严格来说,“图片生成”和“图片处理”是两个独立的领域。前者是通过给AI输入文字或图片,让AI生成新的图片(即俗称“文生图”、“图生图”);后者是对已有的图片,通过AI能力进行各类调整处理。

但从产品视角来看,二者又有明确的联系,毕竟,AI生成图片后进行处理,是一个很流畅的操作。

并且,从用户视角来看,如果有涉及“图片”的相关工作,那大概率是“图片生成”和“图片处理”都有所涉及。因此,我们会将二者放在一起进行对比。

关于“图片生成&图片处理”领域的产品对比,入围标准是:

基于以上标准,在“图片生成&图片处理”领域的入围产品有:

(注:SD即StableDiffusion,是一套开源的AI图片生成工具,支持安装多个的生图大模型。)

对比的项目主要由以下类别组成:

二、【完整对比结果】

基于上述产品和项目,完整横向对比结果如下:

图片生成:

图片处理:

三、【结果解析】

1.简易使用型:元宝、豆包、可灵AI

2.类MJ型:江城洛神、通义万相、文心一格

3.类SD型:智影、WHEE 美图设计室、堆友

四、【整体使用建议】

首先不建议使用“简易使用型”的产品。倒不是说他们能力不行,主要是考虑到入门和使用,他们都并非最好选择。最典型的体现就是关于“风格”的设置。众所周知,画面“风格”是一张图片最基本的属性。

虽然“简易使用型”的产品也是可以通过在Prompt里面进行风格描述来实现,但是进阶后还是要切换到“选择生图模型”。因此从一开始上手就应该建立“选择生图模型”来控制风格的认知。此外,从易用性来看,也不及可以直接选择风格的产品。

然后就是“类MJ型”的产品,它们在最基础的“文生图”领域都较易上手,既能满足日常需要,又能低门槛上手。而具体到哪一款产品,则首推“文心一格”,原因无他,就是因为它无论是图片生成还是图片处理,功能都相对齐全。

最后就是想进一步深入研究AI生成图片,那必须会走到“学习StableDiffusion”的阶段,此时推荐产品更多则是要考虑其功能是否足够全面。以此为标准,那么综合功能最齐全且免费使用条件简单的“堆友”就成为不二之选了。

五、【附:部分产品特色功能截图】

文心一格将提示词中的部分内容结构化(画面风格、修饰词、艺术家)

通义万相围绕电商场景打造了相关的特色功能

腾讯智影围绕“视频 图片”打造了一系列功能

WHEE全面的AI生图能力

堆友友好且接近SDWebUI的操作界面

作者:产品经理崇生,公众号:崇生的黑板报

本文由@产品经理崇生原创发布于人人都是产品经理。未经作者许可,国内各大产品功能横向对比及使用建议():图片生成&图片处理篇禁止转载

题图来自unsplash,基于CC0协议

标签: 国内各大产品功能横向对比及使用建议()图片生成& 图片处理篇

卓越科技网 网站地图 免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052 版权所有:卓越科技网 沪ICP备2023023636号-5