返回首页  设为首页  加入收藏  今天是:
网站首页科技手机智能科学时尚教育亲子艺术房产
相关文章
 图像生成领域Prompt 的七个缺…
 未来科技风格壁纸 展望未来的…
 华为 Mate 60Pro系列手机持续…
 华为手机中关村报价 - 华为手…
 华为手机官网价格大全-华为手…
 华为Mate50系列发布:售价39…
 华为Mate 6060 Pro手机价格公…
 智能大厅上线是便民服务的新…
 一文就能读懂行政服务大厅智…
 河南镇平:打造智能大厅 方便…
 天津:智税赋能“天开园” 助…
 商丘市政务服务和大数据管理…
 以教育之强夯实国家富强之基
 以高等教育高质量发展支撑和…
 深刻认识主题教育的重要意义…
 尊行俱乐部:教育是人类社会…
 太极文化在高校中的传播及其…
 各类亲子小游戏合集-游戏-高…
 亲子游戏 - 播单 - 优酷视频
 【众爱新闻时间】美好的暑假…
 儿童启蒙教育益智亲子游戏全…
 早教亲子游戏 - 播单 - 优酷…
 岳西思源实验学校
 2020年上海竞赛幸存指南。
 趣味过山车 创意小少年——阳…
 【实小简讯】障碍无阻 快乐无…
 【中青未来微校】科学小博士…
 世界10大顶级奢侈品服装品牌…
 盘点:十大顶级奢侈品品牌第…
 全世界奢侈豪华十大顶级自行…
 世界十大奢侈品汽车品牌每个…
 世界最顶级奢侈品十大奢侈品…
 好久不见电影免费观看 第九区…
 电视剧全集免费热播在线看
 在线影院:美版色戒双面间谍…
 第九分局_免费下载_经典高清…
 国产电影人不爱看国产片
 中国房地产企业排名2022一览…
 2022中国房地产企业综合实力…
 2022房地产企业排行榜出炉!…
 2022中国房地产企业综合实力…
 2022年1-2月中国房地产企业销…
 文心一言的崛起:中国自主研…
 全球知名学者牛津大学发言:…
 量子位「MEET 2023智能未来大…
 ChatGPT“国内版”已在路上 …
 合力科技:品牌及客户优势突…
 盘点16款3000元以内国产4G手…
 3000左右的手机哪个性价比最…
 2023年三千元手机排行榜|30…
专题栏目
网络
您现在的位置: tac新闻网 >> 科技 >> 正文
高级搜索
图像生成领域Prompt 的七个缺陷
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/9/6 1:28:54 | 【字体:

  李蓬熙在向 AI 模型传递指令的过程中,我们常常需要借助 Prompt 这一形式,那么 Prompt 作为载体,是否存在一定的缺陷呢?本文作者讨论了图像生成领域里 Prompt 的七个缺陷,一起来看看吧。

  src=Prompt是向 AI 模型传递指令的核心形式,随着 AI 绘画从艺术领域向设计领域深入,创作诉求趋于严谨、精确,Prompt 作为创作意图的重要载体,一些缺陷日益凸显,对生成结果的可控性、可用性有很大影响。

  创作者要将大脑中构思的画面通过文字表达出来,画面是三维的、立体的,而文字却是一维的、线性的。

  对于较为复杂的创作意图,这个转化过程极具挑战性、技巧性,依赖反复书写带来的经验累积或是专门的学习。

  同一组用词,同一句话,受到语境、文化、群体共识等客观因素的影响,可能存在多重含义,面对文本的多义性,模型理解很容易发生偏差,生成内容无法切中创作者的真实意图。而创作者要基于错误反馈不断对导致歧义的内容进行替换、校正。

  尽管多一些描述可以给模型更多细节,但当前 AI 模型对字数始终存在一个模糊的理解 上限,超过 上限 后的内容,要么理解错乱,要么直接无视,所以创作平台往往对 Prompt 字数加以限制,这就导致更多的创意想法无法被完整表达。

  相比口语化表达,模板化的描述指令更容易被模型理解而且更稳定,具有长期创作需求的创作者,需要学习并熟练掌握基于技术逻辑反推出的的指令公式(如:画面主体 + 场景 + 细节 + 风格修饰),还有控制各类权重的命令参数(如:-seed;-chaos;-::;— iw 等)。

  对于不是描述主体的指令,往往难以判断它是否已对画面产生影响,因此我们看到 绝美、完美、超美 、 大师画质、超高画质、顶级画质 经常出现在一条 Prompt 中,冗余甚至相互对立。如需调整,则要通过删 A 留 B,删 B 留 A 的方式反复比对来定位修改点。

  尤其是设计师的创作场景,对形式、位置、比例、层次、关系等要素的处理更加专业严谨,文字型指令可以做到但书写成本极高,用户能否写出 画面偏左四分之三居中位置,一条高一百像素的金鱼 ?模型又能否对此精准执行?目前看,依靠 Prompt 进行精细化控制并不现实。

  除使用 创作相似 外,创作者生成前对生成结果不可预测,生成过程又类似于黑箱,所以大家往往先生成几张,看看什么效果,找到符合预期的那张再继续深入。这个交互关系中最大的问题在于反馈的高延迟,造成了过高的尝试成本。

  src=Prompt 的这些特点或问题,让人不得不想起 PC 系统早期的DOS 命令行界面:需要掌握语言范式、缺乏提示反馈、没有快捷操作、不直观等问题,让很多计算机初学者望而却步。

  src=以上为输入环节,而在模型一侧,Prompt 的解码过程又会丢失一部分信息,使得创作者大量意图指令无法精准、有效的传递给生成模型,最终得到一个错误的或是可用性较低的生成结果,人们感到挫败并对技术能力产生质疑,其实,生成模型的能力往往由于语义理解的限制,并没有得到充分发挥。

  如果经常使用 AI 绘画平台,可能对这些 Prompt 功能并不陌生:一键复制、创作相似、灵感推荐、智能补全、咒语大全、咒语生成器、创作手册、词包、撰写教程等等。这些功能在一定程度上降低了 Prompt 的撰写成本,尤其针对体验型、尝鲜型的用户,创作效率和质量均有提升,但对带有明确应用场景的设计师群体来说,上述问题依然存在。

  那 Prompt 指令的问题如何解决?又如何让操作体验真正做到 平民化 呢?

  显然技术侧的进展更快,涂抹、叠加、扩展等二次编辑能力,以 Lora 为代表的微调模型,还有 Controlnet 技术,支持边缘检测、草图处理、姿势识别等前沿黑科技,都在试图融合更多其他模态的意图信息,与 Prompt 形成互补,让生成结果更加精准可控。

  说回体验层面,以 Prompt 为核心的创作范式可能并非终极形态,这方面的探索尚未达成共识。我想,在 PC 时代,图形用户界面基于出色的交互体验,快速 取代 了 DOS 命令行一直影响至今,即使进入 AIGC 时代,答案也许仍在其中。

科技录入:admin    责任编辑:admin 
  • 上一个科技:

  • 下一个科技: 没有了
  •  
     栏目文章
    普通科技 图像生成领域Prompt 的七个缺陷 (09-06)
    普通科技 未来科技风格壁纸 展望未来的壁纸 (09-06)
    普通科技 文心一言的崛起:中国自主研发的大型生成式AI… (09-05)
    普通科技 全球知名学者牛津大学发言:数字经济为发展中… (09-05)
    普通科技 量子位「MEET 2023智能未来大会」启动邀你共论… (09-05)
    普通科技 ChatGPT“国内版”已在路上 多家科技巨头确认… (09-05)
    普通科技 合力科技:品牌及客户优势突出 铸就行业巨擘 (09-05)
    普通科技 5本高质量热门爽文主角逻辑鬼才利用信息不对称… (09-05)
    普通科技 第1章 姜凡楚若汐变态的控分 (09-05)
    普通科技 “把科技转化成生产力必须把技术长在泥土里!… (09-05)
    普通科技 白永祥:MX7仍将延续魅族基因 (09-05)
    普通科技 穿越鬼才重生最新章节 (09-05)
    普通科技 热烈庆祝第九届中国行业影响力品牌峰会圆满闭… (09-04)
    普通科技 践行“道植精神” 争当新时代刑技“大工匠” (09-04)
    普通科技 史诗级利好祭出后A股开盘出道即巅峰收出另类长… (09-04)
    普通科技 开盘即巅峰!王炸利好遭A股打脸 市场情绪位于… (09-04)
    普通科技 今日A股收评:开盘即巅峰!如何理解今天A股的… (09-04)
    普通科技 5本超级好看的黑科技爽文脑洞大开科技改变世界… (09-03)
    普通科技 破局重生丨我来数科眼中的金融科技发展之路 (09-03)
    普通科技 利润很吓人4个冷门创业项目 (09-03)