复制成功

分享至

主页 > 比特币 >

万字长文讲透AI艺术:缘起、意义和未来(下篇)

2022.11.15
作者:刘秋杉 「无界AI」负责人


前言


AI 艺术更为直接的是一场新消费变革,但以未来为终局,其必将是一场新技术变革,这是自十多年前移动互联网革命以来久违的一幕,让开源生态点燃的这星星之火燃遍新十年创业的每个角落。与区块链引领的加密变革稍有不同,AIGC(AI 艺术所归属的大类)带给人们的兴奋感并不来自纯金融和财富预期(“多巴胺”),更多的是发自人类内心本质的对崭新未来的渴望,那是一种真正的“内啡肽”。


未来:技术为王


由于当前最大的开源生态是以 SD 为导向,因此本文所谈论的技术动向皆来自于 SD 大生态。MJ 在算法本质上与 SD 同宗同源且大同小异,其关键为不断进化的数据集和美学算法增强,期待 MJ 开源的那一日,与世人共享其普惠万物的力量。

(一)二次元模型开辟可商用垂直模型先河

以 NovelAI Diffusion、Waifu Diffusion、trinart 等为代表的二次元模型以其惊人的“平图”效果极大地拓展了 SD 模型和生态的想象空间,其近乎可商业化的使用体验也开辟了“万物皆可垂直”的垂直模型先河,弥补了像 SD 这种大通用模型在个别美学领域的“力不从心”。当然在这个过程中也是伴随着诟病、质疑和抨击,但商业与技术应该一分为二去看待。

以 NovelAI Diffusion 为例

由原本做 AIGC 生成小说内容的商业实体 Novel 推出,基于 SD 算法框架和 Danbooru 二次元图库数据集进行训练和优化,被外网称为“最强二次元生成模型”。除去手部细节,NovelAI 的出图质量可谓上乘。最大的功劳来自 Danbooru,是一个二次元图片堆图网站,会标注画师名、原作、角色,以及像文字描述一遍画面内容的详细 tag(可能会详细到角色的发型发色、外貌特征、服装、姿势表情、包含一些其他可识别内容的程度),而这些对扩散模型的训练尤为重要,省去了大量的人工筛选标注工作。Danbooru 的商业定位也给了 NovelAI “可乘之机”:根据搜索结果内容量来看,这个网站是其他用户自发保存(例如在推上有一些热度的绘画作品)并上传上去的,所以在日本一直有这个网站无授权转载的争议。关于这次 AI 学习素材库的事情,Danbooru方面也有做出回应:与包括NovelAI 在内的 AI 作画网站没什么关系,且不认可他们的行为。

(注:以上相关内容引用自微博大 V:夜露·苟·布鲁图斯)
万字长文讲透AI艺术:缘起、意义和未来(下篇)

NovelAI Diffusion 生成作品

但从正面意义来看,NovelAI 的确也在技术上给 SD 带来了新的空间,就连 StabilityAI 的老板 Emad 也在推特上宣传到:“NovelAI 的技术工作是对 SD 极大的提升,包括手指修复、任意分辨率等等。”对技术感兴趣的可以看一看官方博客​blog.novelai.net/novelai-improvements-on-stable-diffusion-e10d38db82ac中对 SD 的改进工作,大致是修改了 SD 模型架构及训练过程。

万字长文讲透AI艺术:缘起、意义和未来(下篇)万字长文讲透AI艺术:缘起、意义和未来(下篇)

像 NovelAI 这类的二次元模型对于用户输入的描述词的专业程度要求较高,如下所示:

colorful painting, ((chinese colorful ink)), (((Chinese color ink painting style))), (((masterpiece))), (((best quality))),((Ultra-detailed, very precise detailed)),
(((a charming Chinese girl,1girl,solo,delicate beautiful face))), (Floating),(illustration),(Amazing),(Absurd),((sharp focus)), ((extremely detailed)), ((high saturation)), (surrounded by color ink splashes),((extremely detailed body)),((colorful))

不仅需要描述人物,更是要对人物的二次元细节进行刻画,甚至还要加一些有助于画质增强的词汇,这一系列操作被网友戏称为“咒语”,就像要进入一个二次元世界一般,首先你要学会“念咒”。好在社区力量是无限的,陆续出现了很多“宝典”,如《元素法典》元素法典——Novel AI 元素魔法全收录​docs.qq.com/doc/DWHl3am5Zb05QbGVs和元素法典 第二卷——Novel AI 元素魔法全收录​docs.qq.com/doc/DWEpNdERNbnBRZWNL,将二次元的“心法口诀”公诸于众,且全民共创,这很“二次元”。

万字长文讲透AI艺术:缘起、意义和未来(下篇)

(二)AI 画二次元漫画逐渐可行

二次元模型对于画特定形象的人物十分擅长,比如在如下的连续出图中,我们大致可以认为都是一个“主人公”(称之为白小苏苏)在变 Pose 或者换装。因为我们给予 AI 的描述中对该人物进行了极为细致的刻画,就像固定了她的基因一般,加上二次元模型本身对于人物的勾画(平图)相对于真实人物就“粗放”一些,只要重要人物特征一致,便可以判别为同一个人。

万字长文讲透AI艺术:缘起、意义和未来(下篇)
{profile picture},{an extremely delicate and beautiful girl}, cg 8k wallpaper, masterpiece, cold expression, handsome, upper body, looking at viewer, school uniform, sailor suit, insanity, white hair, messy long hair, red eyes, beautiful detailed eyes {{a black cross hairpin}}, handsome,Hair glows,dramatic angle

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier