设计师的日子 真是越来越难过了,本来行业就不景气,每天被朋友圈加班、裁员、加班裁员的信息搞得风声鹤唳,今年又吹起一股AI风让人更加焦虑。原来设计院之间卷还有底线,你收80他收50再不济也就是低价中标,但这时行业之外的科技公司带着AI就来“席卷”了。科技公司有了资本支持,其可以底价甚至不要钱竞争设计公司,属于要直接过来掀桌子的行为。
行业变革即将来临,面对来自外部的技术入侵,设计院和设计师是准备战斗还是投降?是否摸清了敌我的底牌?是否有准备好手里的武器呢?
如果你和我一样不甘投降,那下面咱们一起来分析下战局。
La Liberté guidant le peuple
知己知彼百战不殆
“Keep your friends close and your enemies closer”
——The Godfather
首先声明笔者是设计师背景,对于AI大模型的基础层和技术层认知也仅停留在看过几本经典深度学习的书、B站上过李宏毅老师的课、听李沐老师精读过相关经典论文的程度。但在建筑设计垂直领域应用层的开发,属于比较早介入,同时也有实际产品的开发经验,因此仅以自身背景和大家分享一下AIGC是什么。
大多数公开资料都讲的很高深,但如果只需知道和咱们相关应用层的东西,我觉得并不难,至少没有结构力学矩阵位移法难。
AI大模型技术架构 @沙利文
关于AI,我们首先要明确几个误区。
-
误区1:只有ChatGPT和阿尔法狗之类的深度学习模型才叫AI?并不是,如下图所示,我们日常工作中基于规范和经验编个小程序去解决特定工程问题也是AI的一种, 因此不能提到AI就觉得是要喂数据去训练的,AI并没有那么神秘 ; -
误区2:是不是越新的AI越好用?并不是,如果从复杂度和耗费资源来说确实是越来越贵了,但并非越复杂的算法越高级越好用,这就像是交通工具有自行车(小黄车299还没退给我)、汽车、高铁、飞机,假设我每天上下班这点路我非要坐飞机,那就显得我脑子有点问题,同样的 针对不同的需求合适的算法才最好,而非越复杂越好用 ; -
误区3,这波AI和以前一样都是雷声大雨点小?可能不是,这波以GPT为代表的AI与以往不同,前面几次出圈的AI如下象棋的深蓝和下围棋的阿尔法狗,实际上都属于针对特定领域的AI,围棋的去下跳棋都不行,但 此次的人工智能属于通用型人工智能的突破(并非完全实现),其可被迁移影响各行各业,因此AI对设计师的冲击这次是真的 。
AI技术图谱
互联网内容生产方式经历了从 PGC(Professional-Generated Content,专业生成内容) 到 UGC(User-Generated Content,用户生成内容) ,再到 AIGC(Artificial Intelligence Generated Content人工智能生成内容) 的历程。
比如最早的门户网站(PGC)需要大量专业记者和编辑生产内容给网友看;到B站(UGC)则是用户(UP主)生产内容给“绅士”们看最后平台收钱,这就比门户网站的盈利模式好很多;最后到现在则由AI生成各种内容,比如图画、文字、虚拟主播等,以下就是做各种做AIGC生意的公司。
AIGC领域公司图谱
其中与设计业务相关的领域主要是图像生成和文本生成。AIGC图像生成这股浪潮起始于2022年,随之大火的是AI生成图片、漫画脸、AI淘宝广告业等应用,大家平常看朋友圈和刷短视频肯定都不陌生。2022年底逐渐有先驱将其引入设计领域做建筑设计领域的垂直应用,而后出现了一句话出建筑方案、草图3秒效果图、Rhino/SU白模出效果图等各种玩法。
Stable Diffusion生成图片
文字3秒出建筑方案
SU草模出效果图@贲禹强
Rhino端Stable Diffusion插件
现在大家用的最多的两个平台是Midjourney和Stable Diffusion,为了方便理解可以将其和手机操作系统类比,Midjourney可理解为IOS,是闭源的,效果好稳定性高但没法自己做二次开发,并且如果要做建筑类的二次训练也会存在数据安全性等问题;Stable Diffusion可理解为安卓,是开源的,可以本地部署并进行各种魔改,并可本地进行二次训练,但二次训练效果就像炼丹,纯看道士的经验与运数如何。更详细的对比可参看下表。
经过半年的发展技术应用已经非常成熟,以Stable Diffusion为例,去B站随便搜索一下就有一堆教程,从部署到二次训练、从硬件要求到安装包、从互动社区到网络课程,各种免费资源应有尽有,详细到生怕你学不会。更底层的知识如Diffusion、CLIP等,你不知道也不会影响你的使用,就好比 你做手机APP并不需要知道安卓是怎么编出来的 。
B站关于Stable Diffusion的各种教程
文本类应用就是今年的顶流GPT了,前两天连我妈都来给我安利GPT能干什么,本文也就不再赘述了。
下面提一些我们在建筑设计领域的一些尝试,首先GPT能生成文本,所以非常容易就能想到它能帮我写设计说明,比如下图案例中通过喂给它一些我们以往的设计说明样稿,他就学会了设计说明怎么写,而后我只需要输入公租房、绿色环保等信息,他就可以写出符合我习惯的设计说明; 再 比如我们可以用GPT来做我们的项目查询,原来复杂的查询、整理、出图标等操作都可以用自然语言对话的方式一键完成; 再比如我们还可以用GPT与CAD画图连用,告诉他我要画个楼梯,GPT就可以自动画出楼梯施工图。
GPT三秒生成设计说明
GPT数据库自然语言交互
用GPT画楼梯施工图
同样完成以上这些基于GPT大模型的垂直应用也不需要知道诸如Transfomer、Attention、CLIP等底层技术,以我有限的认知举个可能不恰当的例子,不管是OpenAI还是百度文心,他们花了大量资源预训练出的大模型相当于AI的基础设施,就像是一个刚会说话的孩子,GPT3可能是个6岁孩子,GPT4可能是个7岁孩子以此类推; 我们针对建筑设计垂直领域,给预训练大模型喂入更多行业数据对其进行微调,则相当于将孩子培养成了建筑师 。
训练个ChatGPT出来需要大量的专家、时间和资金, 但针对本行业的微调需要的资源就大大减少,完全是设计公司能够承受的 。
AIGC应用层、中间层、基础层架构
太阳底下没有新鲜事
“Whatever has happened before will happen again. Whatever has been done before will be done again. There is nothing new under the sun. ”
——The Bible
看过《三体》的同学应该都知道,再面对三体人即将来临的入侵,最先知道消息出现的并不是抵抗组织,而是ETO组织也就是地球“带路党”简称叛徒,并且ETO内还分为三派, 幸存派、降临派、拯救派 。幸存派比较好理解,你来入侵我技术不如你,我就帮你引路,以便换来你留我幸存;降临派就是我早都不爽地球很久了,正好外来个外来文明,大家就一起毁灭吧,我死也要拉大家陪葬的反社会人格;拯救派比较“圣母”,觉得可以通过大家合作解决双方的问题合作共赢。
年轻时看小说觉得莫名其妙,地球上怎么会有这种叛徒,随着阅历增加发现艺术源于生活,历史上也不乏这种案例。引清军入关的吴三桂不就像是幸存派,打不过就引外族入侵中原得了个藩王,但最终还是被削藩不得善终;再比如秦桧就因为忌惮岳飞,就靠外族力量打压内部势力,虽善终但现在还岳飞坟前跪着呢;再如汪精卫当时也觉得肯定打不过日本,所以选择“曲线救国”成立汪伪政府,最终被钉在历史耻辱柱上。
生前任何形式“粉饰”的叛徒死后都会被钉在耻辱柱上
历史就没有新鲜事。反观如今建筑业面对AI的技术入侵,同样有各种类似ETO的声音。
-
设计院已经“烂”到底了,克扣工资还裁员,赶紧来个新技术让大家都下岗一起毁灭吧, 降临派 ; -
传统设计技术不行,赶紧带着设计经验“投名状”从设计院转行到科技公司,打不过就加入谋个职位, 拯救派 ; -
设计院有设计经验和项目实践,科技公司有数字化技术,双方“强强联合”共赴美好的明天, 幸存派 。
难道设计院和设计师只能放弃抵抗投降了吗?不!我们还有一战之力。
永远不要低估自己的力量
——Theodore Roosevelt
实际上如果没有今年通用型人工智能的浪潮,设计企业在资金量少、起步晚、数字技术落后的前提下基本无超越前方优势公司的可能性。 但通用型人工智大幅改变原有架构,原先的技术壁垒被重构,因为技术太新了,大家被强行拉回到了同一起跑线 。
OpenAI、百度等公司是做基础设施的,是不会来抢所有细分领域市场的。AIGC预训练大模型各种技术咱们不会,本领域原来编软件的科技公司其实也不会;针对预训练大模型的二次训练他们能做,咱们简单学学也能做;将其包装成产品或平台卖会员他们能做,咱们没有互联网的人做不了,但如果自己用根本就不用封装,因此虽不会做但不用做。
同时以Stable Diffusion为例,有些科技公司以其开源的内容进行二次训练,同时封装成平台产品进行出售这件事情本身从法理上就站不住脚。Stable Diffusion是基于CreativeML Open RAIL-M开源协议,协议很长有兴趣的同学可以自行找来研究,简单来说就是这是份传染性协议,虽然你可以用他的东西来商用,但是你用了他的东西你也被传染了,你的东西也要开源, 试想你所谓的壁垒是开源的,大家可以要求你公开权重文件和代码,这份生意怎么可能做得成 。
Stable Diffusion的开源协议
AIGC时代能力分为三方面,算法、算力、数据。算法可以简单理解为会算法的人才,这是科技公司的长板,但是如果仅在应用层做事,其实这个长板并没有那么长;算力可以理解为服务器和显卡,大家都一样都需要去买英伟达的显卡;数据就是经过标注的数据资源。
ChatGPT从美国席卷全球,但在地球另一边的非洲大陆上,一群为OpenAI工作的外包数据标注员,曾遭受过非人的精神折磨。为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的外包肯尼亚劳工,他们所负责的工作就是数据标注。 数据标注的工作流程包括数据标注、打标签、分类、调整和处理等。ChatGPT成功后,一位标 注 员工无奈的表示:“对我们来说,这是一份养家糊口的工作。而现在,仅有30多名工人被迫转到更低薪的岗位,其他人都面临失业。”
ChatGPT背后的数据标注公司Sama
数据本应该是设计院和设计师的长板,但现在某些设计院天真的和科技公司合作开放数据、试用产品、帮忙调教别人的大模型。 最终的命运将会和非洲兄弟一样,不同的是非洲兄弟还能拿工资,设计院则是不要钱甚至给别人钱做这件事,这种情况真是让人匪夷所思。
写在最后
"Alone we can do so little; together we can do so much."
—— Helen Keller
现阶段AI掉队的风险远大于技术本身的风险;人们对自身落伍的担心也远大于对AI本身的担心;很多人抱着AI可以弄死我,风险也可以弄死我,但对手弄死我就不行的理念。这些实际情况都非常容易让外部技术入侵。
如何抵御入侵? 面对设计领域的AIGC浪潮,设计院手握设计经验、项目资源、数据资源实际上处于优势,需要团结起来 。
首先不要认为自身技术不行就投降,不管你是幸存派、降临派、还是拯救派; 其次 守住自己的优势资源 ,同时补齐自身的短板,相信自己还有一战之力; 最后不要有意或无意的出卖了自身的优势资源,同时还为他人做嫁衣,自身没得到好处还出卖了整个行业。
一家之言,欢迎讨论。