自聊天机器(qì)人(rén)ChatGPT火爆以来(lái),微(wēi)软公司(sī)创始人比尔·盖茨(cí)已(yǐ)多(duō)次公开谈论人工智能话题。在最近(jìn)的一次采访中(zhōng),他再次表示:“AI可能会让科(kē)技行业迎来一次剧(jù)烈的洗牌”。
这个结论是他(tā)在当(dāng)地时间2月20日接受《In Good Company》节(jié)目专访时提(tí)出的。
他预期(qī),AI的发(fā)展可(kě)能(néng)会威胁到谷歌的市占率,因为微软(ruǎn)在AI方面的行动相(xiāng)当迅速(sù)。而最终科(kē)技(jì)巨头将把(bǎ)AI整合(hé)成用户的“全能助手”,包(bāo)揽一切(qiè)应用(yòng),与(yǔ)人们进(jìn)行沟通(tōng)并提(tí)供建议(yì),可(kě)以取代(dài)亚马逊、Siri或Outlook等(děng)应用。
大佬口(kǒu)中全能助手的(de)到来可能(néng)尚需时日,但(dàn)由ControlNet引发(fā)的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重(zhòng)围。
01
ControlNet颠覆AI绘画新玩法(fǎ)
AIGC向可控靠近
以AI绘画为代表(biǎo)的(de)AIGC上(shàng)一次爆火的时候(hòu),还是2022年8月,在美国科(kē)罗拉多州举办的新兴(xīng)数字艺术家竞赛中,一幅名为《太空歌(gē)剧(jù)院》的作品获奖。
随后各大厂商的AI绘画软件被广(guǎng)大网友熟知并体(tǐ)验,Stable Diffusion便(biàn)是其中代表(biǎo)。
用户们可以(yǐ)在应用中输入一组关键词或者一张照片,就能获得一幅AI创作(zuò)的画作(zuò)。
作画(huà)的关键就是所输入的文本。同(tóng)一组(zǔ)关(guān)键词(cí)也可以创作出(chū)很多张风格不一样的(de)画作,这让创(chuàng)作的过程就像开盲(máng)盒。
很(hěn)多(duō)用户很喜欢这种不确(què)定的惊喜,他们会将生成的美图当做头像。而另一部分喜(xǐ)欢翻(fān)看AI绘(huì)画(huà)的“翻车(chē)”作品。在社交媒体上,许多(duō)用(yòng)户分享AI“翻(fān)车(chē)现场”,例如(rú),一(yī)位网(wǎng)友的小狗照片被AI画成了“肌肉男”,还有(yǒu)网友的个人照片(piàn)被AI识别成了建筑。
而如今随着ControlNet的出(chū)现与加持(chí),以往AI绘画的填写关键词游戏可能要被颠覆了。
ControlNet是一(yī)位(wèi)正在(zài)斯坦(tǎn)福读(dú)博的(de)中(zhōng)国人张吕敏创作的一(yī)种基于(yú)控制点的图像(xiàng)变(biàn)形算法,主(zhǔ)要用于(yú)数字图像处理、计算(suàn)机(jī)视(shì)觉和计算(suàn)机图形学等(děng)领域(yù)。
其SD插件一经发布(bù),在(zài)短(duǎn)短的两天内便(biàn)成(chéng)为了AI绘画领域最(zuì)新的(de)热点。
在此(cǐ)之前(qián),大(dà)家用了很多方法想让AI生成(chéng)的(de)结果尽可能的符合(hé)要求,但是都不尽(jǐn)如人意(yì),它的出现(xiàn)代表(biǎo)着AI生成开(kāi)始(shǐ)进入真(zhēn)正的可控时期(qī)。
因为ControlNet可以直(zhí)接提取画面(miàn)的构图(tú),人物(wù)的姿势和画面(miàn)的深(shēn)度(dù)信息等。有了它的(de)帮助(zhù),就不用(yòng)频繁的用提(tí)示词(cí)来碰(pèng)运气,抽盲盒(hé)式的创作了(le)。
通(tōng)俗的说ControlNet相当(dāng)于(yú)给AI绘(huì)画加了“魔法(fǎ)”,不少博主(zhǔ)的作品已经(jīng)获得了大量的浏(liú)览量(liàng),“viggo”就(jiù)是(shì)其中之一,他用朋友的照片直接带她们走(zǒu)进动漫世界。
viggo先用StableDiffusion图片(piàn)转文字。
再用Text2Prompt插件(jiàn)拓展找(zhǎo)到对应的关键词(cí);最后用ControlNet插(chā)件绑(bǎng)定(dìng)骨骼开始换关键词试效果。
通过图片就可以看出来,效果十分惊艳。
更厉害的是,除了真实(shí)的照片,草图也(yě)可(kě)以加(jiā)上“魔法”,知乎大牛(niú)“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线稿转全彩(cǎi)图(tú)。大神张(zhāng)吕敏其本(běn)尊也亲自回应(yīng)。
不得不(bù)说当下(xià)AIGC已经变得越(yuè)来越(yuè)强大,甚至输(shū)出的(de)作品都已(yǐ)经(jīng)能以假乱真了(le)。
02
难辨虚实(shí),AIGC技术(shù)力爆发(fā)
警惕安全问题(tí)
近日,“苏州金鸡湖有游艇(tǐng)party”的消息(xī)火遍(biàn)网络,而经过警方辟谣这所谓的“party”可能是全国第(dì)一起AI绘图诈骗(piàn)。
由于这个活(huó)动里(lǐ)面给出的美女照(zhào)片都是AI制作的真人照片绘(huì)图,因为太(tài)逼真,被大(dà)家当(dāng)成真事传播了。
不过仔细观察可以发现,活动发起(qǐ)者(zhě)提供的照片中有个很大的漏洞可以(yǐ)发现并非真人,而(ér)是AI绘(huì)图,那便是(shì)图片中女性的手指部(bù)分有的存(cún)在异(yì)常。
有行业人事表示:“现(xiàn)在因为手指部分(fēn)的绘画算法比较复杂,AI还不(bù)太(tài)会画人的手(shǒu),但最新看到的图片已经有(yǒu)越(yuè)来(lái)越完美的AI模(mó)型出现,以后可能就完全没有(yǒu)漏洞了。”
类似的AI作图(tú)诈骗在国外也已有(yǒu)发生。据英(yīng)国广播公司(sī)报道,土耳其地震期间,有Tiktok用户使用AI合成了儿童(tóng)受灾的(de)假(jiǎ)照片发布到网络,以此诱骗善(shàn)良的人打赏“捐助”从而实施诈骗。
目前随着(zhe)技术发展,AIGC已经能做(zuò)出真人(rén)照(zhào)片般的绘(huì)图效果,如(rú)果这样的图(tú)片被用来(lái)诈骗,将非常可(kě)怕。
此外AIGC还(hái)引发了很(hěn)多(duō)担(dān)忧,一(yī)方面,批判者认(rèn)为(wèi)AI在“学习”了大量前人的作品之后,其创作没有任何情绪和灵魂,难以(yǐ)和人类的(de)艺(yì)术创作相提并论。
另(lìng)一方面,AIGC背后的版权、目前都并(bìng)没(méi)有得到有(yǒu)效(xiào)的(de)解决(jué),还有AIGC会不(bù)会(huì)代(dài)替(tì)人(rén)类“至(zhì)高无上”的创意(yì)。
马(mǎ)斯克也强调,人工(gōng)智能的(de)安(ān)全问(wèn)题(tí)需要得(dé)到(dào)重视,太晚(wǎn)就来不及了。
03
AIGC下一站除(chú)了视频(pín),还有(yǒu)远方
技术都是有两面性的(de),潜在的危害并不能掩盖其光(guāng)辉的贡(gòng)献。现在看来(lái),人工智能技术将是第四次工(gōng)业革命的核心驱动(dòng)力量,将(jiāng)创(chuàng)造新的增(zēng)长奇迹(jì)。
过去一年,人工智能在技术(shù)和(hé)商业层面都有了巨(jù)大进(jìn)展,AI绘画就是人工(gōng)智能技术(shù)发生方向性改变的一(yī)个代表。其下一站或(huò)许就是(shì)视频。
此前,Meta和谷(gǔ)歌先(xiān)后发布(bù)了几条引爆科(kē)技圈的短视(shì)频。这些视频引发关注并非(fēi)内容做得多优秀,反而(ér)都非常简单,比如一(yī)匹(pǐ)正(zhèng)在(zài)喝水的(de)马,一只(zhǐ)画(huà)画的玩具熊,或(huò)者一段骑摩托(tuō)车的第一(yī)视角录(lù)像,随便一个有手机的人都可以随(suí)手录下一段。
但这些(xiē)短视频(pín)的创(chuàng)作方式非常简单,创(chuàng)作者(zhě)仅仅需要向AI输(shū)入一段话,甚至(zhì)只是说(shuō)一下要求(qiú),AI就可以根据(jù)需要生成一段视频。
谷歌发布的两个(gè)AI生(shēng)成(chéng)视频分(fēn)别来自于Imagen Video和(hé)Phenaki,前(qián)者主(zhǔ)要突出(chū)的是高清,与(yǔ)Meta的Make-A-Video没有太多的(de)差别。
在(zài)Make-A-Video公布(bù)了(le)AI生成的视频后,AI圈(quān)就已经玩了一波梗(gěng),一(yī)个(gè)能(néng)够做出更(gèng)高(gāo)清视频的AI还不足以(yǐ)在短时间内戳中兴奋点。
Phenaki更加令人震(zhèn)惊(jīng)的地方(fāng)在于(yú),它可以制作出超过2分(fēn)钟的连贯的也有确切内(nèi)容的视(shì)频(pín),这才是(shì)真正(zhèng)让人们(men)感到惊喜的地方。因为无论AI生成的视频多么高清(qīng),也(yě退位减法是什么意思请解释一下,20以内退位减法是什么意思)只能是为内容(róng)生产者提供一个(gè)灵感(gǎn),一个素(sù)材,一个过(guò)场(chǎng)动(dòng)画。
不过能够(gòu)制(zhì)作(zuò)出(chū)有具体剧情内容的视频(pín)就意(yì)味(wèi)着,一些视频创作由AI代(dài)替人工完(wán)成已(yǐ)经初步有了可(kě)能。
当下AI的(de)发(fā)展速度(dù)已(yǐ)经超过大部分人的想象。内容产业的本质是供给创造需求,AIGC作为全(quán)新的内容生产方式(shì),可以为内(nèi)容(róng)产业带(dài)来更(gèng)新的内容风格、更快的(de)生产速度(dù),更低的(de)生产(chǎn)成本,这(zhè)无疑会(huì)驱动内容产业(yè)的(de)大(dà)爆发(fā)。
除(chú)了(le)AI绘图、视(shì)频,AIGC技术还能应(yīng)用于音乐(lè)、代码、机(jī)器人(rén)动作等多(duō)种内(nèi)容形式(shì)的生成(chéng)。不难发现该项(xiàng)技术不仅(jǐn)在游戏等行业(yè)能得到有效(xiào)应用,对于下一(yī)代(dài)互联网各种元素的构建亦有关(guān)键意义。
从(cóng)商业化的(de)角度来看,文(wén)化娱乐、教育、传媒等诸多领(lǐng)域,本身就对基于AI的可视(shì)化内容有强烈(liè)需求。
因此,AI绘画及视(shì)频或(huò)不是结果,而只(zhǐ)是AI进程中的一块重要拼图,有望在技(jì)术更新(xīn)的加持下(xià)实现更(gèng)大的应用价值。
AI从理解内容,走向了可以生成内容,甚至(zhì)能够创造出(chū)独立(lì)价值和独立视角(jiǎo)的内容。AIGC的再(zài)次出圈,更代表着(zhe)未来的先进生产(chǎn)力即将到来。
04
紧(jǐn)抓(zhuā)大模(mó)型(xíng)与算力,牢(láo)固AIGC底座
从技术(shù)的(de)发(fā)展(zhǎn)也可(kě)以(yǐ)看出,在语言大(dà)模型、图像大模型之后(hòu),多模态大模型(xíng)已经成(chéng)为了新的趋势(shì)。
大模型被誉为当前人工(gōng)智能发展的智能底(dǐ)座,是(shì)全球(qiú)竞争(zhēng)最激烈的研究(jiū)方向之(zhī)一,包括谷歌、亚马逊、百(bǎi)度、阿里、腾讯等众多(duō)头部企业都在竞相发力。
不过(guò)训练大模型的确(què)价格不菲,以国盛证券发布的《ChatGPT需要多少算(suàn)力》报告估算,GPT-3训练一次的成本约为140万美元。而对于一些更(gèng)大的LLM(大型语(yǔ)言模型),训练成本(běn)则介于200万美(měi)元(yuán)至1200万(wàn)美元高价之间(jiān)。
以ChatGPT在2023年1月的(de)独立(lì)访客平均数(shù)1300万计算(suàn),其对应芯片需求为(wèi)3万多片英伟达A100 GPU,初始投入成本约为8亿(yì)美元,每日仅电费就在5万(wàn)美元左右。
此外不论是ChatGPT还是AIGC,都离不(bù)开庞大算力支(zhī)持(chí)。在关注各类(lèi)大模型的(de)发(fā)展同时,更应该关注算力网络的(de)建设。
算(suàn)力(lì)网络正驱动AI产业发(fā)展进入史诗(shī)级(jí)加速进(jìn)程,让AIGC及通用AI这一人(rén)工智能发展的终极目标离得更近。
因为算力可(kě)以(yǐ)对突破性技术创新提(tí)供(gōng)大力的支持。这方面,多模态大模型(xíng)是典型(xíng)。作(zuò)为面(miàn)向未(wèi)来强人工智能、通(tōng)用(yòng)人(rén)工智(zhì)能的重(zhòng)要(yào)技术创新(xīn),多(duō)模态大模型(xíng)已经在人工智能领域(yù)提出了很多年,业界也(yě)有不少技术突破,但是,多模态大模型进一步往下走,算(suàn)力需(xū)求(qiú)呈(chéng)几何式上升,一般(bān)的算(suàn)力基础设施(shī)很快将难以胜任。
从(cóng)图像、文(wén)字、语音单(dān)独一项(xiàng)的训练,到(dào)双模态(tài)、三模(mó)态的跃迁,让人(rén)工智能可(kě)以灵活(huó)应对不同(tóng)模态的(de)转(zhuǎn)化、像人与世界交(jiāo)互一(y退位减法是什么意思请解释一下,20以内退位减法是什么意思ī)样自然(rán),这方(fāng)面,由(yóu)算力(lì)网(wǎng)络来驱(qū)动将(jiāng)有(yǒu)明显优势。
此外,还(hái)有很多(duō)需要爆发式增长的算力来(lái)支撑(chēng)的技(jì)术(shù)创(chuàng)新,将(jiāng)在人工智能(néng)算力网络(luò)支撑下快(kuài)速推进。
AIGC已经露出曙光,期(qī)待在大模型(xíng)和大算力的支持(chí)下AIGC能(néng)持续(xù)颠覆内容生产(chǎn)的方式,将创造的(de)边(biān)际成本降低,让万众受益。
未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 退位减法是什么意思请解释一下,20以内退位减法是什么意思
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了