本书详细解读了当前AI应用领域最具热度、前景无限的AIGC内容自动生成技术,详细介绍了AIGC的基本概念、价值、产生与发展的脉络,以及实现AIGC所需的条件,重点解析了AIGC的核心技术(NLP、深度学习、大模型、硬件资源、大数据、训练方法)。
五个维度讲述
什么是AIGC / AIGC将会如何赋能创意产业
AIGC生态圈又是什么 / 如何看待AIGC带来的变革
AIGC的现象级应用ChatGPT、Midjourney、voice.ai能做什么
2022年被称为“AIGC元年”。AIGC(AI Generated Content)即人工智能生成内容,是指通过机器学习、自然语言处理等技术来理解和生成文本、图像、视频、音频等内容的新型内容生产方式。AIGC的技术发展速度惊人,迭代速度更是呈现指数级发展,这其中深度学习模型的不断完善、开源模式的推动、大模型商业化的探索,都在助力AIGC的快速发展。超级聊天机器人——ChatGPT的出现,拉开了智能创作时代的序幕。
随着AIGC技术的不断发展和应用,更多普惠的AI生产力平台将以更低的门槛造福于有创造力和想象力的人群,人们可以更好地利用AIGC技术来提高工作效率、拓展信息获取和娱乐方式、改善众多行业领域的服务质量、提高工作效率。
本书从AIGC的概念和核心技术出发,系统介绍了AIGC的基本概念、价值、产生与发展的脉络,以及实现AIGC所需的条件,重点解析了AIGC的核心技术——大模型、硬件资源及大数据和训练方法。在AIGC的应用层面,重点介绍了ChatGPT这一现象级的AIGC应用,Midjourney——解放设计师的AI自动绘画应用,以及voice.ai——提供1000种AI语音应用的使用场景以及无可限量的未来展望。AIGC 产业这部分内容,介绍了AIGC为游戏、影视、广告、元宇宙以及其他产业赋能的意义和面临的挑战,以诸多鲜活的案例展示AIGC与这些产业的结合带来的无限想象力。当然,AIGC这样的“新物种”也面临着机遇和挑战,本书在最后两章中重点介绍了AIGC的生态圈以及在生产和生活等诸多方面“AIGC会带给我们什么”的“冷思考”。本书集理论与实际相结合,特别突出了实践和案例特色,能够很好地满足对AI技术感兴趣的广大读者、AI技术爱好者、开发者、AIGC赛道的投资者的需求。
//一本书读懂AIGC:探索AI商业化新时代全书共八章。第一章介绍了AIGC概念、价值、产生与发展的脉络以及实现AIGC所需的条件,第二章介绍了AIGC的核心技术,第三章介绍了AIGC现象级的应用——ChatGPT,第四章介绍了AIGC想象级应用——Midjourney,第五章介绍了AIGC另一个超级应用——能提供1000种AI语音的voice.ai。第六章介绍了AIGC 诸多产业,全面赋能创意产业,第七章介绍了AIGC上中下游生态圈,第八章思考AIGC会带给我们什么。
在人工智能发展的漫长历程中,如何让机器学会创作,一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。从机器学习到智能创造,从PGC、UGC到AIGC,我们即将见证一场深刻的生产力变革,而这种变革也会影响我们工作与生活的方方面面。
与此同时,我们也需要正视AIGC技术发展所带来的一些风险和挑战,探索如何更好地利用AIGC技术服务社会、造福人类,推动AIGC技术的健康和可持续发展。
本书撰写分工如下:薛达负责撰写第一、二、三、四、五章,伏达负责撰写第六章,应泽峰负责撰写第七章,韦艳宜负责撰写第八章。在本书写作过程中,黄甜、永石等亦对本书的内容做了贡献。特别感谢机械工业出版社的王斌等为本书能够顺利出版而辛勤工作的编辑们,同时,也向所有帮助过我们的人致以最诚挚的谢意。
薛达
2023.10
薛达
美国杜克大学计算机专业毕业,研究方向:计算机视觉、通用人工智能、数据科学,曾任职微软亚太研究院STCA部门,参与研发的虚拟人肌肉绑定算法及材质仿真相关算法成功应用于迪士尼、漫威、环球影业旗下多部电影(如《冰雪奇缘》)。带领算法团队自2013年起将深度学习技术应用于图像增强、图像检测领域,带领团队与中国移动研究院合作打造数字长城、长城元宇宙平台。
韦艳宜
芝士青年院ZSCBO创始人。在区块链、元宇宙行业的品牌战略领域资历深厚,GBLS(全球无眠区块链领袖峰会)的投资人和核心主创成员,曾任DAPP及GAME-FI准独角兽——X-LAND METAVERSE的品牌顾问。
前言
第一章什么是AIGC/
1.1AIGC的概念——人工智能生成内容/
1.2AIGC的价值——解放生产力/
1.2.1互联网内容生成方式的变革/
1.2.2提供更好的人机互动方式/
1.2.3为个人提供更好的学习资源/
1.2.4大幅降低成本、提升效率/
1.3AIGC的产生与发展/
1.3.1AIGC的前身:PGC和UGC/
1.3.2AIGC概念的提出/
1.3.3AIGC的兴起/
1.4实现AIGC所需要的三个条件/
1.4.1海量的数据与模型:AI学习的基础/
1.4.2强大的算力:AI学习的引擎/
1.4.3成熟高效的算法:AI学习的逻辑/
第二章AIGC的核心技术/
目录//2.1NLP:AIGC的理论基础/
2.2深度学习:用于生成高质量内容/
2.3大模型:AIGC的核心/
2.3.1GAN:生成对抗网络/
2.3.2Diffusion Model:扩散模型/
2.3.3GPT-4:最新的大语言模型/
2.3.4CLIP:跨模态预训练模型/
2.4硬件资源:AIGC的硬件基础/
2.4.1GPU/
2.4.2内存/
2.4.3存储空间/
2.5大数据:AIGC的原材料/
2.5.1数据采集与处理/
2.5.2数据存储技术/
2.5.3数据处理技术/
2.5.4数据分析技术/
2.6训练方法:AIGC的实现路径/
2.6.1监督训练/
2.6.2半监督训练/
2.6.3无监督训练/
第三章ChatGPT——AIGC的现象级应用/
3.1ChatGPT:跨时代的聊天机器人/
3.1.1ChatGPT的背景/
//一本书读懂AIGC:探索AI商业化新时代3.1.2ChatGPT的核心技术/
3.1.3ChatGPT的发展历程/
3.1.4ChatGPT的主流应用/
3.2ChatGPT带来的变革/
3.2.1对AI与人互动方式带来的改变/
3.2.2对搜索引擎的冲击/
3.2.3对教育领域的冲击/
3.3ChatGPT的商业价值/
3.3.1提升企业数字化经营能力/
3.3.2创造新的商业版图/
3.4如何使用ChatGPT/
3.4.1ChatGPT的界面及交互方式/
3.4.2使用案例:基础问答/
3.4.3使用案例:数据整理/
3.4.4使用案例:程序编写与修改/
3.4.5使用案例:文章写作/
第四章Midjourney——解放设计师的AI自动绘画应用/
4.1Midjourney:AIGC想象级应用/
4.1.1Midjourney的核心技术/
4.1.2Midjourney的用途/
4.1.3Midjourney的特点/
4.2Midjourney的用户/
4.2.1创意设计从业者/
4.2.2工业设计行业从业者/
4.2.3NFT从业者/
4.2.4个人爱好者/
4.3使用Midjourney实现创意/
4.3.1Midjourney的使用/
4.3.2自动生成绘画作品/
4.3.3模仿不同艺术家的风格和技巧/
4.3.4Midjourney的指令和使用技巧/
4.4Midjourney未来展望/
4.4.1人工智能绘画的前景/
4.4.2Midjourney的发展计划/
第五章voice.ai ——提供海量的AI语音/
5.1voice.ai:生成任何你想要的声音/
5.1.1voice.ai的用途/
5.1.2voice.ai的核心技术/
5.1.3voice.ai的特点/
5.2voice.ai的使用场景/
5.2.1游戏领域/
5.2.2影视领域/
5.2.3音乐领域/
5.2.4其他领域/
5.3使用voice.ai实现智能音频/
5.3.1获取账户及软件/
5.3.2使用voice.ai实现AI音频克隆/
第六章AIGC :全面赋能创意产业/
6.1AIGC 游戏/
6.1.1游戏行业简述/
6.1.2游戏行业面临的挑战:艺术创意成本高/
6.1.3AIGC赋能游戏行业:降低设计与技术成本/
6.2AIGC 影视/
6.2.1影视行业简述/
6.2.2影视动漫行业面临的挑战:创意与美术的代价高/
6.2.3AIGC赋能影视动漫行业:提供创意、降低美术
成本/
6.3AIGC 广告/
6.3.1广告行业简述/
6.3.2广告行业面临的挑战:广告创意难,实现成本高/
6.3.3AIGC赋能广告行业:提供无限创意与素材/
6.4AIGC 元宇宙/
6.4.1元宇宙行业简述/
6.4.2元宇宙行业面临的伦理和道德挑战:虚拟
行为和虚拟身份/
6.4.3AIGC赋能元宇宙/
6.4.4AIGC典型应用:制作虚拟人/
6.5AIGC 其他/
6.5.1AIGC 医药研发/
6.5.2AIGC 气象科学/
6.5.3AIGC 矿业开发/
第七章AIGC生态圈——机遇产生之地/
7.1上游大厂:AIGC基础设施的建设/
7.1.1大模型提供商/
7.1.2算力提供商/
7.1.3数据供给方/
7.1.4开源算法提供商/
7.1.5硬件设备厂商/
7.2中游“独角兽”:垂直化/场景化的平台建设/
7.2.1大模型的行业场景化针对性训练/
7.2.2底层算法的垂直化二创及封装/
7.2.3针对AIGC生产的海量数据的使用/
7.2.4典型代表:Photoshop的AI插件Alpaca/
7.3下游内容服务商:内容建设与分发/
7.3.1由UGC转变为AIGC为应用层平台供给内容源/
7.3.2由AIGC创造全新的互联网、元宇宙应用层平台/
7.3.3典型代表:视频类平台(Netflix)/
第八章冷思考——AIGC会带给我们什么/
8.1AIGC会给人们的生产生活带来怎样的变化/
8.1.1社会生产新变化——为内容创作领域带来创新/
8.1.2对人们生活带来的变化——内容消费变革和职业发展
新方向/
8.2AIGC发展面临哪些问题/
8.2.1AI技术存在的固有缺陷/
8.2.2生成作品在语义理解上的不完善/
8.2.3实现AIGC应用的的成本高昂/
8.2.4法律及市场监管尚不完善/
8.3发展大势不可逆的AIGC/
8.3.1AIGC的发展趋势/
8.3.2我们应该如何应对AIGC带来的变化/
参考文献/