AIGC的“前世今生”——《人工智能生成内容(AIGC)白皮书》解读

AI行业快讯1年前 (2023)发布 senki
8,854 0 0
AIGC的“前世今生”——《人工智能生成内容(AIGC)白皮书》解读
最近,ChatGPT成为各行业讨论的热点话题,当然教育领域也不例外,教育管理者、教师、学生都对其保持了高度关注。本文通过梳理相关资料,试图让教育工作者能够站在更全面的视野下来看待ChatGPT为代表的各类现象,以引发大家更深层次的思考与更广泛的讨论。
正文:
习近平总书记曾指出,“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”。在当前数字世界和物理世界加速融合的大背景下,人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)正在悄然引导着一场深刻的变革,重塑甚至颠覆数字内容的生产方式和消费模式,将极大地丰富人们的数字生活,是未来全面迈向数字文明新时代不可或缺的支撑力量。本文通过对《人工智能生成内容(AIGC)白皮书》进行解读,从 AIGC的发展轨迹、AIGC的概念与内涵及AIGC未来应用场景三方面加深大家对AIGC的了解。
一、AIGC的发展轨迹
早期萌芽阶段(1950s-1990s)
1950年,著名的计算机科学家图灵图灵在《计算机械与智力》文中预言了创造出具有真正智能的机器的可能性,提出了“图灵测试”,在此后几十年时间中,围绕“图灵测试”进行了大量的社会科学与自然科学的研究,自此,人工智能开始走进社会各界的视野。1957年,在莱贾伦的计算机上诞生了历史上第一首完全由计算机“作曲”的音乐作品《IlliacSuite》。1964年至1966年间,美国麻省理工学院人工智能实验室的德裔电脑科学家JosephWeizenbaum等人开发了世界第一款可人机对话的机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组完成交互任务。80年代中期,IBM基于隐形马尔科夫链模型,创造了语音控制打字机“坦戈拉(Tangora)”,能够处理约20000个单词。80年代末至90年代中,由于高昂的系统成本无法带来可观的商业变现,各国政府纷纷减少了在人工智能领域的投入,AIGC没有取得重大突破。
沉淀积累阶段(1990s-2010s)
2006年,深度学习算法取得重大突破,同时期图形处理器、张量处理器等算力设备性能不断提升,互联网使数据规模快速膨胀并为各类人工智能算法提供了海量训练数据,使人工智能发展取得了显著的进步。AIGC从实验性向实用性逐渐转变。2007年,纽约大学人工智能研究员罗斯装配的人工智能系统通过对公路旅行中的一切所见所闻进行记录和感知,撰写出小说《1TheRoad》。作为世界第一部完全由人工智能创作的小说,其象征意义远大于实际意义,整体可读性不强,拼写错误、辞藻空洞、缺乏逻辑等缺点明显。2012年,微软公开展示了一个全自动同声传译系统,基于深层神经网络可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。这一时期,AIGC依然受限于算法瓶颈,无法较好地完成创作任务,应用仍然有限,效果有待提升。
快速发展阶段(2010s-至今)
自2014年起,随着以生成式对抗网络为代表的深度学习算法的提出和迭代更新,AIGC迎来了新时代,生成内容百花齐放,效果逐渐逼真直至人类难以分辨。2017年,微软人工智能少女“小冰”推出了世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》。2018年,英伟达发布的StyleGAN模型可以自动生成图片,目前已升级到第四代模型StyleGAN-XL,其生成的高分辨率图片人眼难以分辨真假。同年,人工智能生成的画作在佳士得拍卖行以43.25万美元成交,成为世界上首个出售的人工智能艺术品,引发各界关注。2019年,DeepMind发布了DVD-GAN模型用以生成连续视频,在草地、广场等明确场景下表现突出。2021年,OpenAI推出了DALL-E并于一年后推出了升级版本DALL-E-2,主要应用于文本与图像的交互生成内容,用户只需输入简短的描述性文字,DALL-E-2即可创作出相应极高质量的卡通、写实、抽象等风格的绘画作品。2022年底,ChatGPT发布,掀起了AIGC又一轮的高潮。

AIGC的“前世今生”——《人工智能生成内容(AIGC)白皮书》解读

图片来源:中国信息通信研究院
二、AIGC的概念与内涵
目前,对AIGC这一概念的界定,尚无统一规范的定义。《白皮书》认为,AIGC既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。从发展背景方面来看,AIGC的兴起源于深度学习技术的快速突破和日益增长的数字内容供给需求;一方面,技术进步驱动AIGC可用性不断增强;另一方面,海量需求牵引AIGC应用落地。从技术能力方面来看,AIGC根据面向对象、实现功能的不同可分为三个层次,包括智能数字内容孪生、智能数字内容编辑、智能数字内容创作。从应用价值方面来看,AIGC将有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。
三、AIGC未来应用场景
AIGC以其真实性、多样性、可控性、组合性的特征,有望帮助企业提高内容生产的效率,以及为其提供更加丰富多元、动态且可交互的内容,或将率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展。

AIGC的“前世今生”——《人工智能生成内容(AIGC)白皮书》解读

图片来源:中国信息通信研究院
 
AIGC+传媒:人机协同生产,推动媒体融合
AIGC作为当前新型的内容生产方式,为媒体的内容生产全面赋能。写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能合成主播等相关应用不断涌现,并渗透到采集、编辑、传播等各个环节,深刻地改变了媒体的内容生产模式,成为推动媒体融合发展的重要力量。
AIGC+电商:推进虚实交融,营造沉浸体验
随着数字技术的发展和应用、消费的升级和加快,购物体验沉浸化成为电商领域发展的方向。AIGC正加速商品3D模型、虚拟主播乃至虚拟货场的构建,通过和AR、VR等新技术的结合,实现视听等多感官交互的沉浸式购物体验。
AIGC+影视:拓展创作空间,提升作品质量
随着影视行业的快速发展,从前期创作、中期拍摄到后期制作的过程性问题也随之显露,存在高质量剧本相对缺乏、制作成本高昂以及部分作品质量有待提升等发展痛点,亟待进行结构升级。运用AIGC技术能激发影视剧本创作思路,扩展影视角色和场景创作空间,极大地提升影视产品的后期制作质量,帮助实现影视作品的文化价值与经济价值最大化。
AIGC+娱乐:扩展辐射边界,获得发展动能
在数字经济时代,娱乐不仅拉近了产品服务与消费者之间的距离,而且间接满足了现代人对归属感的渴望,重要性与日俱增。借助于AIGC技术,通过趣味性图像或音视频生成、打造虚拟偶像、开发C端用户数字化身等方式,娱乐行业可以迅速扩展自身的辐射边界,以更加容易被消费者所接纳的方式,获得新的发展动能。
AIGC+其他:推进数实融合,加快产业升级
除以上行业之外,教育、金融、医疗、工业等各行各业的AIGC应用也都在快速发展。教育领域,AIGC赋予教育材料新活力。相对于阅读和讲座等传统方式,AIGC为教育工作者提供了新的工具,使原本抽象、平面的课本具体化、立体化,以更加生动、更加令人信服的方式向学生传递知识。例如制作历史人物直接与学生对话的视频,给一场毫无吸引力的演讲注入新的活力;合成逼真的虚拟教师,让数字教学更具互动性和趣味性等。
(注:本文观点及材料来源于中国信息通信研究院和京东探索研究院发布的《人工智能生成内容(AIGC)白皮书》,如有转载,请列明来源)
作者:西北师范大学教育技术学院 信息化教育治理方向博士研究生;南方科技大学   陈毅

www.AIGC00.com

© 版权声明

相关文章