(网经社讯)AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。
第二,预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。虽然过去各类生成模型层出不穷,但是使用门槛高、训练成本高、内容生成简单和质量偏低,远远不能满足真实内容消费场景中的灵活多变、高精度、高质量等需求。而预训练模型能够适用于多任务、多场景、多功能需求,能够解决以上诸多痛点。预训练模型技术也显著提升了AIGC模型的通用化能力和工业化水平,同一个AIGC模型可以高质量地完成多种多样的内容输出任务,让AIGC模型成为自动化内容生产的“工厂”和“流水线”。正因如此,谷歌、微软、OpenAI等企业纷纷抢占先机,推动人工智能进入预训练模型时代。
第三,多模态技术推动了AIGC的内容多样性,进一步增强了AIGC模型的通用化能力。多模态技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成。比如CLIP模型,它能够将文字和图像进行关联,如将文字“狗”和狗的图像进行关联,并且关联的特征非常丰富。这为后续文生图、文生视频类的AIGC应用的爆发奠定了基础。
未来,算法的进步将带来更多激动人心的应用,语言模型会得到进一步发展,可以自我持续学习的多模态AI将日益成为主流,这些因素会进一步推动AIGC领域的蓬勃发展。
在产业生态方面,AIGC领域正在加速形成三层产业生态并持续创新发展,正走向模型即服务(MaaS)的未来。
目前,AIGC产业生态体系的雏形已现,呈现为上中下三层架构。
第二层是中间层,是在预训练模型基础上,通过专门的调试和训练,快速抽取形成垂直化、场景化、定制化的小模型和应用工具层,可以实现工业流水线式部署,同时兼具按需使用、高效经济的优势。比如,知名的二次元画风生成模型Novel-AI,以及各种风格的角色生成器等,就是基于StableDiffusion开源进行的二次开发。随着AIGC模型加速成为新的技术平台,模型即服务(Model-as-a-Service,MaaS)开始成为现实,预计将对商业领域产生巨大影响。
第三层是应用层,依托底层模型和中间层的垂直模型,各厂商进一步开放面向C端和B端用户的各种各样的AIGC产品和服务,满足海量用户的内容创建和消费需求。例如群聊机器人、文本生成软件、头像生成软件等AIGC消费工具。
和社会价值领域持续产生变革性影响
AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。
第一,AIGC有望成为新型的内容生产基础设施,塑造数字内容生产与交互新范式,持续推进数字文化产业创新。过去AI在内容消费领域的作用主要体现在推荐算法成为了新型的传播基础设施。推荐算法对数字内容传播,短视频为主的数字内容新业态发展,起到了颠覆式的变革作用。而现在,随着AIGC生成的内容种类越来越丰富,内容的质量不断提升,AIGC将作为新型的内容生产基础设施对既有的内容生成模式产生变革影响。
第三,AIGC还将作为生产力工具,不断推动聊天机器人、数字人、元宇宙等领域发展。AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AILAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。
第一,合成数据为AI模型训练开发提供强大助推器,推动实现AI2.0。过去用真实世界数据训练AI模型,存在数据采集和标注的成本高昂,数据质量较难保障、数据多样化不足、隐私保护挑战等多方面问题。而合成数据可以很好的解决这些问题。使用合成数据不仅能更高效地训练AI模型,而且可以让AI在合成数据构建的虚拟仿真世界中自我学习、进化,极大扩展AI的应用可能性。从某种意义上也可以说合成数据让AI模型训练从1.0阶段发展到2.0阶段。
第四,合成数据加速构建AI赋能、数实融合的大型虚拟世界。合成数据指向的终极应用形态是借助游戏引擎、3D图形、AIGC技术构建的数实融合的大型虚拟世界。基于合成数据构建的大型虚拟世界,为测试、开发新的人工智能应用,提供了一个安全、可靠、高效以及最重要的是——低成本的、可重复利用的环境,将成为AI数实融合的关键载体,包括为AI开发提供数据和场景、试验田等。比如腾讯开悟的AI开放研究环境,已经吸引了国内外众多决策智能领域的研究团队使用。
在社会价值领域,AIGC也在助力可持续社会价值的实现。比如,在医疗健康方面,AI语音生成帮助病人“开口说话”。语音合成软件制造商Lyrebird为渐冻症患者设计的语音合成系统实现“声音克隆”,帮助患者重新获得“自己的声音”。AI数字人也能帮助老年痴呆症患者与他们可能记得的年轻面孔或者逝去的亲人互动。此外,AIGC也可以用于文物修复,助力文物保护传承。腾讯公司利用360度沉浸式展示技术、智能音视频技术、人工智能等技术手段,对敦煌古壁画进行数字化分析与修复。在国外,DeepMind合作开发的深度神经网络模型Ithaca可以修复残缺的历史碑文。
总之,随着AIGC模型的通用化水平和工业化能力的持续提升,AIGC的根本影响在于,将极大降低内容生产和交互的门槛和成本,有望带来一场自动化内容生产与交互变革,引起社会的成本结构的重大改变,进而在各行各业引发巨震。未来,“AIGC+”将持续大放异彩,深度赋能各行各业高质量发展。
以可信AIGC
积极应对科技治理问题与挑战,拥抱人工智能的下一个时代
能够自动检测精准识别视频、图像中是否应用人脸伪造技术
其一,政府部门需要结合AIGC技术的发展应用情况,制定并明晰AIGC的知识产权与数据权益保护规则。目前,AIGC的知识产权与数据权益保护规则的不明确,在某种程度上导致甚至加剧了AI领域的乱象。
其三,打造安全可信的AIGC应用,需要深入推进AI伦理治理。例如,行业组织可以制定可信AIGC的伦理指南,更好地支持AIGC健康可持续发展;AIGC领域的创新主体需要考虑通过伦理委员会等方式,推进落实AI风险管理、伦理审查评估等,在AIGC应用中实现“伦理嵌入设计”(ethicsbydesign)。
其四,社会各界需要携手应对AIGC领域的能源消耗问题,推行绿色AI的发展理念,致力于打造绿色可持续、环境友好型的AI模型,实现智能化与低碳化融合发展。
未来已来,让我们拥抱AIGC,拥抱人工智能的下一个时代,打造更美好的未来。