当前位置：首页 > 科技

量子位：2023年中国AIGC产业全景报告

时间： 2023-11-10 03:08 浏览量：511

2023年被称作ChatGPT元年，ChatGPT现世至今，AIGC这把火彻底点燃了全世界。

ChatGPT自身在推出2个月后，月活用户突破1亿，成为史上用户增长速度最快的消费级应用程序，必应也在接入GPT能力后日活突破1亿；行业大牛们则亲自下场，纷纷离职创业，激战AIGC。

发展到如今，AIGC的规模到底有多大？水有多深？里面能容纳多少玩家？谁能笑到最后？近日，量子位在中国AIGC产业峰会上发布了《中国AIGC产业全景报告》。

市场有多大？

量子位智库预测，到2030年，AIGC市场规模将达到1.15万亿元规模。

AIGC全称为AI-Generated Content，指基于预训练大模型、生成式对抗网络（GAN）等人工智能技术，通过已有数据寻找规律，并通过释放泛化能力生成相关技术的内容。

报告指出，AIGC有狭义和广义概念之分。

狭义的AIGC与普通用户更为贴近，更关注图像、文本、音频、视频等内容生成，和Generative AI（生成式AI）、Synthetic media（合成式媒体）等概念类似。

论广义概念，还包含策略生成（如Game AI中游戏策略生成）、代码生成（GitHub Copilot）、蛋白质结构生成等。

基于此，结合行业关键场景和玩家分布情况，目前，我国还处于AIGC发展的初期阶段，竞争趋势不明显，需要调整开发、资金等投入，寻求整体生态的快速搭建。

至2030年，AIGC产业发展共分三个阶段：

1、培育摸索期（2023-2025）：整体均处于业务场景验证和变现探索期。

底层大模型发展加速，中间层尚未出现相关玩家，基于Stable Diffusion等开源模型的上层应用迅速出现，但受底层大模型接口限制，大部分技术尚未达到稳定进入实际生产环节的水平。

2、应用蓬勃期（2025-2027）：基本价值创作路径和技术思路得到确认。

行业普遍尝试应用人机共创，且内容资讯、娱乐传媒等领域利用AIGC产生确定性价值。这一时期，底层大模型和中间层模型主要玩家基本确定，开放API增加，整体入局玩家增多，尤其是大量应用层玩家。

3、整体加速期（2028-2030）：产业生态完善。

报告指出，2028年往后，AIGC在个性化、实时化、自主迭代等方向上的延展价值得到充分发挥，和其他业务系统进行紧密连接，会有相关初创公司产生完整解决方案。这一阶段AIGC成为内容领域基础设施，预计会催生出完全不同的新业态。

截至报告发布，国外AIGC赛道已有8家独角兽公司。

其中，推出了ChatGPT的OpenAI估值高达200亿美元，其次是Hugging Face 20亿美元。最新一家独角兽是成立16个月的Character.AI，估值10亿美元。此外，名单中还有Lightricks（18亿美元），Jasper（15亿美元），Glean和Stability AI（均为10亿美元），以及Anthropic（3亿美元）。

2022年以来，我国AIGC赛道出现了10余笔投资，其中融资体量最大的水上项目包括小冰公司（10亿元）、超参数科技、智谱AI、澜舟科技等。其余公司，包括数字力场、Tiamat、聆心智能、西湖心辰、深氧科技等，大多为数千万人民币级别融资。

然而，国内尚未看到与国外AIGC独角兽公司相匹配的收入产生。但经过对投资机构的广泛调研，多家机构已高度明确要将AIGC作为主投赛道，并推出了相应的孵化项目，预计本年度融资规模将有数倍增长。

伴随底层大模型生态的逐步开放，商业价值的落地验证，预计到2024年左右，融资规模将出现首次阶段性的指数级增加。

从融资现状来看，全球AIGC赛道持续走热，如何跑通商业模式产生实际营收，成为市场另一个关注焦点。

报告细分出5种不同的营收模式：

NO.1

MaaS（Model as Service）

适用于底层大模型和中间层进行变现，按照数据请求量和实际计算量计算。

到2027年，MaaS模式占市场规模比例将从5%增长至47%。

NO.2

按产出内容量收费

适用于应用层变现，如按图片张数、请求计算量、模型训练次数等收费。到2027年，该模式市场规模占比将从60%下降至32%。

该模式的关键在于如何从单次好奇驱动的行为切入，保证产品长期的复购率。

整个过程会受到具体属性影响，如版权授予（支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式，拥有设计图案的版权）、是否支持商业用途（个人用途、企业使用、品牌使用等）、透明框架和分辨率等。

NO.3

软件订阅付费

第三种模式即ChatGPT Plus现有的盈利方式之一：每月向用户收取20美元费用。该模式在现有市场占有10%左右的比例。按照这种模式，Jasper等初创企业已经产生了营收。展开来说，Jasper以类SaaS服务的形式进行收费，分为初级、高级和订制三个模式，成立当年营收额就达到4500万美元，并收获了7万名用户。

这意味着AI正以越来越显性的方式产生商业模式。国内部分领先的AIGC公司，在用户规模、内容生成量上在2022年亦快速起步，2023年开始产生营收及盈利并非难事，但能否形成SaaS订阅模式尚待观察。

NO.4

模型训练费用

即最为传统的项目开发制度，如今占据市场营收份额的25%，到2027年，预计将有12%左右的下滑。

NO.5

其他模式

包括广告/流量模式，依靠产品获取用户点击，从中获得广告流量，这种营收模式的关键在于产品如何获得复购。

由于属于小型项目，在市场规模测算中暂不单独考虑。

玩家有几类？

报告按照基础设施层、模型层和应用层将它们分为三大类。

NO.1

基础设施层

这层玩家分别为行业提供数据、算力、计算平台、模型开发训练平台以及其他配套设施。

首先，数据方面，数据的数量、在行业/领域和颗粒度上的丰富性、以及和业务之间的反馈关系都有着极高的要求。

对于预训练大模型而言，多模态的数据集至关重要，以此才能让模型学习到更加完备的表示。

该层面的玩家包括数据提供方和服务方，前者可提供通用数据、垂类数据、特定任务下的标注数据、审核数据以及创作者生态；后者则主要负责数据分拆及标注等。

其次，算力方面。据微软统计，光是GPT-3.5在Azure AI超算基础设施上消耗的总算力就需7-8个耗资30亿美元投资规模的数据中心来支持运行。

因此算力玩家也是其中无比之重的一环，可分类为：以智算中心为代表的算力集群商、国产芯片商以及云服务商等。（计算平台和模型开发训练平台略。）

最后，其他配套设施方面的玩家扮演的主要是检测审核、交易撮合方、第三方确权及计价方以及创作配合工具（如渲染引擎）等方面的角色。

NO.2

模型层

这层主要分为底层通用大模型和中间层模型玩家。前者相对最容易形成壁垒，影响因素包括人才、时间、数据和资金等多个方面。

按开放模式可以分为：

完全自有、不对外开放；开源，如2022年下半年起带来文生图领域蓬勃发展的CLIP及Stable Diffusion；API对外开放，这类模型的输出结果相对固定，但不同接口之间能够相互结合得到更优产出或是跨领域的产出；模型站，如Hugging Face、魔搭ModelScope。

中间层模型玩家则主打垂直化、行业化和细分化，分为：

中间集成商，主要组合多个接口，形成新的大模型；行业大模型商，由底层模型持有者进行端到端提供；以及二次开发商，主要增加行业特色数据和行业认知。

根据行业/场景的理解和资源累计程度、资金成本支撑、上层数据支撑、上层应用生态、战略生态合作/投资、工程效果与技术成本以及AIGC技术能力的成熟这7个指标，报告给出了目前模型层的代表玩家名单：

NO.3

应用层

如果按照基于底层逻辑的应用，这层玩家涉及的业务分别包括：

1、生产可直接消费内容

其核心是AI在创意度和规模化中提供平衡点。对UGC而言，能够降低内容创作门槛；对PGC来说，能够代替人工完成声音录制、图像渲染等基础性创作工作。

需要注意的是，该场景的价值主要是降本增效。

报告指出，鉴于我国的内容供给市场相对饱和，相关公司需要关注对具体场景的供需情况进行谨慎分析，确定AI对内容供给速度的提升是否具有实际意义。

2、结合底层系统，生产含有附加价值的内容

例如超个性化、实时化、行业特色化。

注意由于需要和底层系统进行配合，相关提供方需要关注上下游业务接口的打通，以及相关领域知识的深化设计。

以内容营销领域为例，AIGC并不应当作为单独的服务对外提供，还是隶属于“创意供给—内容生产—内容管理（素材库与数据库）—内容分发—数据方案”中的内容生产部分。

由于品牌主最终是以整体的广告营销效果为标准，要使AIGC最终能够得到理想效果，基础素材、营销策略设定、技术生成、评估优化、数据回流等缺一不可。

3、提供内容生产辅助工具

模式包括：

由AI提供相关创作线索或基础草图，专业人员进行细致化调整或是补充特定素材；

由AI完成特定操作性工作，比如局部特效生成、低分辨率转高分辨率等。

该类玩家需要注意四点：

（1）国内对工具类产品的付费意愿有限，尤其是C端；

（2）需要关注场景本身的工具属性，据业内人士反馈，由于AIGC目前的生成可控性相对有限，创作工具在使用中的可介入程度会严重受到专业因素的影响；

（3）需关注相关业务平台的潜在跨界竞争，这主要是因为该赛道通常与内容分发及创作平台形成强绑定，大厂在垄断性方面也更强；

（4）人才结构的转移。

4、用于提供打包内容或解决方案

接下来，如果按照基于模态的应用分类，我们可以看到分别主营以下业务的玩家：

1、文本生成，包括：

（1）直接生成应用型文本，已发展较成熟，以客服类的聊天问答、新闻撰写等为核心场景。有相关行业人士预测，到2030年，90%以上的新闻将由机器人完成；

（2）直接生成创作型文本，适用于剧情续写、营销文本等细分场景，目前在语义层次的长文本通顺上还有较大的提升空间；

（3）生成交互型文本，典型场景为智能客服/聊天机器人/虚拟伴侣/游戏中的NPC个性化交互等；

（4）文本辅助生成，是目前国内工具落地最为广泛的场景，主要包括定向采集信息素材、文本素材预处理、自动聚类去重，并根据创作者的需求提供相关素材等功能，代表公司如写作猫。

2、音频生成，包含已经相当成熟的TTS场景和音乐创作。

该业务可提高歌曲乐曲、有声书、配音等内容的创作效率，实现有声内容的规模化生产。可实现声音IP化附属价值的语音克隆也算其中的一个应用。

3、图像生成，这一领域潜力巨大。据绘画生成网站6pen，未来5年全球10%-30%的图像有望由AI生成或辅助生成。

具体场景则可分为图像属性编辑、局部生成及更改以及端到端的图像生成。

4、视频生成，包括视频自动剪辑、属性编辑、视频到视频的自动生成等。

5、跨模态生成，包括文字生成图像（也分功能性和创意性）、文字生成视频（有更高的长序列建模要求，比文生图发展得要滞后两年左右）、图像/视频到文本（跨模态搜索、视觉问答系统、配字幕、标题生成）等。

6、策略生成，主要指AI基于特定问题和场景自主提出解决方案的过程，在游戏、自动驾驶、机器人控制等领域有极高的应用价值。

报告认为，总的来看，目前整体层级尚不够完整。由于资金量的需求，预计全栈全场景端到端的玩家数量相对有限。

其中模型层成为当前关键卡口，在一定程度上限制了上下层级的发展，应用层则是创业友好度最高的部分。

不过，若能在不同层级间形成良好的生态合作关系，整个行业的快速成长和成本分摊都能获得明显好处。

关键词 : 美元AI 新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）