技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。2022年AIGC快速地发展,这其中模型逐渐完备、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。
AIGC将有望成为数字内容创新发展的新引擎。1)AIGC能够以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求。2)AIGC可以通过支持数字内容与其他产业的多维互动、融合渗透从而孕育新业态新模式。3)助力“元宇宙”发展。通过AIGC加速复刻物理世界、进行无限内容创作,以此来实现自发有机生长。
1)AIGC+传媒:写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能合成主播
3)AIGC+影视:AI剧本创作、AI合成人脸和声音、AI创作角色和场景、AI自动生成影视预告片
4)AIGC+娱乐:AI换脸应用(如FaceAPP、ZAO)、AI作曲(如初音未来虚拟歌姬)、AI合成音视频动画
5)AIGC+教育:AI合成虚拟教师、AI根据课本制作历史人物形象、AI将2D课本转换为3D
6)AIGC+金融:通过AIGC实现金融资讯、产品介绍视频内容的自动化生产,通过AIGC塑造虚拟数字人客服
7)AIGC+医疗;AIGC为失声者合成语言音频、为残疾人合成肢体投影、为心理疾病患者合成医护陪伴
8)AIGC+工业:通过AIGC完成工程设计中重复的低层次任务,通过AIGC生成衍生设计,为工程师提供灵感
1)作为底层平台接入别的产品对外开放,按照数据请求量和实际计算量计算:GPT-3对外提供A,采用的四种模型分别采取了不同的按量收费方式
2)按产出内容量收费:包括DALL·E、Deep Dream Generator等AI图像生成平台大多按照图像张数收费
3)直接对外提供软件:例如个性化营销文本写作工具AX Semantics则以约1900人民币/月的价格对外出售,并以约4800欧元/月的价格提供支持定制的电子商务版本。大部分C端AGC工具则以约80人民币/月的价格对外出售
5)根据具体属性收费:例如版权授予(支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式,拥有设计图案的版权)、是否支持商业用途(个人用途、企业使用、品牌使用等)、透明框架和分辨率等
1)打造一体化解决方案服务能力:AIGC本质上提供的是内容的生成工具,和传统的内容辅助编辑逻辑是相同的。采集、生产、媒资管理、分发消费等视频整个生命周期,一般都需要覆盖内容生成的全生命周期。
2)与行业的深度绑定关系:通过和行业形成深度绑定关系,接入相关平台或底层系统的,与原来的内容载体建立良好的合作伙伴关系,除去说明场景可行性外,还需要强调对方在基础架构上的配合意愿。
3)构建业务闭环:创作型的工具如何得到反馈的手段,需要新的模式形成闭环。需要从“拼接式”(需要大量的人工标注数据,只能针对具体任务,不会自我成长)到“进化式”(创造特定条件和核心能力,使之能完成通用任务并自我成长),并与用户增加对话轮次、建立情感链接。
2021年之前,AIGC生成的主要是文字,而新一代模型能处理的格式内容有:文字、语音、代码、图像、视频、机器人动作等等。AIGC被认为是继专业生产内容(PGC,professional-generated content)、用户生产内容(UGC,User-generated content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分的发挥技术优势。
2022年:AIGC快速地发展,其中深度学习模型逐渐完备、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。
AIGC在引发全球关注的同时,知识产权、技术伦理将面临诸多挑战和风险。同时AIGC距离通用AI还有较大的差距。
1)知识产权争议。AIGC的快速的提升和商业化应用,除了对创作者造成冲击外,也对大量依靠版权为主要营收的公司能够带来冲击。
2)关键技术难点。AIGC距离通用AI还有很大的差距,当前热门的AIGC系统虽然能快速生成图像,但是这些系统未必能够真正理解绘画的含义,从而可以依据这些含义进行推理并决策。
3)创作伦理问题。部分开源的AIGC项目对生成的图像监管程度较低,数据集系统利用私人用户照片进行AI训练,侵权人像图片进行训练的现象屡禁不止。一些用户利用AIGC生成虚假名人照片等违禁图片,甚至会制作出暴力和性有关的画作。由于AI本身尚不具备价值判断能力,一些平台慢慢的开始进行伦理方面的限制和干预,但有关规定法律法规仍处于线、怎么样看待AIGC的未来趋势?
第三阶段则是原创阶段,AIGC将独立完成内容创作。Gartner预计,到2025年,生成式AI将占所有生成数据的10%。
1)核心技术升级持续不断的发展。AIGC的三大基础能力包括内容孪生、内容编辑、内容创作,将随着产业高质量发展而逐渐升级。
2)产品类型逐渐丰富。人工智能的持续不断的发展及推进,也将使AIGC模态不再仅仅局限于文本、音频、视觉三种基本形态。嗅觉、触觉、味觉、情感等多重信息感知和认知能力将以数字化的形式传输并指导人工智能进行内容创作,甚至创造出酸甜苦辣外的另一种味道。
3)场景应用趋于多元。目前,AIGC已经在多个领域得到普遍应用,如金融、传媒、文娱、电商等,未来应用场景会促进多元化。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展的新趋势之一。
4)生态建设日益完善。技术研发的不停地改进革新将强有力地推动内容创作,提高生成内容质量,使内容更接近人类智力水平和审美标准,同时应用于各类行业各种场景。AIGC的繁荣发展将促进资产服务快速跟进,通过对生成内容的合规评估、资产管理、产权保护、交易服务等构成AIGC的完整生态链,并进行价值重塑,充分释放其商业潜力。
随着标注数据累积、技术架构完善、内容行业对丰富度/事实性/个性化的要求慢慢的升高,AIGC行业即将被推向前台。
在未来2-3年间,AIGC的初创公司和商业落地案例将持续增加。目前由AI生成的数据占所有数据的1%不到,根据Gartner预测,到2025年,AI生成数据占比将达到10%。根据《Generative AI:A Creative New W
ld》的分析,AIGC有潜力产生数万亿美元的经济价值。9、AIGC的产业链分布如何?
我国的AIGC行业尚未发展成型,目前,AIGC代表公司较少,且上游还有众多欠缺。
国内的AIGC场景开发较少:在我国,由于技术发展不足以及投资环境的影响,AIGC大多被作为公司的部分业务、乃至相对边缘化的功能进行研发开发,独立运行的初创公司数量明显少于国外,大部分细分赛道的初创玩家在5家以下,这也间接导致了国内的AIGC场景开发较少。
AIGC应用场景深度不足:国内布局最多的赛道是写作和语音合成领域,虚拟人赛道起步兴起基本均停留在内容领域。而在国外延展领域得到了更为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布局领域。此类业务拓展的综合性要求比较高,需要客户方的数字化程度以及对对应行业的充分了解。
业务布局:公司在AIGC领域已经投入了近两年的时间,国内最早布局AIGC领域的公司之一。企业成立了MusicX Lab,致力于打造领先的人工智能音乐生成技术,目前已正式销售AI作曲,具备成熟专业的全链路音乐制作和全球音乐发行能力。22Q3 MusicXLab再推10首新作AI歌曲,
模型及AIGC能力一直在优化提升。目前新歌已在国内外各大平台上线在国内外各大平台再推新歌的基础上,也积极拓展了车企、教育、时尚、游戏、娱乐等各个行业的合作生态,达成了歌曲代销、车机音源、公播音乐、AI音乐辅学、品牌联名主题曲、有声书及视频配乐等落地业务。例如,MusicXLab与音乐公司达成歌曲代销合作,与头部车企达成AIGC战略合作,与游戏公司签约BGM长期合作,与教育学习管理机关达成AI音乐评价辅学合作等。先进科技的持续赋能和产品矩阵的不断丰富将为StarX发展注入强劲动力。
301270 汉仪股份公司以技术驱动设计,近年来针对字库产品设计、生产、传输、储存到识别的全业务链条进行持续不断的研发投入,实现了全面的技术储备以保证公司业务持续高效的发展。同时,公司紧随信息技术、人工智能的发展步伐,及时将先进的信息技术应用于字库行业,形成了以大数据、人工智能为基础的技术储备。
公司已推出AI绘画功能和AI文字辅助创作功能,其中AI文字辅助创作功能已上线K文学平台全部作者开放。公司深度结合作者的真实写作场景,作者在使用AIGC功能时,通过针对不一样的描写场景填写关键词和辅助短语,即可生成对应的文字内容描写,提高写作效率。目前可针对人物、物品等进行AI辅助创作,并针对不一样的作品类别如古风、都市等进行语言调整,带来最佳的内容产出体验,大幅度的提高创作效率和内容的可读性。
公司在AI方面持续投入,已发售数轮AI数字收藏品,并使用AIGC方式创作图片内容,目前平台仍在大力投入AI布局。
公司已布局虚拟数字人、虚拟场景、虚拟直播等创新业务领域;近日在2022全球元宇宙大会
上宣布布局AIGC赛道,公司旗下首款AI绘画软件“万兴AI绘画”正式开启公测。
300229 拓尔思公司已落地了一批服务型虚拟人项目,其中与广东省共建“南方乡村振兴新农人AI数智赋能平台”,定位于农产品直播内容
创作的AIGC在线服务平台,主要面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。
2022年世界杯举办期间,公司将利用自研互联网大数据资讯平台,对世界杯相关的热点和话题进行大数据分析和研判,通过AIGC的内容自动创作和虚拟数字人进行联合,开展“大数据看世界杯”的虚拟数字人系列服务。
002657中科金财今年服贸会期间,公司发布了中科金财“元宇宙技术服务矩阵”,其中,公司基于WEB3.0规则架构,研发了数字人内容制作引擎、元宇宙场景开发工具,并通过AIGC的企业级内容互动创作平台,实现与中科金财元宇宙数字化营业销售平台“觅际”融合,公司作为邮储银行北京分行在服贸会上的合作伙伴,通过上述技术服务,首次实现了“沉浸式购物+数字人民币”场景落地。
在9月23日举办的2022万象·百度移动生态大会上,百度发布了AI助理,覆盖了各种AIGC应用,包括AI自动生成文字、图片以及图片转换成视频。借助AIGC的力量,百度希望为现有的500多万百家号创作者带来一套AI生产内容工具,帮他们更快更好地产出视频内容,从而增加百度百家号等产品的用户粘性,以反击头部短视频平台。目前百度已经和数十家权威媒体成立“AIGC媒体联盟”。
,积极探索AI人工智能技术在AIGC、智能驾驶等领域的应用。0700 腾讯腾讯AI Lab基于自己的多模态学习及生成能力在游戏领域进行了全流程的布局。「绝悟」AI通过强化学习的方法来模
实玩家,包括发育、运营、协作等指标类别,以及每分钟手速、技能释放频率、命中率、击杀数等具体参数,让AI更接近正式服玩家真实表现,将测试的总体准确性提升到95%。目前腾讯绝悟在环境观测、图像信息处理、探索效率等方面的创新算法已经突破了可用英雄限制(英雄池数量从40增为100 ),让 AI 完全掌握 所有英雄的所有技能并达到职业电竞水平,能应对高达10的15次方的英雄组合数变化。目前,腾讯AI Lab还与腾讯 AI Lab 还与王者荣耀联合推出了AI开放研究平台「开悟」,并积极举办相关赛事。
MFST 微软微软亚洲研究院支持图像变为动态、文本生成视频、文本生成图像、图像补全、图像生成的NUWA-Infinity
成立时间及融资轮次:2020年 A轮(估值已达10亿美元独角兽,高瓴领投)
AIGC相关亮点:作为“AI being”派虚拟人。小冰的产品虚拟人、音频生成、视觉创造、文本创造、虚拟社交、Game AI等。
客户范围:客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以“人力”的逻辑去进行商业报价的虚拟人商业模式。
成立时间及融资轮次:2018年 A轮(TME领投,单轮融资数千万人民币)
AIGC相关亮点:产品有针对视频生成配乐的配乐猫、支持非音乐专业技术人员创作的口袋音乐、可AI生成歌词的 LYRICA、AI作曲软件LAZYCOMPOSER。目前已与国内多家音乐平台
倒映有声成立时间及融资轮次:2019年 Pre-A轮(中文在线投资,单轮融资千万人民币级)
AIGC相关亮点:倒映有声通过神经渲染技术快速构建AI数字分身,通过语音+图像生成技术,生成和驱动数字分身的唇形、表情、动作、肢体姿态,创造表情自然、动作流畅、语音充满情感的高拟线月倒映有声和中央广播电视总台音频客户端「云听」签署战略合作协议。
成立时间及融资轮次:2018年 A3轮(元宇宙资本和Springwind Ventures领投,单轮融资额超千万美元)
AIGC相关亮点:通过简单设计并调整不同的参数,rct AI的混沌球(Chaos Box)算法可以在游戏中大规模地轻松生成具有智能意识的虚拟角色。他们的行为和对话不会重复,皆为动态生成。目前,rct AI已凭借核心技术Chaos Box帮助了10余家企业,完成包括对战游戏、虚拟人铸造等多种类型的项目,与全球范围内 20+ 游戏厂商建立了深入合作,触达超过 2 亿用户。
成立时间及融资轮次:2019年 B轮(红杉中国领投,估值已达10亿独角兽,单轮融资1亿美元)
AIGC相关亮点:超参数科技提供的AI bot支持玩家陪玩、多人团队竞技(球球大作战)、非完
息博弈AI(斗地主、德扑、麻将等)等。目前,超参数AI Bot已在多款千万日活的产品中上线,每日在线数峰值将近百万,业内率先实现在3D FPS领域的大规模商业化落地。
影谱科技成立时间及融资轮次:2018年 D轮(单轮融资13.6亿元,商汤科技领投)
AIGC相关亮点:在视频生成相关领域支持结构化视觉分析、影像自动合成技术、智能视频编辑、视频内容生产等。
围绕电商场景,通过AIGC生成网站搭建过程中所需的各类素材,具体业务包括针对性生成公司介绍、企业价值、Slogan、自动提升图片清晰度、自动生成logo等。
基于多模态对话生成系统,该公司专注于针对精神心理的AI驱动的高质量数字疗法,让AI围绕认知、情绪和行为三个维度对用户做评估和干预,生成千人千面的情绪治疗方案,目前已与北医六院、湘雅二院、中日友好医院、清华大学玉泉医院等达成合作。
将其底层模型对外开放商用,开创基础设施型的商业模式。GPT-3目前慢慢的开始对外提供API,并分为四种模型按照用量对外收费。
输入文本链接,软件能自动对其中的标题和文字进行区分表示,并根据不同层级自动匹配素材和文字的转场、格式等,进而形成说明式的视频。该方式能够增加10倍的视频产量。类似公司包括:Gliacloud、Synths.video、lumen5、Pencil。
Rosebud.ai能够生成非真实的人脸图像,并在该图像中匹配相关衣物等所需素材。此外,模型面孔能够准确的通过对应受众的有关数据进行调整。该公司声称,其生成模型能够使活动点击率提升22%。Pe
为每位客户确定交流的个性化措辞。该平台已被多家公司用于促销电子邮件、社会化媒体广告、 店内展示横幅甚至广播内容等,以提高品牌参与度和转化率。