AIGC专题四:国内外大模型和AI应用梳理
0AIGC专题四:国内外大模型和AI应用梳理2023年5月19日证券研究报告|行业专题证券分析师姓名:马笑资格编号:S0120522100002邮箱:maxiao@tebon.com.cn研究助理姓名:王梅卿邮箱:wangmq@tebon.com.cn1请务必阅读正文之后的信息披露及法律声明。投资要点:关注大模型迭代带来的应用端投资机会 谷歌I/O上发布一系列生成式AI新进展,科技大厂竞争激烈。5月10日,谷歌I/O开发者大会上发布了包括:新一代语言模型PaLM 2、升级AI聊天机器人Bard、生成式AI实验版搜索引擎、Duet AI for Workspace等。 AI艺人迅速出圈,多模态应用充分释放AI潜力,进一步推动商业化落地。1)AI歌手:截至5月14日, “AI孙燕姿”翻唱的《发如雪》已有超过150万点击量。2)AI网红Caryn Marjorie通过出售AI版本的Caryn,在过去一周的beta阶段创收7.16万美元,99%的用户是男性。 从应用端看,昆仑万维,汤姆猫,中文在线,万兴科技,美图公司等同时兼具跨模态属性和海外业务的公司有望率先实现应用场景落地。昆仑万维:2023年02月公司宣布将与奇点智源合作,在今年内发布中国版类ChatGPT代码开源。旗下Opera浏览器计划接入ChatGPT,截至2022H1,Opera 全球平均MAU达 3.3 亿,美洲市场Q2活跃用户规模同比增长 22%;2022年,Opera GX 的MAU已超过2000万。汤姆猫:汤姆猫家族IP的交互属性与ChatGPT有着较高的契合度。公司团队已尝试应用 ChatGPT 模型进行 AI 交互产品开发的初步测试,测试的模型目前通过 ChatGPT 海外接口接入。中文在线:海量优质数据资产为核心优势;与澜舟科技合力探索AIGC在内容生产方面的技术应用;AI技术已在内容创作、游戏元宇宙等领域落地。海外产品Chapters 和My Escape 已在做接入ChatGPT 测试,应用在故事创作生成、剧本生成及改编、用户与AI 交互聊天等方面。万兴科技:视频创意软件Wondershare Filmora接入OpenAI, Wondershare Filmora12新增功能包括AI抠图、AI音频拉伸和AI音频降噪。软件拥有超过1亿用户,覆盖超过150个国家及地区。3月31日正式面向出海营销领域全球首发AIGC“真人”短视频出海营销神器“万兴播爆”(英文名:Wondershare Virbo),并宣布开启移动端公测。美图公司:AI绘画功能在旗下部分产品中上线,推动产品全球业绩增长。商业化探索包括,1)“AI绘画”免费生成3张绘画,支付2元可解锁五张新效果;2)“百变AI头像”,6.6元50张(5种风格×10张);9.9元100张(10种风格×10张) ,12.9元200张(20种风格×10张) 。 随着技术的更新迭代,以及在应用端的持续探索,有望进一步创造新的消费和需求,有利于文娱内容和互联网行业。重点关注:万兴科技、昆仑万维、汤姆猫、中文在线、思美传媒、美图公司、百度集团-SW、商汤-W、腾讯控股、阅文集团;皖新传媒、南方传媒、焦点科技、风语筑、利欧股份、神州泰岳、联络互动、捷成股份、掌阅科技、立方数科、元隆雅图等。 风险提示:技术发展不及预期、监管政策变化、知识产权等相关问题。2请务必阅读正文之后的信息披露及法律声明。01 海外大模型发展02 国内大模型布局03 AI探索领先者04 投资建议&风险提示目录CONTENTS301海外大模型发展4请务必阅读正文之后的信息披露及法律声明。1.1 微软:投资OpenAI;将AI融入旗下应用模型Swin Transformer v2.0NLP模型CV模型多模态模型Megatron-Turing NLGBEiT-3Transformer-Based参数量530B完成预测阅读理解常识推理自然语言推理词义消歧Transformer-Based参数量3BKosmos-1MLLM参数量1.6B自研OpenAIGPT-4Image GPTCLIPDALL·E2应用办公软件Microsoft 365 Copilot浏览器Bing安全软件Microsoft Security Copilot虚拟人小冰营销Microsoft Viva SalesAI编程GitHub Copilot医疗临床笔记DAX Express数据处理Power BIAzure AIAI应用服务API服务基础设施机器学习资料来源: Microsoft AI, Microsoft Azure, Microsoft Research,OpenAI官网等,德邦研究所5请务必阅读正文之后的信息披露及法律声明。1.2 谷歌:大模型基础Transformer的研发者深度学习框架TensorFlow通用AI架构Pathways模型PaLMViTPaLM-E底座NLP模型CV模型多模态模型对话模型 LaMDA应用照片参数量137B训练数据1.56T参数量最高22B将Transformer创新性地用于CV领域,训练方法类似BERTViViT一个模型做多件事多模态稀疏且高效PaLM-540B+ViT-22B=PaLM-E 562B横跨语言、视觉和机器人领域Self-Attention机制对输入进行注意力权重的分配,即決定需要关注输入的哪部分,并对其分配有限的信息处理资源给重要的部分。编码器-解码器编码组件部分由一堆编码器构成;解码组件部分也是由相同数量(与编码器对应)的解码器组成的。TransformerYouTube助手Gmail广告搜索地图Pixel云Bard基于LaMDA的对话机器人模型准备数据构建机器学习模型部署模型实现MLOps2017-06Transformer问世2022-04提出PaLM2022-01LaMDA模型推出2023-03提出多模态模型PaLM-E2020-10将Transformer运用到CV领域(ViT)2015-11开源了第二代机器学习平台TensorFlow2023-02对话机器人Bard发布2018-10Transformer的衍生模型BERT发布资料来源:TensorFlow, GitHub,Romal Thoppilan et al.《LaMDA: Language Models for Dialog Applications》 等模型相关论文,机器之心公众号等,德邦研究所6请务必阅读正文之后的信息披露及法律声明。1.3 Meta:大模型有望助力公司元宇宙发展模型底座深度学习框架PytorchNLP模型——LLaMaCV模型——SEER多模态模型——data2vec基础大模型应用模型以较小参数量获得与GPT-3等模型相匹敌的效果LLaMa参数量最大65B用更大量优质训练数据获得更小模型参数训练数据约1.4T Tokens自监督学习模型参数量最高10B充分考虑上下文的自监督学习可以在文本、语音或图像上单独训练Make-A-VideoVisual Acoustic Matching资料来源:PyTorch, Make-a-Video Studio,Hugo Touvron et al.《LL
[德邦证券]:AIGC专题四:国内外大模型和AI应用梳理,点击即可下载。报告格式为PDF,大小4.05M,页数40页,欢迎下载。
