GPT4及ChatGPT相关应用梳理.pptx
- 文档编号:18699368
- 上传时间:2023-09-27
- 格式:PPTX
- 页数:31
- 大小:3.45MB
GPT4及ChatGPT相关应用梳理.pptx
《GPT4及ChatGPT相关应用梳理.pptx》由会员分享,可在线阅读,更多相关《GPT4及ChatGPT相关应用梳理.pptx(31页珍藏版)》请在冰点文库上搜索。
GPT4及ChatGPT相关应用梳理,核心观点,核心观点:
3月15日OpenAI发布多模态大模型GPT-4,其不仅在语言处理能力上提高,还具备对图像的理解和分析能力。
GPT-4商业化进程加快,开放API的同时还发布了在6个不同商业场景的应用落地。
随后微软发布了震撼的微软365Copilot,极大提升office的生产力和交互方式。
此前,ChatGPT就已经展示了强大的能力,在文字创造、人机交互、教育、影音、零售等多场景落地应用。
我们认为,多模态大模型已在多领域具有专家能力,未来将深度赋能千行百业,改变生产生活方式。
1.2023年3月15日,OpenAI目前最强大的多模态预训练大模型GPT-4正式发布。
其能够处理文本、图像两种模态的输入信息,单次处理文本量是ChatGPT的8倍,GPT-4的表现大大优于目前最好的语言模型,同时在学术考试中的水平远超GPT3.5。
这意味着GPT-4不仅在学术层面上实现了模型优化与突破,同时也展现出了成为部分领域专家的能力。
GPT-4商业化进程加快。
GPT-4在发布时便开放了其纯文本输入的API,这与GPT-3和GPT-3.5的滞后开放不同。
同时,GPT-4这次一起推出了6个商业场景的具体应用落地,在优化人机交互体验、提供专业服务、提升组织效能、文化传承与保护等方面都展现了巨大的潜能,未来有望看到更多场景中的商业化拓展与落地。
ChatGPT已经刮起GPT生态狂潮。
2023年3月1号,OpenAI基于GPT3.5Turbo模型开放了ChatGPTAPI。
API收费模式为0.002美元/1000tokens。
相较于前一代开放接口GPT3.5,性能更强的同时,价格下降90%,加速ChatGPT相关应用生态的发展。
应用百花齐放,创造新的生产方式。
微软先后在搜索引擎Bing、企业服务平台Dynamic365及开发者工具平台PowerPlatform等接入ChatGPT/GPT-4能力。
微软还发布了震撼的Microsoft365Copilot,极大提升office的生产力和交互方式。
与此同时,在越来越多的企业宣布接入ChatGPT的能力,其中不乏一些已经取得优秀商业化的应用。
如Jasper、Quizlet、Shop等,在语言文字创造、人机交互、教育、绘画、影音、零售等多场景落地应用。
我们认为以GPT4/ChatGPT为代表的预训练大模型是这一轮AI浪潮的重要革新,重点推荐关注海内外优秀应用落地情况,AI芯片产业链等投资机遇。
目录,一、ChatGPT:
从全民关注的爆款应用走向商业化开放,在多个场景中展现价值二、GPT4:
更强大的多模态大模型,带来更广泛的商业应用可能,1.1AIGC商业化演进:
重点产品时间线,随着技术的快速进步,AI生成内容(AIGC)极大地解放了生产力,其广阔的应用场景及市场价值推动着其商业化的快速发展。
垂直领域快速落地,爆款产品不断推出。
随着技术不断演进,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商业化在多个领域开始落地。
其中代码生成、文本生成、图像生成、音视频/游戏等领域已有不少爆款级产品。
1)代码领域,基于OpenAI的Codex模型,Github推出的Copilot具备代码的生成、补全、建议等功能,用户量突破百万级别。
2)文本领域,ChatGPT目前已开放API接口,微软已经在Bing和Dynamic365等应用接入。
3月份发布的多模态预训练大模型GPT-4已开放纯文本API,在图片理解、推理和学术考试中展现了强大能力,未来将适用于更广泛的应用场景。
3)图像领域,Stablediffusion等文生图应用已突破千万级用户量,目前是商业模式最成熟的领域,国内也在积极布局。
4)音视频/游戏领域,起步较晚,对模型复杂度和算力要求更高,百度的文心一言大模型已经具备对视频生成的能力。
图:
AIGC重点产品时间线,DALL-E2,StableDiffusion,DALL-E,Make-a-vedio,ImagenVideoPhenaki,GPT-3Jasper.AI,ChatGPT,Codex,代码,文本,图像,音视频/3D/游戏,2020,2021,2022,8月,10月,9月,11月,Midjourney,7月,4月6月,三大AI绘图应用,支持模型,底层技术,2月2023,Bard,3月,aiXcoderCopilotCodeWhisperer,Copy.aiMeena,层,技,术,微软小冰底,StableDiffusion2,TabNine,科大讯飞SMART-TTSMagic3D,2019及更早OpenAI,Google,国产,其他,盗梦师,6pen,处于测试阶段,百度文心一言GPT-4Palm,2022年发布2023.3开放api,1.2ChatGPT开放接口,OpenAI商业化进一步推进,0.002美元/1000tokens,较前一代价格下降90%。
OpenAI开放ChatGPTAPI和WhisperAPI(应用程序接口),允许开发者将ChatGPT集成至他们的应用程序和服务中。
2023年3月1号,OpenAI宣布开放了ChatGPTAPI,其由自然语言大模型“GPT3.5Turbo”支持,开放的API收费模式为个OpenAI根据API调用的token(分词)输入和输出总数计费。
例如调用输入10个token,输出20个token,则需要支付30,token的费用。
同时token总数还需低于模型最大限制,GPT-3.5-turbo-0301版本的限制是4096个token。
支持包括英语、中文、阿拉伯语、日语、德语、西班牙语等几十种语言,使用WhisperAPI的费用为每分钟0.006美元。
除此之外,本次OpenAI还开放了WhisperAPI。
是一种语音转换文字(speechtotext)的模型,可以转写或翻译语音,目前OpenAI已经开放了包括ChatGPTAPI和WhisperAPI在内的多个API接口,逐步推进商业化进程:
OpenAI开放的语言类API包括用于对话的GPT-3.5-turbo(多段对话)、InstructGPT(一问一答),其中InstructGPT根据其,性能可以分为Ada、Babbage、Curie、Davinci(由弱至强),这四个模型还提供针对具体场景的微调接口,其中的Ada还可以作为研究的基础Embedding模型被调用。
开放的多模态模型为DallE,根据处理图像的像素不同进行收费。
开放的音频模型为Whisper。
表:
OpenAI开放的相关模型,应具体用功能,模型名,定价(美金/1000tokens),应用,具体,模型名定价(美金/1000tokens),功能,应用,具体功能,模型名定价,语,言模型,对话,GPT-3.5-turbo,Ada,InstructBabbageGPTCurie,0.002,0.00040.0005,语言模型,Ada,0.0004(训练)0.0016(调用),Fine-,Babbage,0.0006(训练)0.0024(调用),Tuning,Curie,0.0030(训练)0.0120(调用),0.020美金/image(10241024),多模态模型,文生图,DallE0.018美金/image(512512),0.016美金/image0.006美(金25/6mi2n5u6t)e,0.0020,Davinci,0.0300(训练)0.12(调用),音频语音,模型,1.3微软与OpenAI深度合作,依托前沿AI技术提升产品能力,微软作为OpenAI最为重要的合作伙伴和投资人,其旗下产品与OpenAI的相关模型深度融合。
微软旗下的搜索引擎结合了GPT4的技术,将搜索、创造、聊天结为一体,多方位地满足用户个性化的需求;微软旗下的企业服务平台Dynamic365是融合CRM、ERP等功能的SaaS服务,其结合ChatGPT的技术推出Dynamics365Copilot,为销售、服务、营销到供应链等跨业务的人员提供帮助;微软旗下的开发者工具PowerPlatform,结合ChatGPT技术推出,PowerVirtualAgents和AIBuilder,分别提供构建聊天机器人的低代码方法和面向开发人员的生成AI功能。
微软产品在融合了生成式AI技术后展现出更强的产品能力和市场竞争力,1.以Dynamic365Copilot为例,在原先的工作场景中,营销人员需要每天花费66的时间进行邮件回复(根据Futurum研究),而,Dynamics365Copilot的推出就有望大大减轻这方面的工作量。
2.产品能力的提升也带来了广泛的市场关注度和认可度,以微软Bing为例,Bing接入ChatGPT一个月后,微软公布进展称,经过多年的稳步发展,加上数百万新Bing预览用户的推动,Bing每日活跃用户已突破1亿。
在新Bing预览版的数百万活跃用户中,大约三分之一是Bing的新用户。
图:
Bing基于用户指令生成产品对比信息表格图:
微软PowerPlatform平台与AI结合相关产品时间线,1.4.1B端应用:
Dynamic365&PowerPlatform,PowerPlatform是微软旗下的开发者工具,其中于2023年3月6日推出的PowerVirtualAgents和AIBuilder都已经使用了,OpenAI的GPT语言模型技术。
其中PowerVirtualAgents通过聊天机器人的形式实现低代码编程,比如将AI聊天机器人指向企业的特定资源,如网站或者知识库,简单配置便可使用,无须额外编写代码。
而AIBuilder结合了ChatGPTAPI(称为AzureOpenAI服务)的生成AI功能,允许开发人员使用GPT模型生成文本,包括汇总报告、生成内容创意等等。
图:
使用Dynamic365Copilot辅助回复邮件,图:
利用PowerVirtualAgents便捷构建聊天机器人,Dynamic365是微软推出的企业服务平台,其中于2023年3月9日推出的的Dynamics365Copilot结合了ChatGPT相关的AI技术,用于CRM和ERP。
目前处于预览阶段,其可以为销售、服务、营销到供应链等跨业务的人员提供帮助,例如实现生成回复客户信息的电子邮件,为团队创建会议摘要,为营销活动提供灵感等。
1.4.2B端应用:
Jasper,Jasper:
结合GPT-3,打造多款产品截至2022年12月底,Jasper付费用户达到7万,2022年年收入7500万美金,估值已达15亿美金。
旗下有多款产品接入GPT-3进行商业性文字创作:
JasperStarter能够利用预定义的模板完成摘要、产品描述、博客文章。
BossMode是一款写作助手,能够实现灵活便捷的商业文案写作。
通过使用BossMode,用户仅需要自己编辑20的内容,Jasper会完成80的内容。
JasperforBusiness是专门为B端打造的服务,能够定制化生成文案。
用户能够创建新的自定义工作流程,开发专门满足其需求的写作助手。
JasperChat是一款起到激发想法和修改内容功能的聊天机器人,而JasperArt能够为广告、博客文章生成图片。
图:
Jasper能够翻译25种语言,图:
Jasper功能简述,图:
Jasper将关键词和提示转换为文章,1.4.3B端应用:
Brex&Slack&ChatSpot.ai,Brex:
与OpenAi合作,打造便捷化的金融信息平台Brex是一家美国的金融科技平台。
2023年3月7日,Brex宣布推出基于OpenAI技术的先进人工智能工具。
通过BrexEmpower平台,客户可以在聊天界面中,使用自然语言来描述要求,获得相应的财务相关信息或是更为复杂的财务分析。
Slack:
基于ChatGPT能力,助力日常办公的效率提升,Slack是Salesforce旗下的团队协作工具,与Teams类似。
2023年3月7日,Slack宣布引入OpenAI的ChatGPT,用户可以在应用,程序中直接对ChatGPT提问来获得问题的答案。
ChatGPT将协助用户进行内容理解、总结与归纳,进而实现工作效率的提高。
这一功能最初为OpenAI内部团队的协作工具,现在已经向所有的Slack用户开放。
ChatSpot.ai:
将ChatGPT等AIGC技术与CRM结合,辅助实现多类任务,HubSpot是一个著名的营销、销售、服务平台(CRM),其推出了一种新的生成AI工具ChatSpot,将HubSpot自己的CRM技,术与OpenAI的ChatGPT、DALL-E2和谷歌文档应用程序结合,可以用自然语言完成多类任务,如调取数据,生成报告等功能。
图:
Brex产品示意图,图:
Slack中的ChatGPT相关应用,1.4.4B端应用:
HireStack&Pencil,HireStack:
结合GPT-3提升面试效率HireStack是一家人力资源公司,它利用GPT-3生成面试问题以及对应的答案。
参考AI给出的回答,HireStack能够在面试时评估应聘者的专业能力以及与对应职位的匹配度,相比于传统的人力资源公司,AI能够极大提升HireStack工作效率。
Pencil:
基于GPT-3生成多样化广告,Pencil可以生成效果良好、富有创意且符合品牌要求的广告文案和视频。
GPT-3使得Pencil不仅能够一般性地描述产品,,而是能够围绕产品进行创意营销。
例如,为打造一个手电筒广告,Pencil在广告中首先展现出在黑暗中工作是十分危险的,进而突出手电筒的重要性。
更具创意的解决方案将使得Pencil的广告对潜在客户更具吸引力。
图:
Pencil基于一款产品生成多种类型的广告,图:
HireStack利用GPT-3生成面试问题和答案,1.4.5C端应用:
Snapchat&Discord,Snapchat:
基于ChatGPTAPI推出聊天机器人MyAISnapchat是一款由斯坦福大学学生开发的图片分享软件。
2023年2月28日Snapchat宣布推出近日基于OpenAI的ChatGPTAPI的人工智能聊天机器人“MyAI”。
目前,这一功能仅对订阅了Snapchat+的高级用户开放,订阅费用为每月3.99美元。
目前,付费用户数量为两百万,只占公司用户总数的一小部分。
公司表示,在不久的将来,平台的所有客户都可以免费或付费使用MyAI。
Discord:
基于ChatGPTAPI推出聊天机器人Clyde,Discord是一个游戏聊天应用与社区,每月有3000万用户在社区中体验AI相关的应用。
2023年3月10日,Discord宣布引,入OpenAIAPI推出了聊天机器人Clyde,其可以加入到Discord的不同频道中(通过输入“Clyde”就可以在任意频道中与Clyde进行对话),实现对话总结、基于对话中的问题作答、歌单推荐、与用户进行互动游戏等方面的功能。
图:
SnapchatMYAI,图:
DiscordClyde,1.4.6C端应用:
Bing,Bing:
整合OpenAI新一代技术,带来搜索引擎范式转移2月8日,由ChatGPT和GPT-3.5提供支持的全新搜索引擎Bing正式亮相。
新版Bing在传统的搜索外还有对话窗口,可向它提问或是征求它的意见。
例如用户可以向其询问参加音乐节的建议。
除此之外,新版Bing还可以进行创作,例如根据提示帮助用户用户生成从电子邮件到社交媒体的文本,或是表格化的输出帮助用户更好对比产品的差异。
此外,Bing在不断迭代,3月7日,Bing发布了具有三个风格的新版产品以更好满足用户个性化的需求。
此外,移动版的Bing也在11日发布,用户在手机上即可使用最新版本的Bing。
我们认为,新Bing不同于传统的搜索引擎,将“搜索+创造+聊天”融为一体,能够更加灵活地满足用户多样化需求,或将带来搜索引擎的范式转移。
新Bing下载量激增,日活已突破1亿Bing接入ChatGPT一个月后,微软公布其进展称,经过多年的稳步发展,加上数百万新Bing预览用户的推动,Bing每日活跃用户已突破1亿。
在新Bing预览版的数百万活跃用户中,大约三分之一是Bing的新用户。
图:
新Bing界面包含对话框图:
利用Bing生成社交媒体的文本图:
Bing生成表格对比产品信息,1.4.7C端应用:
DuckAssist&Poe,DuckDuckGo:
与OpenAI合作,推出DuckAssist,DuckDuckGo是一个主打隐私保护的互联网搜索引擎,于2023年3月9日推出了测试版DuckAssist,通过AI工具来帮助用户快速找到,答案。
DuckAssist的设计目标是从维基百科等类似来源中,总结出用户所需要的答案,并以自然语言的方式传达给用户。
DuckDuckGo邀请所有用户对DuckAssist的功能进行测试,且不需要注册用户即可直接使用相关功能,如果测试进展顺利,它将在“未来几周内”正式添加到浏览器中。
Quora:
基于不同的语言模型,推出了聊天机器人Poe,Quora是一个专业问答平台/知识问答社区,类似于美国版的知乎。
Quora推出了新的AI聊天机器人应用Poe,最早在2022年12月亮相,,但在2023年2月全面发布。
所有iOS用户都可以通过电话号码和电子邮件注册账户,然后就能在三种不同的AI聊天机器人中切换,获得相应的聊天结果。
具体的聊天机器人包括Sage、Dragonfle(均由OpenAI支持)、Claude(由支持Anthropic)。
目前Poe作为独立产品推出,但若Poe上的相关内容达到一定的质量标准,就会被发布至Quora网站上,供每月4亿访问者快速查询。
图:
DuckAssist界面示意图图:
QuoraPOE,1.4.8C端应用:
Quizlet&Instacart&Shop,Quizlet:
结合ChatGPTAPI,推出AI导师Q-Chat,Quizlet是一个全球性的学习平台,有超过6000万的用户。
结合ChatGPTAPI,Quizlet于2023年2月28日推出了AI导师Q-Chat,其可,以基于相关学习材料提出自适应问题,生成有趣的聊天内容来与学生进行互动。
Instacart:
基于ChatGPT和相关AI技术,推出AskInstacart功能,Instacart是一家美国的生鲜杂货电商平台。
Instacart利用ChatGPT和自研的AI技术,结合平台上超过75000个零售合作伙伴店铺的产,品信息,帮助客户实现他们的开放式购物目标,例如可以回答客户的“我的孩子们午餐吃什么健康的食物?
”一类的开放性问题,这一功能名为AskInstacart,将在今年晚些时候推出。
Shopify:
结合ChatGPT,提供消费个性化推荐服务,Shop是Shopify的消费者应用程序,有上亿消费者在程序上寻找品牌和产品信息。
通过与ChatGPT的结合,Shpo购物助手会根据用,户文字描述的需求,扫描数百万商品快速找到买家所需,提供个性化推荐,实现物流程的简便化、高效化。
图:
QuizletQ-Chat生成趣味问答与学生交互Shopify中的shop协助找到买家所需,图:
AskInstacart,图:
提问什么是适合孩子的健康午餐,给出食物推荐和购买链接,提出需要寻找的服装需求,根据用户需求推荐相关产品,1.4.9C端应用:
Anania&Tabnine,Anania:
结合多种语言模型进行数据分析Anania是一款数据分析软件,GPT3是Anania使用的AI模型之一。
其可以通过简单、自然的英语对话来分析用户的数据。
用户可以通过它对数据进行搜集、分析、可视化和导出。
例如用户输入“向我展示出周内和周末用手机进行对话的用户比例的差异”,Anania即可快速生成对比图表。
Tabnine:
结合GPT-2生成代码,Tabnine使用生成AI技术来预测并根据上下文和语法来推测用户的下一行代码。
在编写代码时,Tabnine可以为用户推荐,其预测的整行代码。
或用户输入注释,Tabnine则会为其推荐正确的代码。
图:
输入注释Tabnine即可自动生成代码,图:
输入句子Anania即可作出图表,注释:
拟合随机森林模型Tabnine自动生成了相关代码,1.4.10C端应用:
JarvisLyrics&Rationale,JarvisLyrics:
基于GPT3的歌词生成工具Jarvis是歌曲创作的伴侣。
它能够根据任何艺术家、流派、标题和歌词的提示生成歌词建议。
然后,用户可以根据建议创作自己的歌词。
该工具利用随机输入的语句或创意故事生成的歌词使得艺术家获得更多灵感。
Rationale:
基于GPT3的决策助手,用户只需输入无法决定的选项,Rationale就会根据GPT和上下文学习算法列出该决定的优缺点、生成SWOT分析或,进行多标准分析以帮助用户权衡选择。
通过考虑所有相关因素和用户的背景,Rationale可以帮助用户做出理性的决定。
图:
输入歌手名称即可使用Jarvis生成相关歌词,图:
用户输入“吃苹果”后Rationale列出该决定的优缺点用户无法确定的事项,缺点,优点,目录,一、ChatGPT:
从全民关注的爆款应用走向商业化开放,在多个场景中展现价值二、GPT4:
更强大的多模态大模型,带来更广泛的商业应用可能,2.1.1GPT-4:
OpenAI最强大的多模态大模型,2023年3月15日,OpenAI发布多模态预训练大模型GPT-4,并称其是目前最强大的多模态大模型。
其主要特点如下:
GPT-4具备从图像中获取和分析信息的能力:
GPT-4不仅拥有图像阅读能力,还可以从图像中提取逻辑,进行分析思考。
以左图为例:
问:
如果把图中的绳子剪掉会怎么办?
GPT-4:
气球会飞走。
GPT-4对图片的理解能力、分析逻辑能力、物理等学科的知识储备都赋予了这个模型强大的智能。
超G过PT-4能够处理更长的文本输入:
在ChatGPT模型中,单次输入的文本量为3000个单词左右,而GPT-4模型单次能够处理,25000个单词,是上一代ChatGPT模型的近8倍,代表着对长文章的阅读、分析、生成能力大幅提高。
图:
GPT-4拥有从图像中提取逻辑的强理解力,图:
GPT-4和ChatGPT单次输入的文本量对比,2.1.2GPT-4:
能力更为强大而全面的多模态预训练大模型,GPT-4更具备创造力和协作能力:
它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本,或学习用户的写作风格。
如下左图所示,GPT-4根据用户要求生成了一个解释灰姑娘故事情节的句子,并且每个单词首字母需满足字母表A-Z的排序。
GPT-4相较于ChatGPT有更强的高级推理能力:
GPT-4能够回答出ChatGPT所不能回答的更为复杂的逻辑问题。
如下右图,所示,给定三个人物不同的空闲时间,要求模型安排出合适的会议时间,ChatGPT无法在此问题上给出正确答案(右图灰白色文字),而GPT-4能够合理的完成这一要求(右图绿色文字)。
而在GPT-3.5难以处理的如APCalculusBC(AP微积分)考试中,GPT-4的水平超过40%的应试者。
图:
GPT-4根据用户要求创作,图:
GPT-4能够处理ChatGPT无法处理的复杂推理问题,要求用一句话描述灰姑娘的剧情且句子中每个单子的首字母需要满足字母表A-Z的排序,ChatGPT生成的答案是错误的而GPT-4给出了正确的答案,2.2.1GPT-4:
从语言模型走向多模态模型,带来更为丰富的应用场景,图1:
GPT-4处理图像相关的物理问题,图2:
GPT-4根据论文截图给出摘要(左)并回答相关问题(右),出GP强T大-4的是能大力型。
多模态模型,能够接受图像和文本两种模态的输入,再通过文字给出正确的文本答复,在多个不同的应用场景中展现给出一道物理题和相应的示意图,GPT-4可以给出具体的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GPT4 ChatGPT 相关 应用 梳理
![提示](https://static.bingdoc.com/images/bang_tan.gif)