分享
基于GPT的智能客服落地实践
输入“/”快速插入内容
基于GPT的智能客服落地实践
✍️
作者
:
用户1744
用户1744
📍前言
在日常生活中,「客服」这个角色几乎贯穿着我们生活的方方面面。比如,淘宝买东西时,需要客服帮你解答疑惑。快递丢失时,需要客服帮忙找回。报名参加培训课程时,需要客服帮忙解答更适合的课程……
基于此背景下,可以了解到客服在我们生活中的重要性。传统的客服更多是以「一对一人工回复」的方式,来帮我们解答疑惑。那在以
GPT
为例的各类大模型爆火之后,纷纷涌现出一些新奇的「智能客服」。那在下面的文章中,就将来聊聊,关于大模型在智能客服领域相关的一些落地方案。
以下文章整理自
稀土开发者大会2023·大模型与AIGC-掘金
第二部分,讲解关于
Think Academy
公司,基于GPT的智能客服落地实践方案。
一、💬项目背景
该公司想要做这个项目的背景如下:
•
从业务场景出发:希望提供一个体验更好,响应更实时的智能客服。
•
从技术层面出发:跟进新技术,以及验证大模型在生产环境下的可应用性和可塑性。
基于上面的背景信息,分析出即将要做的智能客服系统,要满足以下几个场景:
•
回答教育机构的教学理念、如何上课等类似静态的相关咨询。
•
当用户问到和入学测相关的问题时,会去引导用户去添加相关的教学主任,之后做相关的转化的动作。
•
希望大模型只回答业务相关的问题。
34%
33%
33%
有了上面的基本信息铺垫以后,接下来来介绍,关于
智能客服系统
的第一个版本。
二、💭问答客服V_1.0 — 基于企业专有知识库的客服系统
技术选型、方案设计、数据表现及缺陷
1、如果让大模型学会特定领域知识
(1)两种学习方式
首先在刚开始,我们调研到了有两种预训练方式:
Fine-tuning Learning
和
In-context Learning
。
Fine-tuning
和
In-context Learning
是机器学习中用于
调整预训练模型
的两种不同方法。它们之间的主要差异有:
🔎
Fine-tuning(微调)👇🏻:
1.
定义:在预训练模型的基础上,用特定任务的数据集进行再训练,调整模型的参数以适应新任务。
2.
数据需求:需要一定量的标记数据来进行微调。
3.
训练时间:根据任务的复杂性和数据量的大小,微调可能需要一定的时间和计算资源。
4.
泛化能力:微调后的模型在特定任务上表现很好,但可能在其他任务上表现不佳。
5.
应用范围:适用于有足够数据的任务,并且希望模型在这个特定任务上达到最佳性能。
6.
灵活性:一旦微调完成,模型就固定了,想要适应新任务需要再次微调。
In-context Learning(上下文学习)👇🏻:
1.
定义:在不改变预训练模型的参数的情况下,通过向模型提供包含任务信息的上下文来使其执行特定任务。
2.
数据需求:不需要额外的训练数据,但是需要为每个任务设计合适的上下文。
3.
训练时间:不需要再训练,可以立即用于各种任务。
4.
泛化能力:可以应用于多种任务,但性能可能不如微调后的模型。
5.
应用范围:适用于数据稀缺和任务多样的场景。
6.
灵活性:非常灵活,可以通过改变上下文来快速适应新任务。
总的来说,如果你有足够的标记数据,并且希望在特定任务上获得最佳性能,微调可能是更好的选择。而如果你需要模型适应多种任务,并且希望迅速部署,上下文学习可能更合适。
因此,基于上述两种学习方式的调研后,最终
V1.0版本
选择了
In-context Learning
的预训练方式。