基于GPT的智能客服落地实践

✍️

作者：

📍前言

在日常生活中，「客服」这个角色几乎贯穿着我们生活的方方面面。比如，淘宝买东西时，需要客服帮你解答疑惑。快递丢失时，需要客服帮忙找回。报名参加培训课程时，需要客服帮忙解答更适合的课程……​

基于此背景下，可以了解到客服在我们生活中的重要性。传统的客服更多是以「一对一人工回复」的方式，来帮我们解答疑惑。那在以GPT为例的各类大模型爆火之后，纷纷涌现出一些新奇的「智能客服」。那在下面的文章中，就将来聊聊，关于大模型在智能客服领域相关的一些落地方案。​

以下文章整理自稀土开发者大会2023·大模型与AIGC-掘金第二部分，讲解关于 Think Academy 公司，基于GPT的智能客服落地实践方案。

一、💬项目背景

该公司想要做这个项目的背景如下：

•
从业务场景出发：希望提供一个体验更好，响应更实时的智能客服。​

•
从技术层面出发：跟进新技术，以及验证大模型在生产环境下的可应用性和可塑性。​

基于上面的背景信息，分析出即将要做的智能客服系统，要满足以下几个场景：​

•
回答教育机构的教学理念、如何上课等类似静态的相关咨询。​

•
当用户问到和入学测相关的问题时，会去引导用户去添加相关的教学主任，之后做相关的转化的动作。​

•
希望大模型只回答业务相关的问题。​

34%

33%

有了上面的基本信息铺垫以后，接下来来介绍，关于智能客服系统的第一个版本。​

二、💭问答客服V_1.0 — 基于企业专有知识库的客服系统

技术选型、方案设计、数据表现及缺陷

1、如果让大模型学会特定领域知识

（1）两种学习方式

首先在刚开始，我们调研到了有两种预训练方式：Fine-tuning Learning和In-context Learning。​

Fine-tuning和In-context Learning是机器学习中用于调整预训练模型的两种不同方法。它们之间的主要差异有：​

🔎

Fine-tuning（微调）👇🏻：

1.
定义：在预训练模型的基础上，用特定任务的数据集进行再训练，调整模型的参数以适应新任务。​

2.
数据需求：需要一定量的标记数据来进行微调。​

3.
训练时间：根据任务的复杂性和数据量的大小，微调可能需要一定的时间和计算资源。​

4.
泛化能力：微调后的模型在特定任务上表现很好，但可能在其他任务上表现不佳。​

5.
应用范围：适用于有足够数据的任务，并且希望模型在这个特定任务上达到最佳性能。​

6.
灵活性：一旦微调完成，模型就固定了，想要适应新任务需要再次微调。​

In-context Learning（上下文学习）👇🏻：

1.
定义：在不改变预训练模型的参数的情况下，通过向模型提供包含任务信息的上下文来使其执行特定任务。​

2.
数据需求：不需要额外的训练数据，但是需要为每个任务设计合适的上下文。​

3.
训练时间：不需要再训练，可以立即用于各种任务。​

4.
泛化能力：可以应用于多种任务，但性能可能不如微调后的模型。​

5.
应用范围：适用于数据稀缺和任务多样的场景。​

6.
灵活性：非常灵活，可以通过改变上下文来快速适应新任务。​

总的来说，如果你有足够的标记数据，并且希望在特定任务上获得最佳性能，微调可能是更好的选择。而如果你需要模型适应多种任务，并且希望迅速部署，上下文学习可能更合适。​

因此，基于上述两种学习方式的调研后，最终V1.0版本选择了 In-context Learning 的预训练方式。​

基于GPT的智能客服落地实践​