提升生产力
- 我该如何“训练”一个基于我的内容的模型?
- 怎么让 AI 知道 我的事情专为我服务?
- 如何避免让 AI 跟用户胡说八道?
- 微调(Fine-tuning)和嵌入(Embedding)是什么意思?
现在,你无需再为此烦恼,技术平权的速度从未来的如此之快!
精益AI的目标是让企业级用户可以快速基于大型语言模型搭建出有用的东西,并确保它是可视化、可运营、可改进的。
Fine-tuning 介绍
在创建企业专属AI应用之前,先补充一些 Fine-tuning
的基础知识。
Fine-tuning
意思是 “微调”,即在预练习模型的基础上,进行进一步的微调,然后使得模型到达更好的作用,输出更理想的结果。在这个过程中,通常会运用更小的学习率,然后避免呈现 过拟合
的状况。
创建企业专属AI应用即是在文心一言
、讯飞星火
、通义千问
、GPT-3.5
或 GPT-4
这些模型上,做 Fine-tuning
,训练出专属于企业自己的应用,并且接入企业微信、企业官网或内网,提供给客户、内部员工进行使用。
AI应用示例
上图示例了一个AI智能应用的接入,可接入内容如:企业的规章制度、企业技术工艺文件、质量体系文件,或者企业的各类统计数据、报表等。
进而延伸到各行业应用,可定制如学校的教案、试卷、知识等问答、检索等应用,图书馆的书籍查询、内容介绍等。
以上应用基于公有实现,如涉及内部知识的安全与保密,可联系进行私有化部署(基配4C8G服务器)。
创建企业专属应用
背景
注:CODING DevOps 是腾讯云旗下的一站式研发管理平台及云原生开发工具,旨在让软件研发如同工业生产般简单高效,助力提升企业研发管理效能。
为什么?比如ChatGPT 3.5本身便是由庞大的互联网语料库训练而成,并且这部分训练数据截止于 2021 年 9 月。如果你的产品在这个日期之前就有幸在互联网中占有一席之地,那恭喜你,GPT 可以大概率可以回答出你的产品是大概是干嘛用的。因为它会从你的官网收集已有的描述语料。具体到单独的产品或公司的细节时它便开始靠胡言乱语来敷衍你了。
这里的“胡言乱语”指的是它会用其他不相关的概念进行回答,并且你并不能够预期什么问题会有什么回答,这在商业场景下十分致命。在大多数情况下,公有大模型对于一些带有公理性质的知识回答是没有问题的,作为一个可以日常侃大山闲聊的对象依然是合格的,可是你却看着它的强大的学习和理解能力望洋兴叹。
这也是为什么说公有AI大模型能够回应大家的问题,但是却不能够回答出“我”想要的问题。
创建对话应用
Duang,一个聊天机器人就做好了。
访问这个链接就可以看到一个聊天机器人了。但是,它现在也只是一个通用型聊天机器人,离商业可用的专用型问答机器人还差一个语料的距离。
准备语料
第一步创建数据集
第二步上传语料(即相关文档)
支持上传文件格式 TXT、HTML、MarkDown、PDF,是的没错,也可以把pdf电子书上传进来,用 AI 帮助提炼书本内容。
开始训练
现在要做的事,就是上传这个文件并静待训练成果了。
数据自动分段与清洗完成后,在刚创建的应用设置中的上下文,关联这一篇文档。为了保证响应速度和成本控制,这里可以选择使用不同的模型。
训练成功
现在再去和这个机器人互动,看看它会回答什么?
😄😄基本完成,现在AI 可以接入到企业微信、官网或者内部,变成妥妥的产品专家。只要有优秀的文档,所有公司都可以打造出专用型问答机器人。
那么你希望做一个考试问答机器人?出题机器人?
关注页面底部👇👇👇微信公众号咨询定制吧🤝🤝
暂无评论内容