欢迎来到XinTang的博客
ChatGPT中RLHF技术介绍 ChatGPT中RLHF技术介绍
简介随着OpenAI发布的ChatGPT大火,越来越多人开始关注其中用到的RLHF(Reinforcement Learning from Human Feedback)技术,其字面意思是基于人类反馈的强化学习,核心思想是获取生成文本的人工
2023-04-17
Bert模型简介 Bert模型简介
1.简单介绍BERT (Bidirectional Encoder Representation Transformers) 是在2018年由Google AI 团队发布的,网络结构主要采用了Transformer编码器的架构,属于自编码模
2023-03-19