OpenAI已训练CriticGPT模型：基于GPT-4 用于发现ChatGPT生成内容错误_科技_资讯

6月28日消息，据外媒报道，随着GPT系列大模型的不断升级，OpenAI所训练的ChatGPT也在拥有更强的能力，但这也带来了一些挑战，它所生成的内容中存在的错误也越来越隐蔽，逐渐到了AI训练师难以发现的程度。

而为了应对这一挑战，OpenAI也想出了新招，他们基于GPT-4模型，训练了一个用于发现ChatGPT输出代码错误的模型。

OpenAI当地时间周四，已在官网宣布了这一消息，他们训练的模型名为CriticGPT，从名称来看就是用于发现不足，以便让相关的应用变得更好。

从OpenAI在官网公布的消息来看，CriticGPT在他们的应用中有不错的效果，他们发现在新模型的辅助下，使用者在检查ChatGPT的输出代码时，比没有CriticGPT的协助要好60%。

在官网上，OpenAI提到，他们也是通过RLHF （从人类反馈中强化学习，Reinforcement Learning from Human Feedback）来训练CriticGPT，与训练ChatGPT类似。但与训练ChatGPT不同的是，他们在训练CriticGPT时，看了大量包含错误的输入。

虽然CriticGPT能帮助发现更多的问题，但也存在不足，还有改进的空间。OpenAI在官网上就提到，并不是所有的发现都是准确的，用于训练的ChatGPT生成内容也普遍很短，还需要开发新的方式，以协助训练师理解更长和更复杂的任务。

此外，OpenAI在官网上也提到，在研发CriticGPT的过程中，他们发现将RLHF应用于GPT-4时，能帮助生成更好的RLHF数据，他们计划扩大这一项工作的规模，并付诸实践。（海蓝）

转载请注明出处。

• 苹果[Apple]2025年OS已在开发中：iOS 19代号Luc	• 特斯拉[TSLA]五年免息上热搜：7月31日前下单即
• 苹果[Apple]FaceTime诈骗案频发警方发布相关提	• 李开复：AI智能有望2025年赶超博士奇点将于数
• 知乎发布全新AI产品“知乎直答”	• “股神”巴菲特罕见发声：谈论的却是修改遗嘱
• 消息称特斯拉[TSLA]中国召回被裁人员但需退还N	• 吉利汽车2024年第一季度营收523.2亿元，净利润1
• 消息称京东方去年在全球中小尺寸OLED显示屏市场	• 卡尔动力完成6亿元A轮融资加速编队自动驾驶无