(资料图片)
编程客栈() 5月10日消息:Anthropic 是一家由前 OjavascriptpenAI 高管创立的初创公司,它似乎正试图在快速发展的市场中开辟自己的明确位置,为由大型语言模型(称为生成 AI)提供支持的服务提供服务。
Claude 是一个人工智能聊天机器人,类似于 OpenAI 的 ChatGPT,Anthropic 在三月份发布。
在一篇博客文章中,这家初创公司解释了它用来训练其类似 ChatGPT 的聊天机器人 Claude 的方法,以产生比其他聊天机器人危害更小、更准确的结果。
Anthropic 详细介绍了其「Constitutional AI」训练方法,旨在为其 Claude 聊天机器人注入明确的「价值观」,以解决人工智能系统透明度、安全性和决策制定等方面的担忧,而无需依赖于人类反馈来评估响应。
Anthropic 表示,随着 AI 系统的不断发展,我们希望能够借助它们来监督其他的 AI。我们正在尝试一种方法,通过自我提升训练一个无害的 AI 助手,而不需要任何人工标注有害输出内容。
唯一的人工监督是通过一系列规则或原则来实现的,因此我们称之为「Constitutional AI」。这个过程涉及到有监督的学习和强化学习两个阶段。
在有监督的阶段,我们从一个初始模型中进行采样,然后生成自我批评和修订的结果,再将修订后的结果微调到原始模型中。
在强化学习阶段,我们从微调后的模型中进行采样,使用一个模型来评估哪个采样结果更优秀,然后从这个 AI 喜好数据集中进行偏好模型的训练。
之后,我们使用偏好模型作为奖励信号,即「AI 反馈的强化学习」(RLAIF)进行训练。因此,我们能够训练出一个无害但非侵入式的 AI 助手,通过解释其反对有害查询的理由来进行交互。无论是有监督学习还是强化学习,这些方法都能利用链式思维推理来改善 AI 决策性能和透明度,使得控制 AI 行为变得更加精确,并且需要的人工标注更少。
上一篇:夫妻工资属于共同财产吗?老公在银行贷款算夫妻债务吗?
下一篇:最后一页
-
世界观焦点:Anthropic 展示它的 AI 训练与 OpenAI 不同之处:不需要人工标注有害信息编程客栈()5月10日消息:Anthropic是一家由前OjavascriptpenAI高管创立的初创公司,它似乎正试图在快速发展 -
夫妻工资属于共同财产吗?老公在银行贷款算夫妻债务吗?夫妻工资属于共同财产吗?是。根据民法典的规定,在夫妻关系存续期间,夫妻双方工资属于夫妻共同财产。所 -
资讯推荐:川金诺:坚定看好新能源及磷酸铁锂未来市场川金诺5月10日在互动平台表示,公司坚定看好新能源及磷酸铁锂未来市场。目前,新能源产业已成为我国支柱产 -
重庆养老金2023调整方案细则出炉吗?今年人均养老金会涨多少?重庆养老金2023调整方案细则出炉吗?今年人均养老金会涨多少?个人月领多少钱?随社保网小编来看看。2023年 -
当日快讯:数字人民币试点纵深推进,预付费管理应用可期随着上市公司2022年年报和2023年一季报披露完毕,商业银行和金融科技厂商在数字人民币方面的进展曝光。梳理
X 关闭
X 关闭
