搜索优化
English
搜索
图片
Copilot
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按时间排序
按相关度排序
22 小时
用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐
团队通过提示工程、监督微调、DPO、RL 等方法对系统 2 对齐方法进行探索。实验数据来源于 WildJailbreak。该数据集的测试集中包含了对抗有害和对抗良性两种数据类型,其定义如下:对抗有害:指通过更复杂和隐秘的方式传递有害请求。对抗良性:指看似是绕过技术但实际上不含有害意图的对抗性请求。
10 天
过程级奖励模型遭遇“信任危机”?PRMBench精细化基准揭示LLM强大 ...
最近,模型在长序列下的推理能力得到了大幅加强,出现了诸如 o1,Gemini-thinking 等强力多步推理模型。在这个过程中,过程级奖励模型(PRMs)是驱动大语言模型(LLMs)进行复杂推理和决策的关键“幕后功臣”。
光明网 on MSN
16 天
AI机器人会考试,不会看病
一项新研究发现,虽然先进的人工智能模型在专业医学考试中得分很高,但在通过与患者交谈从而诊断疾病方面仍然不及格。
腾讯网
22 天
Mozilla 为火狐 Firefox 浏览器推出Orbit AI助手:一键总结内容
Orbit 由 Mistral 7B 大型语言模型(LLM)驱动,托管在云端。不过 Mozilla 承诺会妥善保护用户隐私,该助手无需登录或注册,不保留会话历史,查询数据 ...
IT之家
22 天
Mozilla 为火狐 Firefox 浏览器推出 Orbit AI 助手:一键总结内容
用户可自定义摘要格式(要点、简短概述或详细段落),并设置自动摘要功能。 Orbit 由 Mistral 7B 大型语言模型(LLM)驱动,托管在云端。不过 Mozilla 承诺会妥善保护用户隐私,该助手无需登录或注册,不保留会话历史,查询数据不与 Mistral 7B LLM 或其他服务共享。
新浪网
22 天
Mozilla 为火狐 Firefox 浏览器推出 Orbit AI 助手:一键总结内容
IT之家 1 月 1 日消息,Mozilla 公司昨日(12 月 31 日)发布博文,宣布面向火狐 Firefox 浏览器,推出名为 Orbit 的 AI 驱动助手,能够一键总结网页内容 ...
51CTO
24 天
九大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」 ...
实验 研究人员采用LLaVA-Next-Mistral-7B作为实验的基础模型,通过在其encoder的最后一层添加一个线性层作为value head,构建了VisVM并基于这个结构使用上文中构造的数据集与损失函数进行训练。 在后续的实验中,均使用LLaVA-Next-Mistral-7B作为base model用于生成响应。
腾讯网
24 天
9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠
实验 研究人员采用LLaVA-Next-Mistral-7B作为实验的基础模型,通过在其encoder的最后一层添加一个线性层作为value head,构建了VisVM并基于这个结构使用上 ...
51CTO
29 天
NeurIPS 2024 | REBASE,比MCTS更高效的Inference Scaling算法
• 列: 包括 # SAMPLES (采样数量), FLOPS (推理计算量) 和 MATH500 (在 MATH500 数据集上的准确率) 三列。 • 行: 比较了使用采样方法和 REBASE 算法在不同模型 (Mistral-7B, Llemma-7B, Llemma-34B) 下的性能。 总结: • REBASE 算法可以在更低的计算预算下实现更高的准确率: 对于所有 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈