搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
1 天
on MSN
豆包大模型1.5 Pro横空出世,综合能力超越GPT-4o引关注
近期,豆包大模型迎来了其1.5 Pro版本的正式亮相,这一消息在业界引起了广泛关注。
9 天
DeepSeek V3与GPT-4o实力对决:国产新星与国际巨头的AI全面比拼
在人工智能领域,技术的发展总是令人瞩目的。近日,由量化私募幻方量化旗下的AI初创公司DeepSeek发布的开放源代码模型DeepSeek ...
腾讯网
8 天
打脸!GPT-4o输出长度8k都勉强,测试显示:模型输出都低于标称长度
目前现有的长上下文语言模型(long-context language models)的评估基准主要集中在长上下文回忆任务上,这些任务要求模型在处理大量无关信息的同时生成简短的响应,没有充分评估模型在整合分散信息和生成长输出方面的能力。
1 天
on MSN
字节跳动豆包大模型1.5 Pro重磅发布,综合能力超越GPT-4o等模型
字节跳动近日正式推出了其最新的豆包大模型1.5 Pro版本,这一消息引起了业界的广泛关注。据悉,该模型在知识、代码、推理以及中文等多个关键测评领域,均展现出了超越GPT-4o、Claude 3.5 Sonnet等竞争对手的实力。
3 天
OpenAI调查GPT-4o模型性能骤降,背后隐忧未解
1月20日,钛媒体App报道,OpenAI官方发布了一份事故报告,坦言其GPT-4o及4o-mini模型当前正面临性能下降的严峻考验。这一信息无疑引发了科技圈的广泛关注与讨论,究竟是什么原因导致这些领先的人工智能模型出现问题?
3 天
OpenAI开启调查:GPT-4o及4o-mini模型性能下降
微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和 ...
7 天
打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型 ...
目前现有的长上下文语言模型(long-context language models)的评估基准主要集中在长上下文回忆任务上,这些任务要求模型在处理大量无关信息的同时生成简短的响应,没有充分评估模型在整合分散信息和生成长输出方面的能力。
腾讯网
1 天
豆包发布大模型1.5 Pro ,实测:国产AI用最「笨」的方法干翻GPT-4o
字节团队告诉 APPSO,Doubao-1.5-pro 目前已经在豆包 APP 灰度上线,由于对话是先接意图识别,所以用户大概率没法确定在使用时是否分流到 1.5 Pro,不过开发者也可在火山引擎直接调用 API。
2 天
豆包App灰度最新语音模式,实现了GPT-4o不会的唱歌
据《智能涌现》测试,更新语音模型后的豆包,最大的亮点在于,豆包在语音交互时,把类似人类的表达形式和情感输出,复刻了出来。与此同时,新版本的对话流畅度和智商情商,也有大幅提升。
20 小时
豆包大模型1.5 Pro正式发布:比GPT-4o更强
全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。该模型已在豆包App全量上线。
2 天
OpenAI:GPT-4o及4o-mini模型性能下降,正在调查
据报道,巴克莱发言人证实,该行已聘请高盛的保罗·约翰逊(Paul Johnson)担任亚太地区股票主管,后者的任务是扩大衍生性商品、股票挂钩融资、电子交易等业务,也将负责机构经纪业务。(界面) ...
来自MSN
17 天
微软发布MEDEC基准评估AI医疗应用,论文估计GPT-4o-mini仅约80亿参数
微软探讨大型语言模型在医疗领域错误检测与修正的应用,并推出了名为MEDEC的全新基准测试集。然而,这篇论文同时也估计了市面上多个商业模型的规模,研究团队认为OpenAI GPT-4o-mini仅约80亿参数,远小于外界先前的预期。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈