人工智能模型升级
Search documents
重新体验 GPT-5 后,我想它比 GPT-4o 更需要一场葬礼
3 6 Ke· 2025-08-11 12:09
Core Insights - The release of GPT-5 has not met user expectations, leading to disappointment compared to its predecessor, GPT-4o [1][10][96] - OpenAI has reintroduced GPT-4o in response to user feedback, indicating dissatisfaction with GPT-5 [2][10] Performance Comparison - GPT-5 performs better in technical tasks such as programming, while it struggles with tasks requiring human-like understanding and emotional nuance, where GPT-4o excels [10][11] - Users have reported inconsistent logical reasoning in GPT-5, with some tasks being solved correctly while others are not, highlighting reliability issues [10][11][55] - Creative outputs from GPT-5 have not shown significant improvement over GPT-4o, often resulting in formulaic responses lacking originality [10][11][70] User Experience - The interaction experience with GPT-5 has been described as more robotic and less empathetic, leading to a less engaging user experience [10][11][88] - Users have noted that GPT-5's responses can feel overly analytical, lacking the warmth and relatability found in GPT-4o's outputs [10][11][88] Task-Specific Insights - In productivity tasks, GPT-5 is perceived as more rational but less personable, making it less suitable for tasks like email writing compared to GPT-4o [10][15] - The models were tested across various scenarios, revealing that while GPT-5 has strengths in STEM-related tasks, it falls short in everyday conversational and creative contexts [10][12][13] Conclusion - Overall, the advancements in GPT-5 do not justify its designation as a major upgrade, with many users expressing a preference for the capabilities of GPT-4o [10][96]
用户痛批GPT-5,哭诉「还我GPT-4o」,奥特曼妥协了
机器之心· 2025-08-09 03:59
| 机器之心报道 | | --- | 对于用顺手了这些旧模型的人来说,这个更改真是无比难受。很多用户希望这些「老朋友」赶紧回来。尤其是 GPT-4o。 机器之心编辑部 o4 回归,你那可以了吗? 等了好久,终于等到 GPT-5 。但大家似乎对这个模型并不满意。 可以使用 GPT-5 的小伙伴,现在打开页面,是这样的。 以前的模型都消失了,原因在于,作为 GPT-5 发布的一部分,OpenAI 移除了 ChatGPT 中的模型选择器。这个下拉菜单此前汇集了 OpenAI 一系列名称容易混淆的 模型,用户可以根据不同需求在它们之间切换。例如,用户可以选择 GPT-4o 来处理复杂任务,或者选择更高效的 o4 mini 模型来完成负担较轻的工作。用户还可 以在不同代际的模型之间切换,例如从去年发布的 GPT-4o 切换到更新的 GPT-4.1。 以前是这样的 然而,随着新模型的发布,OpenAI 将 GPT-5 设为 ChatGPT 的默认模型,并会根据任务类型自动为用户分配不同的子版本。 为了表达心中的不满,很多人玩起了梗图,看起来又好笑,又无奈。 来源: https://x.com/pengkeshen281/ ...
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
Mei Ri Jing Ji Xin Wen· 2025-05-29 13:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek R1,新升级!
第一财经· 2025-05-28 14:15
5月28日晚,第一财经记者获悉,DeepSeek小助手在官方交流群中发布通知称,DeepSeek R1模型已 完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式 保持不变。关于市场期待的DeepSeek R2模型目前仍未有消息。 ...