Workflow
Model Hallucination
icon
Search documents
bit-Agent正式接入GPT-5,九科信息智能体能力再升级!
近日,OpenAI发布GPT-5,又给全球科技圈带来了一点小小的震撼。 OpenAI创始人Sam Altman说:"测试完GPT-5,我感觉自己一无是处。"GPT的前代产品已足够惊艳,但 在Altman的眼里,"GPT-3像个高中生,GPT-4像个大学生,而GPT-5则已经变成了一名专家,一名各个 领域的专家。" 而从最新的大模型盲测竞技场榜单来看,GPT-5更是以全方位第一的姿态"屠榜"。 GPT-5在多项AI能力测试中全面领先 在GPT-5问世后,九科信息率先将其接入bit-Agent。今天就来带大家快速了解,接入GPT-5后,bit-Agent 带来了哪些方面的升级。 01 强化界面操作,端对端驾驭复杂场景 作为图形用户界面智能体,bit-Agent的核心能力在一定程度上取决于大模型的推理精度、上下文把控及 多模态理解。而GPT-5在这三大维度的突破性进展,让bit-Agent的界面操作能力实现了实质性跃升,得 以轻松驾驭更复杂的任务场景。 GPT-5多方位升级:更聪明、多模态、强记忆、个性化、工具集成、更安全 在处理任务时,bit-Agent需要依次完成理解用户指令、明确任务目标、拆解执行步骤、识别界 ...
OpenAI最强AI模型竟成“大忽悠”,o3/o4-mini被曝聪明过头、结果幻觉频发?
3 6 Ke· 2025-04-21 11:07
可刚发布没两天,这些"最智能"的模型就成了"幻觉专业户":据 OpenAI 内部测试显示,o3 和 o4-mini 比旧版模型更容易产生幻觉! 最强推理模型,却成"幻觉大师"? 在 o3 和 o4-mini 发布之初,OpenAI 官方对其评价极其的高: "OpenAI o3 是我们最强大的推理模型,它推动了编码、数学、科学、视觉感知等领域的发展","OpenAI o4-mini 是一款经过优化的小型模型,适用于快 速、经济高效的推理。它在数学、编程和视觉任务方面,以自身规模和成本而言,表现十分出色"。 为了证实 o3 和 o4-mini 的能力,当时 OpenAI 还展示了许多测试成绩: 作为全球 AI 领域的标杆,OpenAI 上周推出的新一代推理模型 o3 和 o4-mini 模型在编码、数学等复杂任务上展现出表现出色,在多个基准测试中也取得 了瞩目的成绩——为此OpenAI 官方表示,o3 和 o4-mini 是 OpenAI 迄今为止发布的最智能模型。 连"非推理"模型都比不过:甚至,传统"非推理"模型 GPT-4o 都比 o3 和 o4-mini 的幻觉率还低——新模型在"胡编乱造"上实现了"反向 ...