Workflow
现在“最强”的AI模型,能不能替代医生门诊?一个AI产品经理的实际测试
3 6 Ke·2025-07-27 00:46

2025年,我带着我的团队在做AI与空间计算产品研发,同时自己也是AI模型的重度使用者。因为博士研究的科研需求,我付费了Gemini、X、GPT这类模 型主流国际模型,将日常的博士研究工作、个人的产品研发工作,以及生活健康诊断都放在AI大模型上。 如下是7月份的模型排行分数,可以看到Grok4领先,随后就是国际模型,国内模型中,开源模型DEEPSEEK得到最高分。 | MODEL TJ | CREATOR 14 | CONTEXT | ARTIFICIAL ANALYSIS | BLENDED | MEDIAN | MEDIAN 11 | | --- | --- | --- | --- | --- | --- | --- | | | | WINDOW | INTELLIGENCE INDEX | USD/1M Tokens | Tokens/s | First Chunk (s) | | Grok 4 | ×1 | 256k | 73 | $6.00 | 74.5 | 12.12 | | o3-pro | OpenAl | 200k | 71 | $35.00 | | | | Gemini 2.5 Pro | ...