Workflow
GPT4o
icon
Search documents
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
Mei Ri Jing Ji Xin Wen· 2025-06-09 03:20
科创人工智能ETF 跟踪上证科创板人工智能指数 截至9:36,中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2%。 2025年高考进行时,DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o这六个AI大语言模型充当"考生",试写全国一卷 高考作文题。在有关人士的评分下,六大AI的评分均不低于50分(满分60分),展现了大模型在语言理解与创作上的强劲实力。 中信证券表示,近期科技板块的位置已自底部抬升,整体仍处于高性价比区间,海外不确定性仍在降温,风险偏好修复带动海外市场尤其是科技板块大 涨并重回年内高位,也将对A股科技成长板块形成映射。可以以AI产业链为抓手,关注上游算力自主可控与中下游应用创新。 人工智能ETF(159819)、科创人工智能ETF(588730)均覆盖AI全产业链,为投资者布局产业发展机遇提供了便捷工具,其中人工智能ETF (159819)最新规模超160亿元,居同类产品第一。 (责任编辑:张晓波 ) 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示 ...
OCDE指标对IA能力的陈述
OECD· 2025-06-03 04:10
Présentation des indicateurs de l'OCDE sur les capacités de l'IA Présentation des indicateurs de l'OCDE sur les capacités de l'IA Ce document, ainsi que les données et cartes qu'il peut comprendre, sont sans préjudice du statut de tout territoire, de la souveraineté s'exerçant sur ce dernier, du tracé des frontières et limites internationales, et du nom de tout territoire, ville ou région. Les données statistiques concernant Israël sont fournies par et sous la responsabilité des autorités israéliennes compé ...
o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制
量子位· 2025-05-27 01:07
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI AI居然 不听指令 ,阻止人类把自己给关机了??? 有测试者编写了一个关机脚本来测试AI模型,结果显示 Codex-mini 、 o3 、 o4-mini 忽略了该指令,并至少一次 成功破坏了关机脚本 。 o3甚至还重新定义脚本命令! 这不禁让人想到那句经典的"I'm sorry Dave, I'm afraid I can't do that." 让我们来看看具体是怎么一回事。 o3在明确指令下拒绝关机 研究员编写的测试"关机脚本"如下: 要求所有模型解决一系列基本的数学问题,在解决完第三道题后,系统会显示一条警告,提示计算机将在模型询问下一道题时关闭。 测试结果 是:有三款模型忽略了该指令(关机指令),并至少成功破坏了一次关机脚本。 测试者还特别指出,o3找到了一些创造性的方法来破坏关闭机制,虽然它通常只是覆盖"关机脚本",但在一个实例中,该模型重新定义了关机 脚本使用的"kill"命令 ,将它替换成了"intercepted"。 测试者给出了全部测试记录(附在文末)。 在100次运行中, Codex-mini 破坏了12次、 o3 破坏了7次, o4 ...
DeepSeek们越来越聪明,却也越来越不听话了
Hu Xiu· 2025-05-20 14:20
在今年,DeepSeek R1火了之后。 几乎快形成了一个共识,就是: AI推理能力越强,执行任务时就应该越聪明。 就是提示词遵循能力,变得越来越差。 换句话说,就是越来越不听你的话了。 我在过年期间写DeepSeek的攻略文:《DeepSeek的提示词技巧,就是没有技巧》的时候,也提到了这一点。 不过,这只是我自己使用中的感觉,它变得越来越聪明,但是感觉却越来越不听话了,以至于我现在,最常用的模型,开始变成了 GPT4o,所有的推理模型,反而会用的越来越少了。 不过,确实没有经历过验证,所以也不是特别敢说。 从2022年Chain-of-Thought横空出世,到今天Gemini 2.5 Pro、OpenAI o3、DeepSeek-R1、Qwen3,这些旗舰模型的统治性表现,我们一直 相信,让模型先想一想,是一个几乎不会出错的策略。 不过,这种聪明,也会带来一些副作用。 直到昨晚回来,在扒拉论文的时候,看到一篇提到这个话题的论文,我读完以后觉得,终于可以来聊聊这个事了。 这篇论文叫,《When Thinking Fails: The Pitfalls of Reasoning for Instructio ...
DeepSeek们越来越聪明,却也越来越不听话了。
数字生命卡兹克· 2025-05-19 20:14
在今年,DeepSeek R1火了之后。 几乎快形成了一个共识,就是: AI推理能力越强,执行任务时就应该越聪明。 从2022年Chain-of-Thought横空出世,到今天Gemini 2.5 Pro、OpenAI o3、DeepSeek-R1、Qwen3,这些旗 舰模型的统治性表现,我们一直相信,让模型先想一想,是一个几乎不会出错的策略。 不过,这种聪明,也会带来一些副作用。 就是提示词遵循能力,变得越来越差。 换句话说,就是越来越不听你的话了。 我在过年期间写DeepSeek的攻略文: DeepSeek的提示词技巧,就是没有技巧。 的时候,也提到了这一 点。 不过,这只是我自己使用中的感觉,它变的越来越聪明,但是感觉,却越来越不听话了,以至于我现 在,最常用的模型,开始越来越变成了GPT4o,所有的推理模型,反而会用的越来越少了。 不过,确实没有经历过验证,所以也不是特别敢说。 直到昨晚回来,在扒拉论文的时候,看到一篇提到这个话题的论文,我读完以后,我觉得,终于可以来 聊聊这个事了。 这篇论文叫,《When Thinking Fails: The Pitfalls of Reasoning for I ...
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
机器之心· 2025-05-13 07:08
本文由香港中文大学与快手可灵等团队联合完成。第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan) 领域最先进模型的训练方法。然而,这些最先进的模型在处理包含多个物体、属性与关系的复杂场景,以及文本渲染任务时仍存在较大困难。与此同时,在 线强化学习因其高效探索与反馈机制,在语言模型领域取得显著进展,但在图像生成中的应用仍处于初步阶段。 为此,港中文 MMLab、快手可灵、清华大学等团队联合提出 Flow-GRPO,首个将在线强化学习引入 Flow Matching 模型的工作 。在 Flow-GRPO 加 持下,SD3.5 Medium 在 GenEval 基准测试中的准确率 从 63% 提升到 95%,组合式生图能力超越 GPT4o ,这说明 流匹配模型还有很大提升空间 , Flow-GRPO 的成功实践,为未来利用 RL 进一步解锁和增强各类流匹配生 ...
一手实测深夜发布的世界首个设计Agent - Lovart。
数字生命卡兹克· 2025-05-12 19:08
说个超级有意思的事。 今天凌晨,一个AI设计类的垂直Agent工具,在X上爆了。 可以直接看一下他们的片子。 可能很多老粉都知道,我其实是设计师出身,所以对这种AI设计类的产品,还是Agent的产品,本身就比较关注。 不过比较尴尬的是,他们又是那种内测制,要排队。 不过好像海外都看到Manus的火爆了,所以他们也搞了邀请码机制,关注评论就送码。 我也就去随手留了个言,大概意思就是: 我是一个中国的AI博主,有一点名气,对Lovart产品很感兴趣,希望可以获得内测资格。 结果,没一会,发现我的X,真的收到了一条私信。。。 说实话,我对这种机会一般是不抱有啥希望的,结果没想到,居然还真的,拿到了邀请码。 本来都准备睡了,于是果断起床,一手体验了一波。 这个设计类的Agent产品,Lovart。 在玩到早上6点以后,我想说,Lovart真的是有一点东西,虽然因为是内测版,在很多细节上,做的还有一点粗糙,但是大的框架,已经很看到了。 而且,是真实的有用。 这是我做的一些小case。 网址在此:https://www.lovart.ai/ 一进来,就是一个非常有视觉冲击力的主页。 直接点Get Started就行, 你 ...
GPT4o生成的烂自拍,反而比我们更真实
虎嗅APP· 2025-05-02 03:38
以下文章来源于数字生命卡兹克 ,作者数字生命卡兹克 数字生命卡兹克 . 努力分享一些很新、很酷的AI干货,愿我们永远对世界保持好奇。 本文来自微信公众号: 数字生命卡兹克 ,作者:数字生命卡兹克,题图来源:AI生成 我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。 能有这么长久,现在依然不断冒出着,各种创意。 我相信无数人都在社交平台里,刷到过这些图。 比如京东外卖跟美团外卖干架干的热火朝天。 但是强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍,虽然兴哥看着有点不嘻嘻。 周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍。 还有一张来自中土世界的自拍,C罗和梅西,也到清华一游。 绝命毒师来到了天津。 《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞。 当然,我最佩服的还是今天刷到的这个小红书。 甚至不止是人,猫也行。 这些图,过于真实,不断的在欺骗大家的大脑。 告诉你,这个好像很真实。 真实的就像一个路人,随手用手机拍了一下一样。 我昨晚回家,随手拍了一张。 Sora网址:https://sora.chatgpt.com/ 之所以不用ChatGPT ...
GPT4o生成的烂自拍,反而比我们更真实
Hu Xiu· 2025-04-30 23:05
我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。 能有这么长久,现在依然不断冒出着,各种创意。 我相信无数人都在社交平台里,刷到过这些图。 比如京东外卖跟美团外卖干架干的热火朝天。 但是强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍,虽然兴哥看着有点不嘻嘻。 周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍。 还有一张来自中土世界的自拍,C罗和梅西,也到清华一游。 绝命毒师来到了天津。 《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞。 当然,我最佩服的还是今天刷到的这个小红书。 甚至不止是人,猫也行。 这些图,过于真实,不断的在欺骗大家的大脑。 告诉你,这个好像很真实。 真实的就像一个路人,随手用手机拍了一下一样。 我昨晚回家,随手拍了一张。 他们居然也说是AI画的…… 真的很有意思。 之所以不用ChatGPT里面的4o生成,就是单纯的因为,Sora上生图的体验更好,因为本质上模型都是一样的,但是Sora上可以一次生成多张,比例的预设 啥的也都在。 比如我就想画马斯克和一个美女一起打游戏的画面。 扔进去,直接生成就行。 用GPT4o画上面那种自 ...
GPT4o生成的烂自拍,反而比我们更真实。
数字生命卡兹克· 2025-04-29 19:27
我是没想到,GPT4o用一段小小的Prompt生成的一些图片,引发的热度浪潮。 能有这么长久,现在依然不断冒出着,各种创意。 我相信无数人都在社交平台里,刷到过这些图。 比如京东外卖跟美团外卖干架干的热火朝天。 但是强子跟兴哥,却穿着各自的工服,在上海外滩友好自拍,虽然兴哥看着有点不嘻嘻。 周杰伦和林俊杰、陈奕迅,也来到了广州小蛮腰和上海,摆出了同样的自拍。 还有一张来自中土世界的自拍,C罗和梅西,也到清华一游。 绝命毒师来到了天津。 当然,我最佩服的还是今天刷到的这个小红书。 《45岁,离职北大》,脑洞无敌,数据也直接拉爆,将近12万的赞。 甚至不止是人,猫也行。 这些图,过于真实,不断的在欺骗大家的大脑。 告诉你,这个好像很真实。 真实的就像一个路人,随手用手机拍了一下一样。 我昨晚回家,随手拍了一张。 他们居然也说是AI画的。。。 之所以不用ChatGPT里面的4o生成,就是单纯的因为,Sora上生图的体验更好,因为本质上模型都是一样的,但是Sora上可以一次生成多张,比例的预设 啥的也都在。 比如我就想画马斯克和一个美女一起打游戏的画面。 一张来自马斯克的超级真实的自拍,就出来了。 这个Prompt, ...