Workflow
方法
icon
Search documents
[大模型实践] 卡比人贵时代的深度学习经验
自动驾驶之心· 2025-06-20 14:06
以下文章来源于刘聪NLP ,作者黄哲威 hzwer 刘聪NLP . NLP刘聪,如货币般流通!这里的刘聪,不会rapper,只发paper!长期关注AIGC前沿内容!还写过两 本书:ChatGPT原理与实战、大型语言模型实战指南!欢迎来讨论AI! 作者 | hzwer 黄哲威 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/22287171257 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>点击进入→ 自动驾驶之心 『大模型』技术交流群 本文只做学术分享,如有侵权,联系删文 评测的重要性 论文说自己的方法性能好,一般就是定量部分,要突出关键指标的提升;定性部分,着重强调新的现象和观察 太长不看版:大模型实验的一些新方法论: 选准关键指标 ,指导迭代方向。 识别真瓶颈 ,避免低效实验,验证强假设。 平衡大小实验 ,大实验找问题,小实验筛想法。 强化团队协作 ,整合资源,找比较优势。 (总结好像很套话,但真的努力写干货了,欢迎评论交流启发补充 "不要被表象所迷惑,要洞察事物的本质。" —— 亚里士多德 几年 ...
上海交大医疗器械医工创新转化工作坊,火热报名中!
思宇MedTech· 2025-06-20 11:17
一次创新思维的碰撞,一场探索医疗科技创新的合作之旅! 医生 ×CEO ×工程师 ×投资人 强强联合,破解医疗器械创新难题! 如果你对 医疗器械创新、医工结合、技术转化 充满兴趣,那么这次 上海交通大学医学院 × 附属医院 × 生物医 学工程学院 联合打造的 「医疗器械医工创新转化工作坊」 ,就是你的绝佳机会! 课程亮点 你将获得 适合人群: 培训信息 让医学痛点与工程技术深度融合,打造医疗创新产品,助力成果转化! 是否曾有一个医疗创新的想法,却不知如何落地? 是否苦于医生与工程技术团队难以有效协作? 是否希望掌握医疗器械从概念到市场的完整路径? Biodesign 医工创新方法论: 全球前沿医工创新模式,助力高效转化 顶级医工专家亲授: 上海交大医学院、附属医院、生物医学工程学院权威师资 需求挖掘 × 创意生成: 从临床实际出发,转化医学需求为创新解决方案 跨学科高端人脉圈: 医生、工程师、投资人共创,共享资源 ✅ 精准洞察 | 医疗器械产业趋势,抢占市场先机 ✅ 实战赋能 | 设计思维 × 跨学科合作,掌握创新转化路径 ✅ 高端社群 | 结识医生、科研人员、产业专家、投资人,助力职业发展 ✅ 项目曝光 | ...
全面合规计划:您的最佳实践清单
Refinitiv路孚特· 2025-06-19 02:01
在LSEG"与专家面对面"系列网络研讨会的最新一期中,深入剖析了实施全面合规计划的重要性,并为制定 更具主动性的风险管理策略提供了一系列最佳实践方面的见解。 以更少的资源做更多的事 如今,受监管实体正深陷一场"完美风暴":法规不断演变,尽职调查工作量与成本急剧攀升,而资源却极为 有限。据LSEG的研究显示,90%的受访者表示,过去三年间,他们所处理的增强尽职调查(EDD)请求数 量呈上升态势。 这些不断攀升的工作量给预算和资源带来了巨大压力。与此同时,合规团队必须确保客户准入流程以及交易 决策过程快速、无缝且具备成本效益。 所有这些情况都凸显出"以更少资源达成更多成效"的迫切需求。借助恰当的数据与技术手段,您便能够驾驭 这一复杂多变的风险局面。 5项最佳实践见解 01 采用基于风险的方法 采用基于风险的方法至关重要,因为资源是有限的。即使是最大的组织也没有无限的资源,这意味着您应该 将可用的预算、时间和精力投入到潜在风险最高的领域。 筛查是识别潜在风险的重要初始环节。一旦怀疑或发现风险,便需要以增强尽职调查(EDD)的形式开展 更深入的尽职调查工作。 增强尽职调查(EDD)的力度应与怀疑的风险程度相匹配,并应 ...
“隔年”防晒霜还能防紫外线吗
Ke Ji Ri Bao· 2025-06-19 01:11
那么,这些存放近一年的防晒霜是否安全有效?如何科学使用防晒霜?科技日报记者日前就此采访 了相关专家。 开封1年后SPF值或降低30%到50% "防晒霜外包装标注的2年至3年保质期,通常仅适用于未开封状态。"华东理工大学药学院研究员、 博士生导师张健介绍,严格来说,防晒霜的保质期分为未开封保质期和开封后保质期。未开封时,防晒 霜的稳定性较高,一般可存放2年至3年。不过开封后,防晒霜中的活性成分,尤其是阿伏苯宗、奥克立 林等化学防晒剂,容易受到光照、温度和氧气的影响而降解,导致产品防护能力减弱。实验数据显示, 开封超过一年的防晒霜,实际防晒系数(SPF)可能下降30%到50%。这意味着原本标注SPF50的防晒 霜,实际SPF值为25至35。 同时,开封时间较长的防晒霜可能微生物数量超标,易引发皮肤过敏。因此,张健建议,开封后的 防晒霜最好在半年内用完,最长不要超过一年。 "特别要提醒大家,开封后的防晒霜如果出现以下物理性状变化,可能已经变质。"张健说,如果产 品出现水油分离、结块或异常稀稠,说明其稳定性被破坏。正常防晒霜通常无味或带有轻微原料气味, 如果产品散发酸败味、刺鼻异味,可能已变质。如果防晒霜颜色变深或产 ...
【新华社】我国科学家把丹尼索瓦人同日推上两大顶刊
Xin Hua She· 2025-06-19 00:35
这次联合团队对这枚头骨化石开展了分子古生物学研究。基于创新性的古蛋白和古DNA分析方 法,联合团队发现哈尔滨古人类是丹尼索瓦人,且属于已知早期丹尼索瓦人支系。 "哈尔滨古人类的牙齿和颞骨均无任何的人类古DNA留存,而牙结石致密的矿化结构为古DNA保存 提供了相对封闭的微环境,我们另辟蹊径地从仅0.3毫克牙结石样本中筛选出古DNA片段。"付巧妹说。 这两项关键证据首次揭示了丹尼索瓦人较完整的头骨形态,并且证明丹尼索瓦人至少14.6万年前已 广泛分布在亚洲广大区域,创新性的研究方法也为从更新世人类化石恢复人类古DNA提供了新的可 能。 相关研究由中国科学院古脊椎动物与古人类研究所付巧妹研究员团队与河北地质大学季强教授团队 联合开展,通过自主建立的前沿古蛋白实验系统与创新的古DNA实验方案,在国际上首次将一枚近乎 完整的古人类头骨与神秘的丹尼索瓦人群关联起来,一举破解了丹尼索瓦人的形态之谜。 《细胞》评审专家评价:"研究提供了关键贡献——给了丹尼索瓦人一张'脸',也为其他亚洲化石 关联到丹尼索瓦人开辟了可能性。" 丹尼索瓦人是一支已灭绝的古人类,最早发现于2010年,与广泛分布在欧洲的尼安德特人是姐妹 群,对现代大 ...
重新讨论变局下的资产配置方法论系列(一):美元还能跌多久?
Minsheng Securities· 2025-06-18 12:42
Group 1: Macro Economic Insights - The narrative of a weakening dollar has become a common preference among risk-averse investors since Trump's administration, as significant depreciation of the dollar often leads to revaluation of non-dollar assets[1] - The macroeconomic narrative is a key driver of market direction, with the potential loss of reserve currency status being a significant concern, particularly due to the large debt burden of the U.S.[2] - Historical transitions of reserve currencies have presented substantial asset revaluation opportunities, with past examples showing significant depreciation of the current reserve currency relative to successors and precious metals[2] Group 2: U.S. Debt Analysis - The U.S. government debt burden has increased by 14.6% from 2019 to 2023, while household leverage has decreased by 3.1% and non-financial corporate leverage has decreased by 8.6%[3] - The U.S. government debt level was over 100% before the global pandemic, but concerns were minimal; post-pandemic, the debt has risen significantly, reflecting a societal "leverage transfer"[3] - The pressure from maturing U.S. government bonds is expected to peak in Q1 2027, with an estimated maturity amount of $9 to $10 trillion, compounded by a potential fiscal deficit stabilizing above 5%[5] Group 3: Future Projections - The next two years are critical for the U.S. debt cycle transition, influencing fiscal, monetary policies, and the dollar index[6] - Historical patterns indicate that the current dollar depreciation cycle may last until the end of 2027, with a potential initial rapid depreciation followed by a prolonged period of volatility[7] - Risks include extreme U.S. trade policies leading to faster and larger-than-expected dollar depreciation, which could exacerbate global economic slowdowns[7]
迈向人工智能的认识论六:破解人工智能思考的密码
3 6 Ke· 2025-06-18 11:52
Group 1 - The core insight reveals that higher-performing AI models tend to exhibit lower transparency, indicating a fundamental trade-off between capability and interpretability [12] - The measurement gap suggests that relying solely on behavioral assessments is insufficient to understand AI capabilities [12] - Current transformer architectures may impose inherent limitations on reliable reasoning transparency [12] Group 2 - The findings highlight the inadequacies of existing AI safety methods that depend on self-reporting by models, suggesting a need for alternative approaches [12] - The research emphasizes the importance of developing methods that do not rely on model cooperation or self-awareness for safety monitoring [12] - The exploration of mechanical understanding over behavioral evaluation is essential for advancing the field [12]
谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分
机器之心· 2025-06-18 09:34
Core Insights - The article discusses the significant gap between current LLMs (Large Language Models) and human expert-level performance in competitive programming [2][18]. - A new benchmark, LiveCodeBench Pro, was introduced to evaluate LLMs against high-quality programming problems sourced from top competitions [4][6]. Evaluation of LLMs - LLMs have shown impressive results in code generation, surpassing human averages in some benchmarks, particularly in competitive programming [2][12]. - However, when evaluated without external tools, the best-performing models achieved a pass rate of only 53% on medium difficulty problems and 0% on high difficulty problems [12][18]. Benchmark Details - LiveCodeBench Pro includes 584 high-quality problems from competitions like Codeforces, ICPC, and IOI, with continuous updates to mitigate data contamination [6][10]. - Problems are categorized by algorithm type, and the performance of models is analyzed based on their failure submissions [7][12]. Model Performance Analysis - The analysis revealed that LLMs perform well on implementation-heavy problems but struggle with complex algorithmic reasoning and edge case analysis [17][18]. - Knowledge-intensive and logic-intensive problems are areas where LLMs excel, while observation-intensive problems and case work present significant challenges [20][22][24]. Comparison with Human Performance - LLMs exhibit a higher rate of algorithmic logic errors compared to humans, while they make fewer implementation logic errors [27][30]. - The models' inability to handle edge cases and their reliance on external tools for high scores highlight their limitations in reasoning capabilities [17][30]. Impact of Multiple Attempts - Increasing the number of attempts (pass@k) significantly improves model performance, although high-difficulty problems remain unsolved [33][36]. - The difference in performance between models with terminal access and those without indicates that tool usage plays a crucial role in enhancing scores [34][36]. Reasoning Capability Comparison - Enabling reasoning capabilities in models leads to substantial improvements in performance, particularly in combinatorial mathematics and knowledge-intensive categories [38][41]. - However, the enhancement is limited in observation-intensive categories, raising questions about the effectiveness of current reasoning methods in these areas [42].
带队伍打胜仗,关键是做好这3点
3 6 Ke· 2025-06-17 04:18
带队伍打胜仗,关键点是什么?今天与你一起分享。 你有没有发现,很多团队,忙忙碌碌大半年,却始终没做出什么像样的成果? 为什么? 因为带队伍打胜仗,不是靠热情,不是靠熬夜,更不是靠"努力"二字,而是要方向对、方法对、干法 对。 今天,我们就来聊聊这个话题。 做正确的事:方向错了,一切白费 我们总以为只要拼命干、全力冲,就能赢。但对不起,方向错了,越努力,离目标越远。 在往前冲的时候,一定要提前搞清楚下面这两件事。 第一,为谁做? 很多的管理者,起点就是错的,产品做给谁都行,服务面向所有人,定位模糊得像一滩水。 老板说要"全民市场",运营总监说面向"90后",销售经理说要重点打"中年大妈"…… 结果团队里谁也说不清客户到底是谁,做出来的产品四不像,营销也乱七八糟。 打仗,第一件事,是明确"敌我"——我们到底服务谁? 华为的B端客户、苹果的高端用户、拼多多的下沉市场,都是精准清晰的用户定位。 谁是你心中的"第一优先"?这个问题不解决,后面做什么都白搭。 第二,做什么? 知道了为谁而做,接下来就要搞清楚,为他们提供什么了。 很多管理者带项目,自信心爆棚,"我觉得用户会喜欢","别人做这个火了,我们也做!" 结果,做出 ...
自然人电子税务局(扣缴端)缴税提示“当前税款状态不明”,应如何处理?
蓝色柳林财税室· 2025-06-17 01:12
审核:青岛市税务局纳税服务和宣传中心 编发:青岛市税务局纳税服务和宣传中心 来源 青岛税务 提示"当前税款状态不明"时需要重新获取欠款信息。根据操作界面不同,可以参考以 下方法: 代扣代缴模块 :点击"申报表报送"→" 更新 "按钮,然后点击"税款缴纳"→" 三方协议 缴税 ",获取到欠税信息再缴款。 生产经营模块 :点击"税款缴纳"→"三方协议缴税"→" 更新状态 ",获取到欠税信息再 缴款。 供稿:青岛税务 欢迎扫描下方二维码关注: 欢迎扫描下方二维码关注: 温馨提醒:蓝色柳林财税室为非官方平台,是由编者以学习笔记形式建立的平台,所有笔记写 作记录的文章及转发的法律法规仅供读者学习参考之用,并非实际办税费的标准,欢迎交流学 习,共同分享学习经验成果。文章版权归原作者所有,如有不妥,请联系删除。 ...