Workflow
iDEAL
icon
Search documents
一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
量子位· 2025-06-10 07:35
IDEAL团队 投稿 量子位 | 公众号 QbitAI 大幅缓解LLM偏科,只需调整SFT训练集的组成。 本来不擅长coding的Llama 3.1-8B,代码能力明显提升。 上海交大&上海AI Lab联合团队提出创新方法 IDEAL ,可显著提升LLM在多种不同领域上的综合性能。 此外,研究还有一些重要发现,比如: 具体来看—— IDEAL方法 问题建模: 首先按照不同 的领域准备高质量的训练数据集: , 并给出对应的用于验证的验证集: 。通过在训练集上面训练模型θ,获得训练集上的最优参数:θ 论文 希望在验证 集上的损失达到最小。为了能够方便的调整训练集,论文引入了对应的变量β ,并将这个优化问题 显示地建模了出来: SFT后LLM部分能力甚至退化 大型语言模型 (LLM) 凭借其强大的理解和逻辑推理能力,在多个领域展现了惊人的能力。除了模型参数量的增大, 高质量的数据是公认的LLM性能提升最关键的影响因素。 当对模型进行监督微调(SFT)时,研究人员发现 LLM在多任务场景下常出现"偏科"现象 ——部分能力突出而部分 能力并未涨进,甚至退化。这种不平衡的现象导致大模型在不同的领域上能力不同,进而影响用户 ...
一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
量子位· 2025-06-10 07:35AI Processing
IDEAL团队 投稿 量子位 | 公众号 QbitAI 大幅缓解LLM偏科,只需调整SFT训练集的组成。 本来不擅长coding的Llama 3.1-8B,代码能力明显提升。 上海交大&上海AI Lab联合团队提出创新方法 IDEAL ,可显著提升LLM在多种不同领域上的综合性能。 此外,研究还有一些重要发现,比如: 具体来看—— SFT后LLM部分能力甚至退化 大型语言模型 (LLM) 凭借其强大的理解和逻辑推理能力,在多个领域展现了惊人的能力。除了模型参数量的增大, 高质量的数据是公认的LLM性能提升最关键的影响因素。 当对模型进行监督微调(SFT)时,研究人员发现 LLM在多任务场景下常出现"偏科"现象 ——部分能力突出而部分 能力并未涨进,甚至退化。这种不平衡的现象导致大模型在不同的领域上能力不同,进而影响用户体验。 上海交大和上海AI Lab的研究者迅速将目光聚焦到SFT训练的训练集上,是否可以通过调整训练集的组成来缓解LLM 偏科的情况?直觉上来看,直接将LLM的弱势科目的训练数据增加一倍,就可以让最后的结果发生变化。但是,由于 训练数据之间的耦合关系,研究者通过建模量化每个领域数据对于最终结果的 ...
综述丨电邮封锁事件引担忧 荷兰讨论摆脱对美技术依赖
Xin Hua She· 2025-05-21 07:41
Group 1 - The email account of Karim Khan, the chief prosecutor of the International Criminal Court in The Hague, was blocked by Microsoft, raising concerns about the monopoly of American tech companies in the Netherlands [1] - The incident has prompted discussions in the Netherlands about reducing reliance on American technology, leading to a movement towards "de-Microsoftization" [1] - At least 10 key public institutions in the Netherlands have approached local cloud service provider Intermax Group to seek alternatives to American cloud services [1] Group 2 - Transitioning away from Microsoft is challenging due to deep integration of its systems within many government departments, which have developed a "path dependency" on Microsoft technologies [2] - The Dutch Ministry of the Interior is reassessing its reliance on Microsoft and exploring alternative technologies from France and Germany, although current projects still depend on Microsoft software [2] - Local companies are assisting hospitals and government agencies in storing email copies locally to mitigate risks associated with potential service interruptions from Microsoft [2] Group 3 - The Dutch Central Bank has raised alarms about the national security risks posed by the heavy reliance on American tech companies, particularly in the financial sector [3] - The online payment system iDEAL, while appearing to be Dutch, relies on key technologies controlled by two American companies that dominate over 60% of the European market [3] - There is significant dependence on American companies like Amazon, Google, and Microsoft for storing and managing sensitive data across Dutch banks, businesses, and government institutions [3]
Airwallex空中云汇发布六大市场出海策略 解码全球支付趋势
Zhong Jin Zai Xian· 2025-04-27 08:12
"65%的Z世代和千禧一代会因为商家提供先买后付而购买更多或者原本购买意愿度不高的商品,先买后 付,如Klarna,Afterpay,在奢侈品、大额消费品等类目和年轻消费者赛道上展现出增长潜 力。"Airwallex空中云汇中国区市场负责人唐晓非在第三届跨境卖家大会上表示。 2024年,中国跨境电商进出口2.63万亿元,同比增长10.8%,占进出口规模总量比重6%。据德国数据调 研机构Statista的预测,全球跨境电商市场规模还将继续上升:到2029年,全球电商总规模将增长至5.9 万亿美元,每年增速达到8.02%,其中美国、欧洲、英国和东南亚市场均将实现不同幅度的增长。 为帮助更多企业捕捉跨境电商出海增长机遇,《出海策略研究》首次以企业出海目标区域为专题,覆盖 美国、欧洲、英国、中国香港、东南亚和澳新地区六大核心市场,基于对全球11个国家和地区11000名 跨境线上消费者的深度调研,揭示了横跨4个年龄段的消费趋势。 研究显示,跨境购物受到各个年龄段消费者普遍欢迎,年轻消费群体接受度达93%。就跨境购物的主要 渠道来看,78%的受访者偏好包括亚马逊在内的跨境电商购物平台。另有15%和7%的受访者倾向于独立 ...