核开发

Search documents
中朝贸易额上半年增长30%
日经中文网· 2025-07-23 07:26
在横跨中国和朝鲜边境的铁桥上通行的卡车 在美国和韩国采取与朝鲜对话路线的背景下,中方意在以中朝贸易为杠杆,维持对地区局势的主 导权。 中国海关总署7月18日公布的数据显示,2025年上半年中国对朝鲜出口额同比增长33%,达10亿 5048万美元,来自朝鲜的进口额同比增长20%,达2亿1027万美元。 中国方面的贸易相关人士表示,建筑的内部装饰材料的出口表现强劲。从中国海关总署公布的1 ~5月各品类的出口金额来看,壁纸类增至2024年的2.3倍,塑料家具也增至2倍。 据悉,朝鲜在2024年夏季遭受洪水侵袭的北部地区重建了大量住宅,从2025年初开始正式开始内 部装修。6月下旬,可容纳2万人的海滨度假村在朝鲜东部竣工。可能是应朝鲜的要求,中方允许 出口建筑用品,从而推动了贸易额的上升。 除贸易之外,中国还将扩大包括游客在内的人员往来。韩国联合通讯社7月16日报道称,朝鲜国 家观光总局运营的网站上登载的"国际列车时刻表"中,新增了连接朝鲜首都平壤和中国首都北京 的国际线路信息。 两国首都之间的旅客列车因新冠疫情影响而长期停运。如果恢复运行,将是5年半以来首次。连 接平壤和中国辽宁省丹东的线路也出现在该时间表上。 中 ...
无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了
量子位· 2025-07-11 06:16
西风 发自 凹非寺 量子位 | 公众号 QbitAI 无需CUDA代码,给H100加速33%-50% ! Flash Attention、Mamba作者之一 Tr i Da o 的新作火了。 他和两位普林斯顿CS博士生提出了 一个名叫 QuACK 的新SOL内存绑定内核库 ,借助CuTe-DSL,完全用Python写,一点CUDA C++代码 都没用到。 在带宽3TB/s的H100上,它的速度比像PyTorch的torch.compile、Liger这类已经过深度优化的库还要快33%-50%。 Tri Dao表示,让内存密集型的内核达到"光速"并非什么神秘技巧,只需把几个细节处理到位就行。 我很喜欢Phil Tillet对不同工具在生产力和性能方面各有取舍的观点,比如torch compile、triton、CUDA、PTX。 但CuTe-DSL以及类似的基于Python的DSL或许能改变这一局面,虽然目前还处于早期阶段。而且,说不定很快我们就能让大语言模型 来生成这些内核了! 新作一经发出,吸引不少大佬关注。 英伟达CUTLASS团队资深架构师Vijay 转发,自夸他们团队做的CuTe-DSL把各种细节都打 ...
怼天怼地的 Linux 之父,被另一大佬怼了:你就是歌姬吧!
程序员的那些事· 2025-07-09 00:55
Linus 对此十分不满,当即在邮件中表示:"看起来你又把合并窗口的本意给忘了。不能因为你发现了别的 Bug,就趁机开始往里加新特性"。简而言之,Linus 觉得 Kent 不守规矩 ,挑战了内核开发的流程共识。 转自:开源中国 因与维护者 Kent Overstreet 之间存在分歧,Linux 创始人 Linus Torvalds 威胁要将 Bcachefs 文件系统 从内核中移除出去。 Linus 在最新拉取评论中表示有可能在 6.17 合并窗口期间会与 Bcachefs 分道扬镳。 他给出的理由是双方的开发理念存在巨大分歧,Torvalds 说他甚至无法对 Bcachefs 的 bug 修复提出任何 质疑,好像他只能按照 Kent 的要求拉取代码,他说双方争吵之后的唯一共识是 "we're done" 。 事情的导火索发生在 Linux 6.16-rc 阶段。按惯例,内核合并窗口(merge window)一过,后续的 rc 版 本周期 只接受错误修复,不加入新功能 。 但 Kent 在 6.16-rc3 发布后不久提交通知,请求合入一个名为"journal-rewind"的新功能补丁。据称这是 为改 ...