Workflow
KernelCAT
icon
Search documents
【新晋会员风采】智子芯元加入深圳市人工智能行业协会
Sou Hu Cai Jing· 2026-02-06 08:27
企业简介 智子芯元(深圳)科技有限公司由深圳市大数据研究院孵化,成立仅5个月。公司专注于以"数学+AI"优化AI计算,通过自动化方式生成高性能算子,持 续推动算力底层创新。 智子芯元团队构成反映了深圳产学研融合的独特优势。丁添本人是华为2012实验室"黑盒优化"方向的前技术领军;核心成员还包括前一线大模型公司的 CTO和头部芯片厂商的算子专家,研发团队近半数拥有IMO/ICPC国际数学与计算机竞赛金牌。同时这支团队与香港中文大学(深圳)、深圳市大数据研 究院保持着紧密联系。罗智泉院士不仅担任公司首席技术顾问,其运筹优化领域的学术思想也直接指导着技术路线的演进。 | 协作范式 | ... | | --- | --- | | 针对不同的工作习惯,我们提供 原生命令行 和 | → ~ kernelcat optimize ./attention_layer.cu | | 可视化协作 双重支持,你总能找到最顺手的工 | > Analysis started ... target: NVIDIA A100 | | 具。 | > Constraints loaded: Max Latency < 5ms | | | > ...
天下苦CUDA久矣,又一国产方案上桌了
量子位· 2026-01-30 13:34
允中 发自 凹非寺 量子位 | 公众号 QbitAI 国产算力基建跑了这么多年,大家最关心的逻辑一直没变:芯片够不够多? 但对开发者来说,真正扎心的问题其实是: 好不好使? 如果把AI开发比作做饭,现在的尴尬是—— 国产锅(硬件) 虽然越来越多了,但大部分大厨还是只习惯用那套 进口调料包(生态) 。 这正是当下AI落地最真实的一幕。 模型层繁花似锦,底层却隐忧重重。大家在参数规模上轮番刷新纪录,回过头来却发现,最难摆脱的还是那套已经长进骨子里的开发流程。 △ 图片由AI生成 算力只是敲门砖,真正的胜负手,是那段 算法与硬件之间的"翻译权" 。 其中最关键的一环,正是 高性能算子的开发 。 算子(Kernel),是连接AI算法与计算芯片的"翻译官":它将算法转化为硬件可执行的指令,决定了AI模型的推理速度、能耗与兼容性。 说白了,如果拿不到这支"翻译笔",再强悍的国产硬件,也只能像是一座无法与外界沟通的孤岛。 终于,那个让开发者喊了无数次 "天下苦CUDA久矣" 的僵局,现在迎来了一个不一样 的 国产答案 。 KernelCAT:计算加速专家级别的Agent 这几年,AI领域的热闹几乎是肉眼可见的。 模型在密集 ...