CATLASS FlashAttention推理示例

张

张建站

2026/5/9 20:04:41

10分钟阅读

FlashAttentionInfer Example Readme【免费下载链接】catlass本项目是CANN的算子模板库提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass代码组织├── 23_flash_attention_infer │ ├── CMakeLists.txt # CMake构建配置文件 │ ├── gen_data.py │ ├── kernel_common.hpp │ ├── main.cpp │ ├── fai_kernel.cpp │ ├── fai_tiling.cpp │ └── README.md使用示例获取代码之后编译相应的算子可执行文件可参考quickstart接下来先执行gen_data.py生成测试样例测试用例需要从命令行输入, 执行该命令后会在当前路径下生成data目录包含算子的输入数据和用于精度验证的golden数据。然后执行算子这里要注意的是执行算子的输入shape和上面第一步生成数据的shape一致。以下是一个完整的shell脚本示例batch1 qSeqlen177 kvSeqlen512 numHeads1 kvHeads1 headSize128 isVariedLen0 maskType1 dtypebf16 cacheMode1 layout_dtype0 num_blocks2048 inner_prec0 lse_flag0 device0 function build() { rm -rf build rm -rf output bash scripts/build.sh 23_flash_attention_infer } function gen_data() { python3 examples/23_flash_attention_infer/gen_data.py $batch $qSeqlen $kvSeqlen $numHeads $kvHeads $headSize $isVariedLen $maskType $dtype $cacheMode $layout_dtype $num_blocks $inner_prec $lse_flag echo Data gen finished } function run_kernel() { echo Case: B $batch qS $qSeqlen kvS $kvSeqlen qN $numHeads kvN $kvHeads D $headSize mask $maskType cd output/bin/ ./23_flash_attention_infer $batch $qSeqlen $kvSeqlen $numHeads $kvHeads $headSize $isVariedLen $maskType --device $device --dtype $dtype } build gen_data run_kernel执行结果如下说明精度比对成功。Compare success.【免费下载链接】catlass本项目是CANN的算子模板库提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

AI赋能MEC安全：构建边缘计算智能防护体系的技术实践

1. 项目概述：当边缘计算遇上AI安全最近几年，我参与和观察了不少物联网和边缘计算的项目，一个越来越突出的感受是：安全这件事，正在从“事后补救”的消防员角色，转变为“主动免疫”的体系化工程。传统的安全方…...

2026/5/9 20:03:31 阅读更多 →

初次接触大模型API的开发者快速上手Taotoken的路径指南

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度初次接触大模型API的开发者快速上手Taotoken的路径指南对于初次接触大模型API的开发者来说，面对众多模型提供商、复杂…...

2026/5/9 20:03:14 阅读更多 →

基于BERTopic的AI研究主题聚类：从海量论文中挖掘可解释性与安全趋势

1. 项目概述：从海量论文中“看见”AI研究的脉络如果你和我一样，长期关注人工智能领域的前沿动态，一定会被一个现象所困扰：每天都有成百上千篇新论文发布在arXiv、ACL、NeurIPS等顶会预印本上。我们淹没在信息的海洋里，…...

2026/5/9 19:59:34 阅读更多 →

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 如果你正在为Zot…...

2026/5/7 22:07:22 阅读更多 →