Csrot算子实现【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas概述BLAS Csrot算子实现。Csrot(复数向量旋转)算子实现了对两个复数向量的平面旋转运算是BLAS基础线性代数库中的核心算子之一。该算子实现了Givens旋转常用于QR分解、求解线性方程组和特征值计算等数值算法中。支持的产品Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品目录结构介绍├── csrot │ ├── CMakeLists.txt // 编译工程文件 │ ├── README.md // 说明文档 │ └── csrot_test.cpp // 算子调用样例算子描述算子功能Csrot算子实现了对两个复数向量的平面旋转。对应的数学表达式为x[i] c * x[i] s * y[i] y[i] c * y[i] - s * x[i] (使用原始x[i])其中 c cos(θ)s sin(θ)θ为旋转角度对应的接口为int aclblasCsrot(float *x, float *y, const int64_t n, const float c, const float s, void *stream);参数csrot 参数说明参数列表Param.Memoryin/out含义nin向量元素个数。chost/devicein旋转角度的余弦值。shost/devicein旋转角度的正弦值。xdevicein/out向量包含 n 个元素原地修改。ydevicein/out向量包含 n 个元素原地修改。算子规格算子类型(OpType)Csrot算子输入nameshapedata typeformatx, ynfloatND算子输出x, ynfloatND核函数名csrot_kernel算子实现将输入数据从x和y的GM地址分块搬运到UB进行旋转计算后再搬出到x和y所在的GM地址。调用实现使用内核调用符调用核函数。编译运行在本样例根目录下执行如下步骤编译并执行算子。配置环境变量请根据当前环境上CANN开发套件包的安装方式选择对应配置环境变量的命令。默认路径root用户安装CANN软件包source /usr/local/Ascend/cann/set_env.sh默认路径非root用户安装CANN软件包source $HOME/Ascend/cann/set_env.sh指定路径install_path安装CANN软件包source ${install_path}/cann/set_env.sh样例执行bash build.sh --opscsrot --run # --ops算子名 --run可选参数执行测试样例执行结果如下说明精度对比成功。[Success] Case accuracy is verification passed.【免费下载链接】ops-blas本项目是CANN提供的高性能线性代数计算以及轻量化GEMM调用算子库。项目地址: https://gitcode.com/cann/ops-blas创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考