cann/asc-devkit ReduceProd临时空间接口
GetReduceProdMaxMinTmpSize【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明kernel侧ReduceProd接口的计算需要开发者预留/申请临时空间本接口用于在host侧获取预留/申请的最大最小临时空间大小开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。为保证功能正确预留/申请的临时空间大小不能小于最小临时空间大小。在最小临时空间-最大临时空间范围内随着临时空间增大kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能开发者可以根据实际的内存使用情况进行空间预留/申请。该接口最大临时空间当前等于最小临时空间。函数原型void GetReduceProdMaxMinTmpSize(const ge::Shape srcShape, const ge::DataType dataType, ReducePattern pattern, bool isSrcInnerPad, bool isReuseSource, uint32_t maxValue, uint32_t minValue)参数说明表 1接口参数列表接口输入/输出功能srcShape输入输入数据的shape大小参数取值与ReduceProd接口的srcShape参数保持一致。dataType输入输入的数据类型ge::DataType类型当前支持的数据类型与ReduceProd接口的模板参数T保持一致。pattern输入用于指定ReduceProd的计算轴。ReducePattern类型该类型的定义如下包括Reduce轴和Normal轴。pattern由与输入向量维度数量相同的A、R字母组合形成字母A表示Normal轴R表示Reduce轴。该参数的取值与ReduceProd接口的pattern参数保持一致当前只支持取值为AscendC::ReducePattern::ARAscendC::ReducePattern::RA。enum class ReducePattern : uint32_t { AR 0, RA 1, R, ARA, ARAR, ARARA, ARARAR, ARARARA, ARARARAR, ARARARARA, RAR, RARA, RARAR, RARARA, RARARAR, RARARARA, };isSrcInnerPad输入表示实际需要计算的最内层轴数据是否32Bytes对齐参数取值与ReduceProd接口的isSrcInnerPad参数保持一致。isReuseSource输入是否复用源操作数输入的空间参数取值与ReduceProd接口的isReuseSource参数保持一致。maxValue输出ReduceProd接口能完成计算所需的最大临时空间大小超出该值的空间不会被该接口使用。说明maxValue仅作为参考值有可能大于Unified Buffer剩余空间的大小该场景下开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。minValue输出ReduceProd接口能完成计算所需最小临时空间大小。为保证功能正确接口计算时预留/申请的临时空间不能小于该数值。返回值说明无约束说明无调用示例完整的调用样例请参考更多样例。// 输入shape为16*32的矩阵;算子输入的数据类型为float;isReuseSource传入默认值false uint32_t maxSize; uint32_t minSize; auto shape ge::Shape({ 16, 32 }); AscendC::GetReduceProdMaxMinTmpSize(shape, ge::DataType::DT_FLOAT, AscendC::ReducePattern::AR, true, false, maxSize, minSize);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考