cann/hcomm通信域初始化API
HcclCommInitClusterInfo【免费下载链接】hcommHCOMMHuawei Communication是HCCL的通信基础库提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm产品支持情况Ascend 950PR/Ascend 950DT支持Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 训练系列产品/Atlas A2 推理系列产品支持Atlas 推理系列产品支持Atlas 训练系列产品支持[!NOTE]说明 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品仅支持Atlas 800T A2 训练服务器、Atlas 900 A2 PoD 集群基础单元、Atlas 200T A2 Box16 异构子框。 针对Atlas 推理系列产品仅支持Atlas 300I Duo 推理卡。功能说明基于rank table初始化HCCL创建HCCL通信域。Rank table文件是一个JSON格式的文件配置了参与集合通信的NPU资源信息关于rank table文件的配置可参见集群信息配置。函数原型HcclResult HcclCommInitClusterInfo(const char *clusterInfo, uint32_t rank, HcclComm *comm)参数说明参数名输入/输出描述clusterInfo输入Rank table的文件路径含文件名作为字符串最大长度为4096字节含结束符。rank输入本rank的id。需要注意此参数取值需要与rank table中对应的“rank_id”字段取值一致。comm输出将初始化后的通信域以指针的信息回传给调用者。HcclComm类型的定义可参见HcclComm。返回值HcclResult接口成功返回HCCL_SUCCESS其他失败。约束说明重复初始化会报错。调用示例// 设备资源初始化 aclInit(NULL); // rank table配置文件路径 char *rankTableFile /path/rank_table.json; // 指定集合通信操作使用的Device ID aclrtSetDevice(devId); // 创建通信域 HcclComm hcclComm; // 此样例以devId作为当前rank的rank id HcclCommInitClusterInfo(rankTableFile, devId, hcclComm); // 销毁通信域 HcclCommDestroy(hcclComm); // 设备资源去初始化 aclFinalize();【免费下载链接】hcommHCOMMHuawei Communication是HCCL的通信基础库提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考