asc.language.basic.proposal_concat

asc.language.basic.proposal_concat(dst: LocalTensor, src: LocalTensor, repeat_time: int, mode_number: int) None

将连续元素合入Region Proposal内对应位置,每次迭代会将16个连续元素合入到16个Region Proposals的对应位置里。

对应的Ascend C函数原型

template <typename T>
__aicore__ inline void ProposalConcat(const LocalTensor<T>& dst, const LocalTensor<T>& src, const int32_t repeatTime, const int32_t modeNumber)

参数说明

  • dst:目的操作数。

  • src:源操作数。数据类型需要与dst保持一致。

  • repeat_time:重复迭代次数。每次迭代完成16个元素合入到16个Region Proposals里,下次迭代跳至相邻的下一组16个Region Proposals和下一组16个元素。取值范围:repeatTime∈[0,255]。

  • mode_number:合入位置参数,取值范围:modeNumber∈[0, 5] - 0:合入x1 - 1:合入y1 - 2:合入x2 - 3:合入y2 - 4:合入score - 5:合入label

约束说明

  • 用户需保证dst中存储的proposal数目大于等于实际所需数目,否则会存在tensor越界错误。

  • 用户需保证src中存储的元素大于等于实际所需数目,否则会存在tensor越界错误。

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。

调用示例

asc.proposal_concat(dst, src, repeat_time=2, mode_number=4)