5.18.5.1. sail.algo_yolox_post
针对YOLOX模型的后处理接口,内部使用线程池的方式实现。
5.18.5.1.1. __init__
- 接口形式:
def __init__( self, shape: list[int], network_w:int = 640, network_h:int = 640, max_queue_size: int=20)
参数说明:
shape: list[int]
输入参数。输入数据的shape。
network_w: int
输入参数。模型的输入宽度,默认为640。
network_h: int
输入参数。模型的输入宽度,默认为640。
max_queue_size: int
输入参数。缓存数据的最大长度。
5.18.5.1.2. push_npy
输入数据,只支持batchsize为1的输入,或者输入之前将数据拆分之后再送入接口。
- 接口形式:
def push_npy(self, channel_idx: int, image_idx: int, data: numpy.ndarray[Any, numpy.dtype[numpy.float_]], dete_threshold: float, nms_threshold: float, ost_w: int, ost_h: int, padding_left: int, padding_top: int, padding_width: int, padding_height: int) -> int
参数说明:
channel_idx: int
输入参数。输入图像的通道号。
image_idx: int
输入参数。输入图像的编号。
data: numpy.ndarray[Any, numpy.dtype[numpy.float_]]
输入参数。输入数据。
dete_threshold: float
输入参数。检测阈值。
nms_threshold: float
输入参数。nms阈值。
ost_w: int
输入参数。原始图片的宽。
ost_h: int
输入参数。 原始图片的高。
padding_left: int
输入参数。填充图像的起始点坐标x,参数可以通过通用预处理的接口中或者带有预处理的推理接口中获取,也可以自己计算。
padding_top: int
输入参数。填充图像的起始点坐标y,参数可以通过通用预处理的接口中或者带有预处理的推理接口中获取,也可以自己计算。
padding_width: int
输入参数。填充图像的宽度,参数可以通过通用预处理的接口中或者带有预处理的推理接口中获取,也可以自己计算。
padding_height: int
输入参数。填充图像的高度,参数可以通过通用预处理的接口中或者带有预处理的推理接口中获取,也可以自己计算。
返回值说明:
成功返回0,其他值表示失败。
5.18.5.1.3. push_data
输入数据,只支持batchsize为1的输入,或者输入之前将数据拆分之后再送入接口。
- 接口形式:
def push_data(self, channel_idx: list[int], image_idx: list[int], input_data: TensorPTRWithName, dete_threshold: list[float], nms_threshold: list[float], ost_w: list[int], ost_h: list[int], padding_attrs: list[list[int]]) -> int
参数说明:
channel_idx: int
输入参数。输入图像序列的通道号。
image_idx: int
输入参数。输入图像序列的编号。
input_data: TensorPTRWithName
输入参数。输入数据。
dete_threshold: float
输入参数。检测阈值序列。
nms_threshold: float
输入参数。nms阈值序列。
ost_w: int
输入参数。原始图片序列的宽。
ost_h: int
输入参数。 原始图片序列的高。
padding_attrs: list[list[int]]
输入参数。填充图像序列的属性列表,填充的起始点坐标x、起始点坐标y、尺度变换之后的宽度、尺度变换之后的高度。
返回值说明:
成功返回0,其他值表示失败。
5.18.5.1.4. get_result_npy
获取最终的检测结果
- 接口形式:
def get_result_npy(self) -> tuple[tuple[int, int, int, int, int, float],int, int]
返回值说明: tuple[tuple[left, top, right, bottom, class_id, score],channel_idx, image_idx]
left: int
检测结果最左x坐标。
top: int
检测结果最上y坐标。
right: int
检测结果最右x坐标。
bottom: int
检测结果最下y坐标。
class_id: int
检测结果的类别编号。
score: float
检测结果的分数。
channel_idx: int
原始图像的通道号。
image_idx: int
原始图像的编号。
- 示例代码:
import sophon.sail as sail import numpy as np if __name__ == '__main__': tpu_id = 0 handle = sail.Handle(tpu_id) image_name = "../../../sophon-demo/sample/YOLOX/datasets/test/3.jpg" bmodel_name = "../../../sophon-demo/sample/YOLOX/models/BM1684X/yolox_s_fp32_1b.bmodel" decoder = sail.Decoder(image_name,True,tpu_id) bmimg = decoder.read(handle) engine_image_pre_process = sail.EngineImagePreProcess(bmodel_name, tpu_id, 0) engine_image_pre_process.InitImagePreProcess(sail.sail_resize_type.BM_PADDING_TPU_LINEAR, True, 10, 10) engine_image_pre_process.SetPaddingAtrr(114,114,114,1) engine_image_pre_process.SetConvertAtrr(((1, 0), (1, 0), (1, 0))) ret = engine_image_pre_process.PushImage(0,0, bmimg) engine_image_pre_process output_tensor_map, ost_images, channels ,imageidxs, padding_atrr = engine_image_pre_process.GetBatchData(True) width_list = [] height_list= [] for index, channel in enumerate(channels): width_list.append(ost_images[index].width()) height_list.append(ost_images[index].height()) yolox_post = sail.algo_yolox_post([1, 8400, 85],640,640,10) dete_thresholds = np.ones(len(channels),dtype=np.float32) nms_thresholds = np.ones(len(channels),dtype=np.float32) dete_thresholds = 0.2*dete_thresholds nms_thresholds = 0.5*nms_thresholds ret = yolox_post.push_data(channels, imageidxs, output_tensor_map[0], dete_thresholds, nms_thresholds, width_list, height_list, padding_atrr) objs, channel, image_idx = yolox_post.get_result_npy() print(objs, channel, image_idx)