Name Mode Size Raw
..
f add.cl 0100644 5.0 KB raw
f add_id.cl 0100644 1.4 KB raw
f argsort.cl 0100644 2.7 KB raw
f clamp.cl 0100644 649 B raw
f concat.cl 0100644 1.5 KB raw
f conv2d.cl 0100644 6.8 KB raw
f conv2d_f16_f32.cl 0100644 6.5 KB raw
f cpy.cl 0100644 5.0 KB raw
f cvt.cl 0100644 11.9 KB raw
f diag_mask_inf.cl 0100644 1.6 KB raw
f div.cl 0100644 3.7 KB raw
f embed_kernel.py 0100644 477 B raw
f expm1.cl 0100644 2.5 KB raw
f fill.cl 0100644 465 B raw
f flash_attn_f16.cl 0100644 13.5 KB raw
f flash_attn_f32.cl 0100644 13.5 KB raw
f flash_attn_f32_f16.cl 0100644 13.7 KB raw
f gelu.cl 0100644 2.5 KB raw
f gemm_moe_mxfp4_f32.cl 0100644 6.2 KB raw
f gemv_moe_mxfp4_f32.cl 0100644 5.8 KB raw
f gemv_noshuffle.cl 0100644 15.6 KB raw
f gemv_noshuffle_general.cl 0100644 15.7 KB raw
f gemv_noshuffle_general_q8_0_f32.cl 0100644 8.7 KB raw
f get_rows.cl 0100644 5.2 KB raw
f glu.cl 0100644 12.1 KB raw
f group_norm.cl 0100644 3.4 KB raw
f im2col_f16.cl 0100644 1.3 KB raw
f im2col_f32.cl 0100644 1.3 KB raw
f mean.cl 0100644 1.0 KB raw
f mul.cl 0100644 4.0 KB raw
f mul_mat_Ab_Bi_8x4.cl 0100644 6.0 KB raw
f mul_mat_f16_f32.cl 0100644 4.5 KB raw
f mul_mm_f16_f32_kq_kqv.cl 0100644 11.0 KB raw
f mul_mm_f16_f32_l4_lm.cl 0100644 4.7 KB raw
f mul_mm_f32_f32_l4_lm.cl 0100644 4.7 KB raw
f mul_mm_q6_k_f32_l4_lm.cl 0100644 5.3 KB raw
f mul_mm_q8_0_f32_8x4.cl 0100644 3.8 KB raw
f mul_mm_q8_0_f32_l4_lm.cl 0100644 4.9 KB raw
f mul_mv_f16_f16.cl 0100644 3.5 KB raw
f mul_mv_f16_f32.cl 0100644 3.5 KB raw
f mul_mv_f16_f32_1row.cl 0100644 2.9 KB raw
f mul_mv_f16_f32_l4.cl 0100644 2.5 KB raw
f mul_mv_f32_f32.cl 0100644 3.5 KB raw
f mul_mv_id_mxfp4_f32.cl 0100644 5.6 KB raw
f mul_mv_id_mxfp4_f32_flat.cl 0100644 5.7 KB raw
f mul_mv_id_q4_0_f32_8x_flat.cl 0100644 8.4 KB raw
f mul_mv_id_q8_0_f32.cl 0100644 3.9 KB raw
f mul_mv_id_q8_0_f32_flat.cl 0100644 6.5 KB raw
f mul_mv_mxfp4_f32.cl 0100644 4.5 KB raw
f mul_mv_mxfp4_f32_flat.cl 0100644 5.3 KB raw
f mul_mv_q4_0_f32.cl 0100644 6.2 KB raw
f mul_mv_q4_0_f32_1d_16x_flat.cl 0100644 10.1 KB raw
f mul_mv_q4_0_f32_1d_8x_flat.cl 0100644 8.1 KB raw
f mul_mv_q4_0_f32_8x_flat.cl 0100644 8.1 KB raw
f mul_mv_q4_0_f32_v.cl 0100644 7.2 KB raw
f mul_mv_q4_k_f32.cl 0100644 5.7 KB raw
f mul_mv_q6_k_f32.cl 0100644 7.2 KB raw
f mul_mv_q6_k_f32_flat.cl 0100644 6.9 KB raw
f mul_mv_q8_0_f32.cl 0100644 3.6 KB raw
f mul_mv_q8_0_f32_flat.cl 0100644 5.9 KB raw
f norm.cl 0100644 5.5 KB raw
f pad.cl 0100644 1.4 KB raw
f relu.cl 0100644 529 B raw
f repeat.cl 0100644 1.0 KB raw
f rms_norm.cl 0100644 5.6 KB raw
f rope.cl 0100644 23.8 KB raw
f scale.cl 0100644 774 B raw
f set_rows.cl 0100644 5.6 KB raw
f sigmoid.cl 0100644 876 B raw
f silu.cl 0100644 897 B raw
f softmax_4_f16.cl 0100644 3.1 KB raw
f softmax_4_f32.cl 0100644 3.1 KB raw
f softmax_f16.cl 0100644 3.1 KB raw
f softmax_f32.cl 0100644 3.1 KB raw
f softplus.cl 0100644 2.7 KB raw
f solve_tri.cl 0100644 1.6 KB raw
f sqr.cl 0100644 1.3 KB raw
f sqrt.cl 0100644 1.4 KB raw
f ssm_conv.cl 0100644 1.8 KB raw
f sub.cl 0100644 3.7 KB raw
f sum_rows.cl 0100644 1022 B raw
f tanh.cl 0100644 3.0 KB raw
f transpose.cl 0100644 4.3 KB raw
f tri.cl 0100644 898 B raw
f tsembd.cl 0100644 1.4 KB raw
f upscale.cl 0100644 3.7 KB raw