--reset

--inplace=true,false
--tag=abx,axb

# training
--dir=FWD_D,BWD_DW
--dt=f32,bf16
--flags=,G,S,C,H,R,GS,GR,SR,GSR,GCHR
--batch=shapes_ci
## no scaleshift support for backward_data
--dir=BWD_D
--flags=,G,R,GR
--batch=shapes_ci

# inference
--dir=FWD_I

--dt=f32,bf16,f16
--flags=,G,S,GS,GH
--attr-post-ops=,relu,relu:-1
--batch=shapes_ci
--attr-post-ops=

--dt=f16
--flags=,G,S,R,GS,GR,SR,GSR
--batch=shapes_ci

--dt=s8
--flags=G,GS,GR,GSR,GC
--batch=shapes_ci

# BN+Add+Relu fusion
--reset
--mb=2
--dt=s8
--dir=FWD_I             --flags=GSA             --batch=shapes_ci
--dt=f32,bf16
--dir=FWD_D,BWD_DW      --flags=A,SA,GSA        --batch=shapes_ci
