FP8 is ~100 tflops faster when the kernel name has "cutlass" in it



Melden Sie sich an, um einen Kommentar hinzuzufügen