src/fastertransformer/kernels/decoder_masked_multihead_attention /decoder_masked_multihead_attention_template.hpp:36 open this macro definition, it'll find a build error #763

pengl · 2023-10-11T08:47:23Z

Branch/Tag/Commit

main

Docker Image Version

nvcr.io/nvidia/pytorch:22.08-py3

GPU name

A10

CUDA Driver

515.65.01

Reproduced Steps

https://github.com/NVIDIA/FasterTransformer/blob/f0b5b8631806aedfbe0d844eb9a32202002dd463/src/fastertransformer/kernels/decoder_masked_multihead_attention/decoder_masked_multihead_attention_template.hpp#L38

open the macro "MMHA_USE_FP32_ACUM_FOR_LOGITS", it'll find compile errors.
how to open the macro? what else need to do more?

Tasks

Give feedback

No tasks being tracked yet.

Options

pengl added the bug Something isn't working label Oct 11, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

src/fastertransformer/kernels/decoder_masked_multihead_attention /decoder_masked_multihead_attention_template.hpp:36 open this macro definition, it'll find a build error #763

src/fastertransformer/kernels/decoder_masked_multihead_attention /decoder_masked_multihead_attention_template.hpp:36 open this macro definition, it'll find a build error #763

pengl commented Oct 11, 2023 •

edited

Tasks

src/fastertransformer/kernels/decoder_masked_multihead_attention /decoder_masked_multihead_attention_template.hpp:36 open this macro definition, it'll find a build error #763

src/fastertransformer/kernels/decoder_masked_multihead_attention /decoder_masked_multihead_attention_template.hpp:36 open this macro definition, it'll find a build error #763

Comments

pengl commented Oct 11, 2023 • edited

Branch/Tag/Commit

Docker Image Version

GPU name

CUDA Driver

Reproduced Steps

Tasks

pengl commented Oct 11, 2023 •

edited