Transformer 模型推理在 FPGA 上的全流程加速实践:从模型量化到异构部署的工程实现
Transformer 模型推理在 FPGA 上的全流程加速实践:从模型量化到异构部署的工程实现
关键词
Transformer 加速、FPGA 推理、模型量化、硬件编译、Vivado HLS、Xilinx DPU、异构计算部署、边缘AI优化、低延迟推理、算子级流水线优化
摘要
Transformer 架构已成为 NLP、CV 和多模态任务中的主流模型选择,但其推理

