ZHCAEQ3 November 2024 F29H850TU , F29H859TU-Q1
软件流水线通过利用 C29 CPU 的 VLIW 架构,使环路的多个迭代并行执行。在图 3-7 中,软件流水线在 CFFT 中得到了演示。汇编代码是手写的,充分利用了完整的 128 位指令数据包,每个环路周期内并行执行 8 条指令。
当使用 -O3 优化时,C29 编译器会为 FIR 生成软件流水线代码,如图 3-8 所示。软件流水线加快了环路执行的速度。
编译器在 -O3 优化设置下生成软件流水线环路,可提高带有环路的代码的性能。