Name: C7000 compiler: combining features
Uploaded: 2024-10-22T16:17:31.853-05:00
Description: This video shows how to combine several features of the C7000 compiler together.

Video Player is loading.

Current Time 0:00

Duration 15:57

Loaded: 1.04%

Stream Type LIVE

Remaining Time 15:57

C7000 编译器：组合功能

00:15:57 | 2025 年 2 月 5 日

本系列中的大多数其他视频重点介绍编译器的单一功能。此视频与众不同。它展示了如何将多个功能结合在一起。

资源

[音频标识] 欢迎观看 C7000 编译器系列的另一段视频。

大多数其他视频都专注于介绍编译器的单个功能，而本视频有所不同。

它展示了如何将多个功能结合在一起。

我是您的指导人员 George Mock。该系列的早期视频往往专注于单个功能。

本视频提出了一个问题，将所有这些功能组合在一起会是什么样子？本视频中有一个示例将这些功能组合在一起，包括流引擎、流地址生成器、可扩展向量、向量谓词、restrict 关键字和软件流水线。

当它们同时发生时，会是什么样子？版本 4.1.0.LTS 的自述文件有一个基于 memcpy 的示例。

该示例名为 memcpy_scalable_strm。

接口类似于标准 memcpy，但并不匹配。

本视频将介绍该示例，然后一次解释几行，最后一次性回顾所有内容。

欢迎观看本视频的示例。

它是一个函数模板，名为 memcpy_scalable_strm。

因此，其中一个输入是under control of this predicate.。

该类型是 S。S 代表标量。

它是一种基本数据类型，例如 short 或 float。

结果是某个长度为 len 的 S 数从 in 复制到 out。

另一个重要类型是 V。V 是 S 向量。

它的大小非常适合您要为其生成的 CPU。

因此，从 in 到 out 的复制以每次一个向量的方式发生。

cnt 是循环要运行的次数。

我们在这里计算它。

SE 用于从 in 读取。

SA 用于向 out 写入。

这些行配置 SE 和 SA。

这些行打开 SE 和 SA，让它们为工作做好准备。

这是执行复制的关键循环，然后关闭 SE 和 SA。接下来，视频一次查看几行代码。

这是前两行。

第一行包含头文件 c7x_scalable.h。

该头文件定义了可扩展类型和实用程序。

以下是示例中出现的两个。

using 指令意味着您不必像此处显示的那样实际编写 c7x::。

它不需要出现在 c7x_scalable.h 中的类型和实用程序的前面。

这与先前的许多示例中的做法不同，在这些示例中，总是要编写它们，完全写出某些实用程序或类型来自的命名空间。

那么现在您可以从两个方面来看待它。

您可以决定哪种编码标准最适合您的团队，然后遵守该编码标准。接下来的两行是函数模板的开头。

如果您不熟悉 C++ 模板，我认为您不会从本视频中学到这个概念。

这可能会让您感到困惑。

视频的其余部分实际上假设您特别了解 C++ 模板和函数模板。

因此，如果您是这种情况，我建议您现在停止观看视频，去掌握该主题，然后再回来。

好的，那么 S 是一个类型名称。

而且它必须是标量类型 -- int、short、float。

通常不会明确指定该类型，但有语法可以指定该类型。

通常在实例化函数模板时推断出该类型，当您调用它时，它会查看 in 指向的类型。

这就是 S 变成的类型， in 指向一些整数、一些 int 类型等，然后 S 是一个 int 等等。

restrict 关键字，您会注意到它出现在星号和指针变量的名称之间。

视频“restrict 关键字” 对此进行了介绍。

最后一个参数 len 与标准运行时支持库函数 memcpy 使用的参数不同。

对于 memcpy，len 是要复制的字符数。

对于我们此处的函数模板 memcpy_scalable_stream， len 是要复制的 S 的数量。

那么，如果 S 是 int 或 double 或任何 S，这就是要复制的 S 的数量。

这与复制的字符数不同。下一行要讨论的是定义可扩展向量类型。

该类型的名称为 V。V 表示向量。

由于它是 S 可扩展向量类型，因此每个元素都是一个 S，它的长度是特定 C7000 CPU 的理想元素数。

更具体地说，如果您的 CPU 有一个 512 位向量，并且您有 32 位宽 int，那么如果 S 是 int 类型，您将在一个 V 内拥有 16 个 S。从 in 到 out 的复制每次发生在一个 V 中。

接下来要讨论的两行计算向量加载和存储的次数。

那么 len 是一个函数参数。

element_count_of 返回向量 V 中的标量数量。我们以这种类型特征的方式使用它来获取该值。

那么 len 除以该值将得到初始 cnt。

然后，如果 S 和 V 的数量不是 len 的偶数倍，则 cnt 会增加。

好的，如果是这样，那么 cnt 会增加 1。

您在两个视频中都看到了类似的代码 -- 在关于流地址生成器的视频的最后，以及关于流引擎的视频的最后，都有一个类似的示例。

它们都对此处的计算执行了非常相似的操作。

如果 len 不是您在向量中执行的操作次数的偶数倍，则将其增加 1。

原因是类似的。

当我们开始讨论主循环代码时，我们会看到这一点。接下来要考虑的两行与配置 SE 和 SA 参数相关。

这些行调用创建具有所有配置默认值的结构的函数。

in_tmplt 用于 in 参数，out_tmplt 用于 out 参数。

我们将 SE 用于 in，因为 SE 是只读功能。

SA 可用于读取或写入。

在这个特定示例中，您将看到它将用于写入。接下来的几行继续配置 SE 和 SA 参数。

这是用于 S 的 in_tmplt。这是用于 SA 的 out_tmplt。

所有这些设置之前在有关 SE 或 SA 的视频中都讨论过，因此这里真的没有什么新东西可讨论。

不过，我要指出的是， SE 有一种额外的特性，那就是从默认值更改为其他值。

这是 eletype，元素类型字段，表示向量 V 中一个元素有多少位。

现在设置了 SE 和 SA 参数，是时候打开它们了。

在本例中，SE0 和 SA0 是使用的参数。

当您调用它们时，它们都使用已配置的参数结构。

SE 还需要基地址。

对于 SA，这稍后会发生。接下来是运行执行复制的循环。

变量 cnt 是将执行的加载和存储的次数。

它也是循环将运行的次数。

前三条语句用于创建变量。

这是一个向量、一个谓词、一个指向向量的指针。

然后，在同一条语句中对每个变量执行赋值。

先前的视频中介绍过这些函数调用。

但我要在这里再次回顾它们。

第一个用于流引擎。

接下来的两个用于流地址生成器。

它们都用于 0，因此是 SE0、SA0、SA0。

get_adv，我们读取 SE 的保持寄存器并使其前进到下一个。

因此，可以合理地认为该变量 temp 代表 SE0 的保持寄存器。

第二个，我们获取当前 SA 偏移量的谓词，将其分配给变量 pred。

第三个，我们获取当前 SA 偏移量，将基地址添加到它，并将其分配给变量 addr。

现在，在前面的示例中，这里会有一个星号，表示加载该地址的内容。

这不会发生在该条特定的语句中。

我们要将地址复制到该变量中。

vstore_pred 是 tmp 中的保持寄存器在此谓词的控制下存储到此地址的向量中的位置。

下一张幻灯片将对此进行更详细的说明。

但在此之前，我想指出，我已经为 S 的几个不同实例构建了此代码， S 是 unsigned char 或 int。

在我尝试的每种情况下，我都会得到此循环的 i，i 为 1。

因此，对于执行向量加载和向量存储的循环，如果有很多事情要做，将它们全部放入 i 中， i 为 1 是很好的结果。这正是我们想要的。

因此，我们能够使用 C7000 在一个周期内完成这么多的工作。这是该视频系列第一次使用 vstore_pred，所以我想仔细介绍一下。

tmp 是一个向量。

addr 是向量的地址。

pred 是谓词。

发生的事情是，在该谓词的控制下， tmp 的所有元素都被复制到该地址的向量中。

用伪代码表示，它看起来像这样。

此循环会遍历向量的每个元素。

如果相应的谓词不为 0，那么我们将该元素从 tmp 复制到该地址的元素中。

这看起来很多。

确实如此。

但 C7000 只需一条指令即可完成此操作。

这是 C7000 向量处理很能力强大的一个示例。

主循环结束后，所有存储器复制都已完成，您关闭 SE 和 SA。

函数模板到此结束。

逐行讨论已经完成，现在是回顾整个函数模板的好时机。

那么这是它的名称。

它从此处开始。

当您调用它时，会推断出此类型 S。

这些是参数。

这是您要读取的位置。

这是您要写入的位置。

这是加载和存储的 S 副本的数量。

此类型 V 是由 S 元素构成的向量。

其大小非常适合您为其生成的特定 C7000 CPU。

这些代码计算复制缓冲区所需的加载和存储次数。这些代码配置 SE 和 SA 参数。这些行打开 SE0 和 SA0。

请记住，SE0 用于读取，因为 SE 是只读的。

SA 用于写入。这是循环，执行加载和存储的关键中心循环。

此处的此语句从 in 加载整个向量。

然后，此处的该语句在此谓词的控制下将整个向量写入地址 addr。

请记住，为这些代码生成的软件流水线循环有一个 i， i 为 1，这意味着每个 CPU 周期都会加载和存储整个向量。

然后，函数模板以关闭 SE 和 SA 结束。本视频即将结束，在此提供两个参考网站。

第一个是该网址。

它有点长，输入起来有点困难，所以我建议您在互联网中搜索 C7000 编译器。

我尝试过使用几个不同的搜索引擎进行该搜索，我得到的第一个结果都是该网址。

无论您如何进入该网址，您都来到 C7000 编译器的主页。

在这里，您可以下载编译器，访问手册和更多类似的详细信息。

第二个参考网站是 e2e.ti.com。

这里供客户提出有关任何 TI 产品的问题，包括 C7000 编译器。

如果问题与编译器有关，将由我来回答。

感谢您观看 C7000 编译器系列视频之一的本视频。

C7000 编译器：组合功能

资源

观看视频

产品

应用