ZHCUAQ1F
july 2015 – april 2023
请先阅读
关于本手册
标记规则
相关文档
德州仪器 (TI) 提供的相关文档
商标
1
软件开发工具简介
1.1
软件开发工具概述
1.2
编译器接口
1.3
ANSI/ISO 标准
1.4
输出文件
1.5
实用程序
2
开始使用代码生成工具
2.1
Code Composer Studio 项目如何使用编译器
2.2
从命令行编译
3
使用 C/C++ 编译器
3.1
关于编译器
3.2
调用 C/C++ 编译器
3.3
使用选项更改编译器的行为
3.3.1
链接器选项
3.3.2
常用选项
3.3.3
其他有用的选项
3.3.4
运行时模型选项
3.3.5
选择目标 CPU 版本(--silicon_version 选项)
3.3.6
符号调试和分析选项
3.3.7
指定文件名
3.3.8
更改编译器解释文件名的方式
3.3.9
更改编译器处理 C 文件的方式
3.3.10
更改编译器解释和命名扩展名的方式
3.3.11
指定目录
3.3.12
汇编器选项
3.4
通过环境变量控制编译器
3.4.1
设置默认编译器选项 (C6X_C_OPTION)
3.4.2
命名一个或多个备用目录 (C6X_C_DIR)
3.5
控制预处理器
3.5.1
预先定义的宏名称
3.5.2
#include 文件的搜索路径
3.5.2.1
在 #include 文件搜索路径(--include_path 选项)中新增目录
3.5.3
支持#warning 和 #warn 指令
3.5.4
生成预处理列表文件(--preproc_only 选项)
3.5.5
预处理后继续编译(--preproc_with_compile 选项)
3.5.6
生成带有注释的预处理列表文件(--preproc_with_comment 选项)
3.5.7
生成带有行控制详细信息的预处理列表(--preproc_with_line 选项)
3.5.8
为 Make 实用程序生成预处理输出(--preproc_dependency 选项)
3.5.9
生成包含#include在内的文件列表(--preproc_includes 选项)
3.5.10
在文件中生成宏列表(--preproc_macros 选项)
3.6
将参数传递给 main()
3.7
了解诊断消息
3.7.1
控制诊断消息
3.7.2
如何使用诊断抑制选项
3.8
其他消息
3.9
生成交叉参考列表信息(--gen_cross_reference_listing 选项)
3.10
生成原始列表文件(--gen_preprocessor_listing 选项)
3.11
使用内联函数扩展
3.11.1
内联内在函数运算符
3.11.2
内联限制
3.11.3
不受保护定义控制的内联
3.11.3.1
使用内联关键字
3.11.4
保护内联和 _INLINE 预处理器符号
3.11.4.1
头文件 string.h
3.11.4.2
库定义文件
3.12
中断灵活性选项(--interrupt_threshold 选项)
3.13
使用交叉列出功能
3.14
生成和使用性能建议
3.15
关于应用程序二进制接口
3.16
启用入口挂钩和出口挂钩函数
4
优化您的代码
4.1
调用优化
4.2
控制代码大小与速度
4.3
执行文件级优化(--opt_level=3 选项)
4.3.1
创建优化信息文件(--gen_opt_info 选项)
4.4
程序级优化(--program_level_compile 和 --opt_level=3 选项)
4.4.1
控制程序级优化(--call_assumptions 选项)
4.4.2
混合 C/C++ 和汇编代码时的优化注意事项
4.5
自动内联扩展(--auto_inline 选项)
4.6
优化软件流水线
4.6.1
关闭软件流水线(--disable_software_pipeline 选项)
4.6.2
软件流水线信息
4.6.2.1
软件流水线信息
4.6.2.2
软件流水线信息术语
4.6.2.3
不符合软件流水线的循环的消息循环
4.6.2.4
流水线故障消息
4.6.2.5
由 --debug_software_pipeline 选项生成寄存器使用表
4.6.3
折叠 序言和结语以改善性能和代码大小
4.6.3.1
推测执行
4.6.3.2
选择最佳阈值
4.7
冗余循环
4.8
通过 SPLOOP 使用循环缓冲区
4.9
减小代码大小(--opt_for_space(或 -ms)选项)
4.10
使用反馈制导优化
4.10.1
反馈向导优化
4.10.1.1
第 1 阶段 - 收集程序分析信息
4.10.1.2
第 2 阶段 - 使用应用程序分析信息进行优化
4.10.1.3
生成和使用配置文件信息
4.10.1.4
反馈制导优化的应用示例
4.10.1.5
.ppdata 段
4.10.1.6
反馈制导优化和代码大小调整
4.10.1.7
检测程序执行开销
4.10.1.8
无效的分析数据
4.10.2
分析数据解码器
4.10.3
反馈制导优化 API
4.10.4
反馈制导优化总结
4.11
使用配置文件信息获得更好的程序缓存布局并分析代码覆盖率
4.11.1
背景和动机
4.11.2
代码覆盖
4.11.2.1
第 1 阶段 - 收集程序分析信息
4.11.2.2
第 2 阶段 -- 生成代码覆盖信息报告
4.11.3
您期待看到哪些性能改进?
4.11.3.1
评估 L1P 缓存性能
4.11.4
程序缓存布局相关的特征和功能
4.11.4.1
路径分析器
4.11.4.2
分析选项
4.11.4.3
环境变量
4.11.4.4
程序缓存布局工具 clt6x
4.11.4.5
连接器
4.11.4.6
链接器命令文件运算符 unordered()
4.11.5
程序指令缓存布局开发流程
4.11.5.1
收集动态分析信息
4.11.5.2
从动态分析信息中生成首选功能顺序
4.11.5.3
在重新构建的应用程序中使用首选函数顺序
4.11.6
带有加权调用图 (WCG) 信息的逗号分隔值 (CSV) 文件
4.11.7
链接器命令文件运算符 - unordered()
4.11.7.1
unordered() 运算符的输出段
124
4.11.7.2
为 生成的链接器映射文件
4.11.7.3
关于 Dot (.)出现 unordered() 的表达式
4.11.7.3.1
关于a位置表达式
128
4.11.7.4
GROUP 和 UNION
4.11.7.4.1
将 unordered()应用于GROUP
131
4.11.8
注意事项
4.12
指示是否使用了某些别名技术
4.12.1
采用某些别名时使用 --aliased_variables 选项
4.12.2
使用 --no_bad_aliases 选项来指示未采用这些技术
4.12.3
将 --no_bad_aliases 选项与汇编优化器一起使用
4.13
防止重新排列关联浮点运算
4.14
在优化代码中谨慎使用 asm 语句
4.15
使用性能建议优化您的代码
4.15.1
Advice #27000
4.15.2
Advice #27001 提高优化级别
4.15.3
Advice #27002 不要关闭软件流水线
4.15.4
Advice #27003 避免使用调试选项进行编译
4.15.5
Advice #27004 未生成性能建议
4.15.6
Advice #30000 防止由于调用导致循环不合格
4.15.7
Advice #30001 防止由于 rts 调用导致循环不合格
4.15.8
Advice #30002 防止由于 asm 语句导致循环不合格
4.15.9
Advice #30003 防止复杂条件导致的循环不合格
4.15.10
Advice #30004 防止由于 switch 语句导致循环不合格
4.15.11
Advice #30005 防止因算术运算导致循环不合格
4.15.12
Advice #30006 防止由于调用导致循环不合格 (2)
4.15.13
Advice #30007 防止由于 rts 调用导致循环不合格 (2)
4.15.14
Advice #30008 改进循环;使用 restrict 进行限定
4.15.15
Advice #30009 改进循环;添加 MUST_ITERATE pragma
4.15.16
Advice #30010 改进循环;添加 MUST_ITERATE pragma (2)
4.15.17
Advice #30011 改进循环;添加 _nasssert()
4.16
通过优化使用交叉列出特性
4.17
调试和分析优化代码
4.17.1
分析优化的代码
4.18
正在执行什么类型的优化?
4.18.1
基于成本的寄存器分配
4.18.2
别名消歧
4.18.3
分支优化和控制流简化
4.18.4
数据流优化
4.18.5
表达式简化
4.18.6
函数的内联扩展
4.18.7
函数符号别名
4.18.8
归纳变量和强度降低
4.18.9
循环不变量代码运动
4.18.10
循环旋转
4.18.11
向量化 (SIMD)
4.18.12
指令排程
4.18.13
寄存器变量
4.18.14
寄存器跟踪/定位
4.18.15
软件流水线
5
使用汇编优化器
5.1
可提高性能的代码开发流程
5.2
关于汇编优化器
5.3
编写线性汇编需要了解的内容
5.3.1
线性汇编源语句格式
5.3.2
线性汇编的寄存器规格
5.3.2.1
用于计算点积的线性汇编代码
183
5.3.2.2
用于计算点积的 C 代码
185
5.3.2.3
指定寄存器对
187
5.3.2.4
指定四倍字寄存器(仅限 C6600)
189
5.3.3
线性汇编的功能单元规格
5.3.4
使用线性汇编源代码注释
5.3.4.1
显示注释的 Lmac 函数代码
5.3.5
汇编文件保留您的符号寄存器名称
5.4
汇编优化器指令
.call
.circ
.cproc/.endproc
.map
.mdep
.mptr
.no_mdep
.pref
.proc/.endproc
.reg
.rega/.regb
.reserve
.return
.trip
.volatile
5.4.1
过程中不允许使用的指令
5.5
避免与汇编优化器发生存储器组冲突
5.5.1
防止存储器组冲突
5.5.1.1
指定存储器组信息的加载和存储指令
5.5.2
避免存储器组冲突的点积示例
5.5.2.1
点积的 C 代码
5.5.2.2
点积的线性汇编
5.5.2.3
点积软件流水线内核
218
5.5.2.4
中的点积展开以防止存储器组冲突
220
5.5.2.5
从 展开的点积内核
222
5.5.3
索引指针的存储器组冲突
5.5.3.1
对索引指针使用 .mptr
5.5.4
存储器组冲突算法
5.6
存储器别名消歧
5.6.1
汇编优化器如何处理存储器引用(默认)
5.6.2
使用 --no_bad_aliases 选项处理存储器引用
5.6.3
使用 .no_mdep 指令
5.6.4
使用 .mdep 指令来识别特定的存储器依赖关系
5.6.4.1
对存储器引用进行批注
232
5.6.4.2
使用 .mdep ld1、st1 的软件流水线
234
5.6.4.3
使用 .mdep st1、ld1 和 .mdep ld1、st1 的软件流水线
236
5.6.5
存储器别名示例
6
链接 C/C++ 代码
6.1
通过编译器调用链接器(-z 选项)
6.1.1
单独调用链接器
6.1.2
调用链接器作为编译步骤的一部分
6.1.3
禁用链接器(--compile_only 编译器选项)
6.2
链接器代码优化
6.2.1
条件链接
6.2.2
生成函数子段(--gen_func_subsections 编译器选项)
6.2.3
生成聚合数据子段(--gen_data_subsections 编译器选项)
6.3
控制链接过程
6.3.1
包含运行时支持库
6.3.1.1
自动选择运行时支持库
6.3.1.1.1
使用 --issue_remarks 选项
6.3.1.2
手动选择运行时支持库
6.3.1.3
用于搜索符号的库顺序
6.3.2
运行时初始化
6.3.3
全局对象构造函数
6.3.4
指定全局变量初始化类型
6.3.5
指定在内存中分配段的位置
6.3.6
链接器命令文件示例
7
C/C++ 语言实现
7.1
TMS320C6000 C 的特征
7.1.1
实现定义的行为
7.2
TMS320C6000 C++ 的特征
7.3
数据类型
7.3.1
枚举类型大小
7.3.2
矢量数据类型
7.4
文件编码和字符集
7.5
关键字
7.5.1
complex 关键字
7.5.2
const 关键字
7.5.3
__cregister 关键字
7.5.3.1
定义和使用控制寄存器
7.5.4
__interrupt 关键字
7.5.5
__near 和 __far 关键字
7.5.5.1
near 和 far 数据对象
7.5.5.2
near 和 far 函数调用
7.5.6
restrict 关键字
7.5.7
volatile 关键字
7.6
C++ 异常处理
7.7
寄存器变量和参数
7.8
__asm 语句
7.9
pragma 指令
7.9.1
CALLS Pragma
7.9.2
CODE_ALIGN Pragma
7.9.3
CODE_SECTION Pragma
7.9.4
DATA_ALIGN Pragma
7.9.5
DATA_MEM_BANK Pragma
7.9.5.1
使用 DATA_MEM_BANK Pragma
7.9.6
DATA_SECTION Pragma
7.9.6.1
使用 DATA_SECTION Pragma C 源文件
7.9.6.2
使用 DATA_SECTION Pragma C++ 源文件
7.9.6.3
使用 DATA_SECTION Pragma 汇编源文件
7.9.7
诊断消息 Pragma
7.9.8
FORCEINLINE Pragma
7.9.9
FORCEINLINE_RECURSIVE Pragma
7.9.10
FUNC_ALWAYS_INLINE Pragma
7.9.11
FUNC_CANNOT_INLINE Pragma
7.9.12
FUNC_EXT_CALLED Pragma
7.9.13
FUNC_INTERRUPT_THRESHOLD Pragma
7.9.14
FUNC_IS_PURE Pragma
7.9.15
FUNC_IS_SYSTEM Pragma
7.9.16
FUNC_NEVER_RETURNS Pragma
7.9.17
FUNC_NO_GLOBAL_ASG Pragma
7.9.18
FUNC_NO_IND_ASG Pragma
7.9.19
FUNCTION_OPTIONS Pragma
7.9.20
INTERRUPT Pragma
7.9.21
LOCATION Pragma
7.9.22
MUST_ITERATE Pragma
7.9.22.1
MUST_ITERATE Pragma 语法
7.9.22.2
使用 MUST_ITERATE 扩展编译器对循环的了解
7.9.23
NMI_INTERRUPT Pragma
7.9.24
NOINIT 和 PERSISTENT Pragma
7.9.25
NOINLINE Pragma
7.9.26
NO_HOOKS Pragma
7.9.27
once Pragma
7.9.28
pack Pragma
7.9.29
PROB_ITERATE Pragma
7.9.30
RETAIN Pragma
7.9.31
SET_CODE_SECTION 和 SET_DATA_SECTION Pragma
7.9.32
STRUCT_ALIGN Pragma
7.9.33
UNROLL Pragma
7.10
_Pragma 运算符
7.11
应用程序二进制接口
7.12
目标文件符号命名规则(链接名)
7.13
更改 ANSI/ISO C/C++ 语言模式
7.13.1
C99 支持 (--c99)
7.13.2
C11 支持 (--c11)
7.13.3
严格 ANSI 模式和宽松 ANSI 模式(--strict_ansi 和 --relaxed_ansi)
7.14
GNU 和 Clang 语言扩展
7.14.1
扩展
7.14.2
函数属性
7.14.3
For 循环属性
7.14.4
变量属性
7.14.5
类型属性
7.14.6
内置函数
7.15
向量数据类型的运算和函数
7.15.1
向量字面量和串联
7.15.2
向量的一元和二进制运算符
7.15.3
矢量的混合运算符
7.15.4
向量的转换函数
7.15.5
矢量的重新解释函数
7.15.6
使用 printf() 设置矢量
7.15.7
内置矢量函数
8
运行时环境
8.1
存储器模型
8.1.1
段
8.1.2
C/C++ 系统堆栈
8.1.3
动态存储器分配
8.1.4
数据内存模型
8.1.4.1
确定数据地址模型
8.1.4.2
DP 相对寻址与绝对寻址
8.1.4.3
远常量对象
8.1.5
函数调用的蹦床生成
8.1.6
位置无关数据
8.2
对象表示
8.2.1
数据类型存储
8.2.1.1
char 和 short 数据类型(有符号和无符号)
8.2.1.2
enum、int 和 long 数据类型(有符号和无符号)
8.2.1.3
浮点数据类型
8.2.1.4
__int40_t 数据类型(有符号和无符号)
8.2.1.5
long long 数据类型(有符号和无符号)
8.2.1.6
double 和 long double 数据类型
8.2.1.7
指向数据成员类型的指针
8.2.1.8
指向成员函数类型的指针
8.2.1.9
结构和数组
8.2.2
位字段
8.2.3
字符串常量
366
8.3
寄存器惯例
8.4
函数结构和调用惯例
8.4.1
函数如何进行调用
8.4.2
被调用函数如何响应
8.4.3
访问参数和局部变量
8.5
访问 C 和 C++ 中的链接器符号
8.6
将 C 和 C++ 与汇编语言相连
8.6.1
使用汇编语言模块与 C/C++ 代码
8.6.2
从 C/C++ 访问汇编语言函数
8.6.2.1
从 C/C++ 程序调用汇编语言函数
8.6.2.2
由 调用的汇编语言程序
378
8.6.3
从 C/C++ 访问汇编语言变量
8.6.3.1
访问汇编语言全局变量
8.6.3.1.1
汇编语言变量程序
8.6.3.1.2
C 程序从 中访问汇编语言
383
8.6.3.2
访问汇编语言常量
8.6.3.2.1
从 C 语言访问汇编语言常量
8.6.3.2.2
的汇编语言程序
387
8.6.4
与汇编源代码共享 C/C++ 头文件
8.6.5
使用内联汇编语言
8.6.6
使用内在函数访问汇编语言语句
8.6.7
__x128_t 容器类型
8.6.7.1
__x128_t 容器类型
393
8.6.8
__float2_t 容器类型
8.6.9
使用内在函数进行中断控制和原子代码段
8.6.10
使用未对齐的数据和 64 位值
8.6.10.1
使用 _mem8 内在函数
8.6.11
通过 MUST_ITERATE 和 _nassert 来启用 SIMD 并扩展编译器对循环的了解
8.6.12
对齐数据的方法
8.6.12.1
数组的基址
8.6.12.2
相对于数组基址的偏移
8.6.12.3
动态存储器分配
8.6.12.4
结构体或类的成员
8.6.12.4.1
结构中的数组
8.6.12.4.2
类中的数组
406
8.6.13
SAT 位副作用
8.6.14
IRP 和 AMR 规则
8.6.15
浮点和饱和控制寄存器副作用
8.7
中断处理
8.7.1
保存 SGIE 位
8.7.2
在中断期间保存寄存器
8.7.3
使用 C/C++ 中断例程
8.7.4
使用汇编语言中断例程
8.8
运行时支持算术例程
8.9
系统初始化
8.9.1
用于系统预初始化的引导挂钩函数
8.9.2
变量的自动初始化
8.9.2.1
零初始化变量
8.9.2.2
的直接初始化
8.9.2.3
运行时变量自动初始化
8.9.2.4
的自动初始化表
8.9.2.4.1
数据格式遵循的长度
8.9.2.4.2
零初始化格式
8.9.2.4.3
行程编码 (RLE) 格式
8.9.2.4.4
Lempel-Ziv-Storer-Szymanski 压缩 (LZSS) 格式
8.9.2.4.5
用于处理 C 自动初始化表的 C 代码示例
8.9.2.5
在加载时初始化变量
8.9.2.6
全局构造函数
8.10
支持多线程应用
8.10.1
使用 OpenMP 进行编译
8.10.2
多线程运行时支持
8.10.2.1
运行时线程安全
8.10.2.2
线程创建、初始化和终止
8.10.2.3
线程局部存储 (TLS)
8.10.2.4
访问共享数据
9
使用运行时支持函数并构建库
9.1
C 和 C++ 运行时支持库
9.1.1
将代码与对象库链接
9.1.2
头文件
9.1.3
修改库函数
9.1.4
支持字符串处理
9.1.5
极少支持国际化
9.1.6
时间和时钟函数支持
9.1.7
允许打开的文件数量
9.1.8
库命名规则
9.2
C I/O 函数
9.2.1
高级别 I/O 函数
9.2.1.1
格式化和格式转换缓冲区
9.2.2
低级 I/O 实现概述
open
close
read
write
lseek
unlink
rename
9.2.3
器件驱动程序级别 I/O 函数
DEV_open
DEV_close
DEV_read
DEV_write
DEV_lseek
DEV_unlink
DEV_rename
9.2.4
为 C I/O 添加用户定义的器件驱动程序
9.2.4.1
将默认流映射到器件
9.2.5
器件前缀
add_device
470
9.2.5.1
为 C I/O 器件编程
9.3
处理可重入性(_register_lock() 和 _register_unlock() 函数)
9.4
库构建流程
9.4.1
所需的非德州仪器 (TI) 软件
9.4.2
使用库构建流程
9.4.2.1
通过链接器自动重建标准库
9.4.2.2
手动调用 mklib
9.4.2.2.1
构建标准库
9.4.2.2.2
共享或只读库目录
9.4.2.2.3
使用自定义选项构建库
9.4.2.2.4
mklib 程序选项摘要
9.4.3
扩展 mklib
9.4.3.1
底层机制
9.4.3.2
来自其他供应商的库
10
C++ 名称还原器
10.1
调用 C++ 名称还原器
10.2
C++ 名称还原器的示例用法
A 术语表
A.1 术语
B 修订历史记录
491
492
B 早期修订版本