数字信号处理

平台

DSP 设计支持

入门

满足多媒体处理器需求的动态电源管理技术


作者:Arthur Musah 与 Andy Dykstra,德州仪器

多媒体处理器通常是便携式电子设备中功耗最大的器件。降低 CPU 功耗要求的通常做法是降低时钟速率或工作电压,但这样做带来的影响往往是降低系统性能。另一方面,芯片设计人员已推出多种片上技术,以在不影响系统性能的情况下降低功耗。本文将介绍相关技术原理,以及如何利用这些技术降低功耗,并讨论采用哪些外部电源管理器件和功率 IC 可确保处理器芯片全面发挥省电特性。

有源电源管理


片上电源管理技术分为两大类,管理工作系统功耗与管理待机功耗。

有源电源管理分为三个领域:动态电压与频率缩放 (DVFS)、自适应电压调整 (AVS) 与动态电源切换 (DPS)。静态功耗管理需要确保闲置的系统在需要更高处理能力之前处于省电状态,也就是采用所谓的静态漏电管理 (SLM) 技术,这种管理通常依赖于从待机到断电的几种低功耗模式。

我们先来看看主动模式。利用 DVFS 技术,可根据应用的性能需求通过软件来降低时钟速度和电压。例如,我们不妨设想一款集成了高级 RISC 微处理器 (ARM) 与数字信号处理器 (DSP) 的应用处理器。尽管 ARM 组件的运行速度可高达 600 MHz,但系统并不总是需要如此高的计算能力。通常,我们可通过软件来选择预定义的处理器工作性能点 (OPP),这时的电压可确保处理器工作在可满足系统处理性能要求的最低频率上。为了适应不同应用,进一步提高优化功率的灵活性,我们还可为处理器中的互连与外设预定义另外一组器件内核 OPP。

软件根据 OPP 需向外部稳压器发送控制信号才能设置最低电压。例如,DVFS 适用于两个供电电压 VDD1(DSP 与 ARM 处理器的供电电压)与 VDD2(子系统与外设互连的供电电压),这两个电压轨提供了大部分芯片功率(通常在 75% 到 80% 之间)。在执行 MP3 解码时,可将 DSP 处理器转入低操作性能点,从而大幅减少功耗供处理其他任务之用,这时的 ARM 运行频率高达 125 MHz。为了在最佳功耗情况下实现必需的功能性,我们可将 VDD1 降至 0.95 伏特,而不使用最高 1.35 伏特的电压,以确保 600 MHz 的工作频率。

自适应电压缩放 (AVS) 作为第二种有源电源管理技术,是以芯片制造过程中以及器件运行生命周期中产生的差异为基础的。该技术与所有处理器都采用相同预编程 OPP 的 DVFS 不同。可以想见,就大多数已经成熟的制造工艺而言,芯片的性能在既定频率要求下要遵循一定的分布情况。部分器件(所谓的“热”器件)相对于其他器件(所谓的“冷”器件)而言,能以较低的电压实现给定的频率,这就是 AVS 发挥作用的原理——处理器感应到自身的性能级别,并相应调整供电电压。专用的片上 AVS 硬件可实施反馈环路,无需处理器干预即可动态优化电压电平,以满足进程、温度以及硅芯片衰减等造成的差异要求(图 1)。

图 1:给定处理器的典型性能分布。此处的“冷”器件工作在125 MHz的频率时需要0.94伏特,而“热”器件在该频率下只需 0.83 伏特。自适应电压缩放 (AVS) 技术采用反馈环路相应调节供电电压,确保各器件运行在特定处理任务所需的频率上。

软件可在工作中为每个 OPP 设置 AVS 硬件,而控制算法则通过 I2C 总线向外部稳压器发送指令,以逐步降低适当稳压器的输出,直至处理器刚好超过目标频率的要求为止。

例如,开发人员可首先设计一个能满足所有情况的电压,在 125 MHz 频率下为 0.95 伏特(在图 1 中的 V1 上方)。但是,如果系统中插入了采用 AVS 技术的“热”器件,那么片上反馈机制就会自动将 ARM 的电压降至 0.85 伏特或更低(图 1 中的 V2 上方)。

前两种有源电源管理技术可以最小的工作电压让器件的某部分工作在理想的速度上。相比之下,第三种方法 — 动态功率切换 (DPS) 先确定器件何时可完成当前的计算任务,如果暂时不需要,则让器件进入低功耗待机状态(图 2)。例如,处理器在等待 DMA 传输完成过程中会进入低功耗状态。处理器在唤醒后几微秒内就能返回正常工作状态。

图 2:动态电源切换 (DPS) 在给定器件的某部分完成任务后使其进入低功耗状态。

无源电源管理


虽然 DPS 可让多媒体片上系统 (SoC) 的一部分进入低功耗状态,不过在有些情况下,我们可让整个器件都进入低功耗模式 — 在没有应用运行时自动或通过用户请求进入低功耗模式。要实现这一目的,我们可应用静态漏电管理 (SLM) 技术,启动待机或器件关闭模式。这两种模式一个关键的不同之处在于:在待机模式下,器件仍然占用着内部存储器和逻辑,而在器件关闭模式下,所有系统状态都保存于外部存储器中。利用 SLM 技术,唤醒时间大大快于冷启动速度,因为程序已经载入到了外部存储器,用户无需等待操作系统 (OS) 完全重新启动。在采用 SLM 技术情况下,我们以媒体播放器为例,如果打开十秒钟后还没有得到处理指令或用户输入,就会关闭显示屏进入待机或器件关闭模式。

例如,TI 采用 ARM Cortex-A8 内核的 OMAP35x 单芯片处理器器件就支持器件关闭模式,即器件可自动唤醒的最低功耗模式。除了唤醒域之外,所有电源域均关闭,耗电的只有唤醒域与 I/O 漏电流。系统时钟关闭,在此情况下,唤醒域的时钟被单独设为 32 kHz。此外,OMAP35x 还可自动向外部稳压器发送信号,稳压器能够在深度睡眠状态下关闭。处理器内部不保存存储器或逻辑。在进器件关闭电模式前,系统状态存储在外部存储器中。经后唤醒复位后,微处理器单元 (MPU) 会启动用户定义的功能,SDRAM 控制器配置从高速暂存存储器 (SPM) 中恢复。

可满足各种用途的技术


通过结合采用上述电源管理技术,我们可实现多种操作条件下的最佳功耗。如果系统忙于处理播放高分辨率视频等便携式播放器任务,那么可在 VDD1 上设置过压 OPP。如果是功耗适中的 web 浏览,则可为 VDD1 与 VDD2 设置额定的 OPP。若是功耗较低的音乐欣赏,则可为 VDD1 与 VDD2 设置最低的 OPP。在上述所有情况下,我们都可启动 AVS 来平衡“冷”“热”器件的功耗差别。最后,如果用户打开媒体播放器但数小时或数天都不使用,其会通过 SLM 技术自动使器件进入关闭模式。

为更好的理解采用上述技术所带来的节能优势,需要将下列案例纳入考虑范围。在以下案例中,除有特别说明,否则我们一概不采用 TI 的 AVS/SmartReflex 技术。在这些描述中,IVA 指影像、视频以及音频加速器子系统。

  • 案例一:器件关闭模式 — 0.590 mW。这是 TI OMAP 可自动唤醒的最低功耗模式。在该模式下,整个器件除了唤醒域之外全部关闭,而唤醒域的工作频率还不到 32 kHz。关闭不使用的稳压器(VDD1 = VDD2 = 0),自动刷新 SDRAM,唤醒时特殊启动序列恢复 SDRAM 控制器和系统状态。
  • 案例二:待机模式 — 7 mW。在该器件状态下,仅唤醒域工作,所有其他非唤醒电源域都处于低功耗保存状态(VDD1 = VDD2 = 0.9 伏特)。所有逻辑和存储器将保留。AVS 关闭。
  • 案例三:音频解码 — 22 mW(不含 DPLL 与 IO 功耗)。虽然 ARM 工作在 125 MHz 频率上,但仅设置 DMA 从多媒体卡读取输入数据,随后进入休眠状态。IVA 解码 MP3 帧(44.1 kHz、128k bps 立体声),并将解码数据发送到 SDRAM 的缓冲中。片上多通道缓冲串行端口发送数据到音频编解码器以用于回放。就系统配置而言,DSP 的工作频率为 90 MHz,在无需处理周期时进入低功耗模式以降低功耗。这时,VDD1 为 0.9伏特,VDD2 为 1伏特。
  • 案例四:音频/视频编码 — 540 mW(不含 DPLL 与 IO功耗)。在该案例中,我们捕获并对音频进行编码(AACe+、48 kHz、32k bps 立体声),捕获并编码视频(H.264 VGA 分辨率,每秒 20 帧,2.4 Mbsp),音频和视频都保存,同时显示视频。在该配置下,ARM 工作频率为 500 MHz,DSP 运行频率为 360 MHz,VDD1 为 1.2伏特,VDD2 为 1.15伏特。此外,片上摄像子系统还可从外部传感器捕获视频输入,多通道缓冲串行端口捕获音频 PCM 输入,IVA 执行音频和视频编码,编码数据存储在多媒体卡中,而显示子系统则使视频循环,并将视频发送至 LCD 与电视输出接口。

实施电源管理


为了实现充分的电源管理灵活性,DSP 处理器采用片上电源复位与时钟管理器 (PRCM)。OMAP3530 处理器的功能模块分为 18 个电源域,每个电源域都拥有自己的开关。PRCM 可开关所有电源域,但许多电源域也可由用户控制。此外,每个电源域都能根据逻辑与存储器是否加电、以及时钟是否处于工作状态而进入四种状态之一:工作状态、非工作状态、保持或关闭。

就 ARM 与 DSP 器件而言,上述状态通常需要辅助稳压器。市场上的许多稳压器都可满足上述要求,当然还需满足处理器的电压、电流、功率转换速率规范以及功率上升下降排序要求等。为了在 ARM 与 DSP 处理器上执行 DVFS 与 AVS操作,相关稳压器必须支持 I2C 可编程性。在器件关闭模式下,电路系统必须能通过自动发出的 I2C 命令或专门的 GPIO 信号打开或关闭 VDD1 与 VDD2 稳压器。如果采用 GPIO 信号,由于不存在 I2C 延迟,那么唤醒时间会更快些。为了减轻设计工程师的负担,上述各功能的所有特性最好集成在单个器件中,从而大幅减少部件数(图 3)。

图 3:高级稳压器芯片集成了多个开关稳压器与低压降线性稳压器,因而可满足 OMAP35x 处理器的电压域要求。