数字信号处理

平台

DSP 设计支持

入门

发挥移动设备中的对称多处理 (SMP) 优势


作者:
Brian Carlson(德州仪器OMAP 平台市场营销经理)
Steve Jahnke(德州仪器OMAP 平台负责 Symbian S60 与 Linux 的首席架构师)

引言


智能电话与移动因特网设备 (MID) 等移动设备开始提供一系列高级功能,如类似 PC 网页浏览与高清 (HD) 视频录制和回放、类似单反相机的数字影像和 3D 图像功能等。为了能在外形小巧且具有超长电池使用寿命的设备中实现上述功能以及语音、SMS、蓝牙® 和 GPS 等传统电话服务,就需要融合了电源管理技术的高级处理技术来推动移动设备服务不断更上层楼。

对称多处理 (SMP) 过去一直是 PC 领域用于提升性能的一种技术,目前也开始应用于移动设备,能够显著提升系统的按需处理性能和电源可扩展性。德州仪器 (TI) 推出的最新 OMAP™ 4 平台能以极低的功耗提供出色的移动计算和多媒体性能,这在一定程度上要归功于内置的双核 ARM® Cortex™-A9 MPCore 功能,其不仅支持 SMP 通用处理功能,而且还能与低功耗异构处理引擎协同工作,可充分满足要求极高的多媒体需求。德州仪器 (TI) 在为移动设备推出 SMP 方面居于领先地位,积极推进新一代高性能低功耗应用的发展。

何谓 SMP?我们为什么需要它?


对称多处理 (SMP) 广泛应用于 PC 领域,能够显著提升台式计算机的性能。SMP 能使单芯片上多个相同的处理子系统运行相同的指令集,而且都对存储器、I/O 和外部中断具有同等的访问权限。操作系统 (OS) 的单份拷贝就能控制所有内核,使任何处理器都能运行所有的线程,而无需考虑内核、应用或中断服务的区分。

图 1:多重因素推动移动设备对 SMP 的需求不断增长

SMP 将推动移动应用和设备不断发展进步,而这正是目前单核解决方案所无法实现的。SMP 能激活执行任务所需的某个特定内核或多个内核,从而使 OEM 厂商能够实现高度可扩展的性能与电源,充分满足当今业界最流行的应用以及未来潜在的创新应用。

无障碍 Web 浏览等大量新型应用对移动设备提出了更高的峰值计算性能要求。目前的单核解决方案无法满足这一需求,只有 SMP 才能在移动设备的空间尺寸及电源限制条件下实现上述性能需求。我们固然可通过增加单核解决方案的尺寸来满足性能需求,但若增加功耗则对移动设备来说是不可接受的。SMP 正是满足此类需求的唯一架构技术。

可以预见,高级移动应用将像现在的 PC 应用一样复杂,而 PC 领域开发的线程技术也将有望移植到移动手持终端上。推动 PC 处理器不断发展的挑战(例如单内核芯片性能略有提高就需要大幅加大硅芯片技术的复杂性)也同样推动移动手持终端转向多内核架构。此外,在较大型的单内核解决方案上实现更高性能会使成本和复杂性直线上升,从而因更复杂的设计和验证过程最终导致产品上市时间拖延。

PC 市场是促进 SMP 技术推广的催化剂,目前许多 PC 都内置了双核乃至四核处理器。ARM Ltd. 一直积极推动 SMP 技术向手持终端市场发展,并推出了 Cortex™-A9 MPCore 架构。为了支持最新系列的 SMP 内核,诸如 Linux 和 Symbian 等操作系统纷纷增加了对 SMP 的支持。

SMP 将为采用一至四核乃至更多内核的产品提供高度可扩展的产品发展规划,满足未来需求。SMP 高度可扩展的发展规划可全面满足从低到高各级设备的需求,帮助开发人员充分利用现有的软件投资,确保推出的产品能够迎合不同市场对各种性能级别的需求。

移动局限性


要想获得成功,SMP 就必须克服众多移动设备自身存在的局限问题,而尺寸、成本以及功耗属于最显而易见的问题。消费者期望获得可方便地装入口袋或钱包中的超小型移动设备,而且一次充电就能全天无忧。此外,移动设备的成本也是市场必须考虑的问题。SMP 可全面解决上述移动技术面临的局限问题,确保设备满足消费者的要求。SMP 将帮助高级应用提高运行效率,不过我们也必须注意,增加的内核不能在功耗方面造成消极影响。在 SMP 设备中采用新技术必须确保功耗不超过单内核的水平。

随着移动手持终端开始支持过去只有 PC 才具备的 Web 浏览、多媒体和 WLAN 连接等功能,以及语音和蓝牙等标准移动功能,用户对性能的需求越来越高。不过,在移动环境中,提升性能不仅必须确保高效性,而且还必须根据实际需求满足相应的功耗要求。只有根据不同的使用情况优化功耗和性能,才能最大限度地延长电池工作时间并实现最高性能。SMP 使智能电话能够集成 PC 以及传统电话的功能,让单部移动设备满足用户对功耗与性能的需求。

ARM 目前在移动设备市场上占据主导地位,因而我们既需要支持传统代码,又需要支持功能丰富的工具。展望未来,SMP 将必须确保支持可实现正常工作的传统代码,同时还要节约功耗,提高性能。

我们必须解决的最后一个移动局限问题,就是在尽可能减小芯片尺寸的同时提供足够大的存储器高速缓存,以确保多内核工作不会出现死机问题。如果单内内核设备需要的高速缓存量为 N,那么多内核设备保持良好性能所需的缓存量就应为 4*N。此外,我们还要考虑数据一致性和系统存储器一致性等其他存储器设计问题,才能确保所有处理器都能在准确时间存取当时的数据。

ARM Cortex-A9 MPCore


图 2:ARM® Cortex™-A9 MPCore™为移动设备实现可扩展的功率与性能

为了满足移动手持设备市场对可扩展功率与性能的需求,ARM 推出了 Cortex-A9 MPCore 架构。该架构与 ARM Cortex-A8 相比,可将处理效率提高 20% (IPC),从而帮助设计人员以更低的频率完成更多的工作。

Cortex-A9 MPCore 可在一个群集中支持多达 4 个内核,能够为客户设计产品、满足特定需求提供高度的灵活性。Cortex-A9 MPCore 包含丰富的特性,如:

  • 高效超标量管线能够以低功耗实现优异的峰值性能;
  • NEON 媒体处理引擎可加速媒体处理功能;
  • 比前代 ARM FPU 性能提高一倍的浮点单元;
  • 优化的 1 级高速缓存可最大限度地降低时延与功耗;
  • Thumb®-2 技术可将存储器要求降低 30%;
  • TrustZone® 技术支持可靠的安全应用;
  • L2 高速缓存控制器支持低时延、高带宽存储器存取;
  • CoreSight™ 多内核调试与跟踪架构可在开发调试期间提高可视性。

Cortex-A9 MPCore 内核比 Cortex-A8 更小,在降低功耗的同时提高了处理效率。可扩展峰值性能与高级电源管理相结合,使 Cortex-A9 MPCore 性能超过了同类单内核架构,并可为多内核设计提供明显的优势。Cortex-A9 MPCore 不但能够实现可扩展至多个市场的统一平台,同时还可充分利用通用软件开发来降低研发成本,加速产品上的市进程。

SMP 赋予应用与产品的优势


目前,制造商希望投资于一款能够使其在不同级别产品中充分利用与扩展、并同时满足未来需求的平台。SMP 能够以真正的性能可扩展性全面满足这一需求。与只能提高单个内核速度的前代解决方案不同,SMP 将为整个多内核实现真正的可扩展性,为每一款产品实现性能与功耗的最佳组合。

SMP 将允许制造商在统一的平台上以更高的性能支持如上网本等未来产品。一旦 SMP 的软件开发完成,设计人员便可根据未来需要添加多个处理器,而且这对软件将保持透明。SMP 设计可为制造商满足未来应用需求打下坚实的基础。

SMP 赋予应用与产品的优势


目前,制造商希望投资于一款能够使其在不同级别产品中充分利用与扩展、并同时满足未来需求的平台。SMP 能够以真正的性能可扩展性全面满足这一需求。与只能提高单个内核速度的前代解决方案不同,SMP 将为整个多内核实现真正的可扩展性,为每一款产品实现性能与功耗的最佳组合。

SMP 将允许制造商在统一的平台上以更高的性能支持如上网本等未来产品。一旦 SMP 的软件开发完成,设计人员便可根据未来需要添加多个处理器,而且这对软件将保持透明。SMP 设计可为制造商满足未来应用需求打下坚实的基础。

SMP 软件的影响


SMP 可为各个层面的软件大幅提高性能。对于不支持 SMP 的软件,我们可使用操作系统任务管理器在每个内核上启动进程来实现并行工作。并行进程执行自然会提升性能,虽然其效率不如线程级处理那么高,但也不会对应用开发人员造成更多的设计麻烦。

图 3:SMP 可在软件的进程与线程层面上提高性能

随着移动设备性能的不断提升,用户应用的复杂性也在不断增加,在此情况下,应用程序应更多地以并行方式进行编写(如采用线程方式),因此,我们便可充分发挥 SMP 的真正优势与增益。线程构成进程,不必反复返回操作系统寻求资源。应用开发人员不但要采用并行方式进行软件设计,而且还必须注意进程中线程的互动方式。 某些应用本身就是多线程的,从而使 SMP 能够实现更高的性能,更快的响应时间以及更出色的整体用户体验。如 Google 的 Chrome 等 web 浏览器就采用了多线程技术,因此能够与 SMP 技术实现高度互补。预计这些 PC web 浏览器所使用的这种技术也将用于移动领域。 Symbian 和 Linux 移动操作系统均全面支持 SMP。这种支持针对移动环境进行了专门优化,将使所有处理器内核的单一操作系统内核映像以及调度器中的负载平衡能够帮助确定在哪个内核上运行哪个任务或线程。 在处理原有软件时,我们必须注意正确的任务同步,以避免系统锁死。在 SMP 系统中,操作系统可在安排低优先级任务运行在一个不同内核上的同时,让一个具有较高优先级的任务运行在另一个内核上。如果软件包含不明确的同步,则会产生导致锁死情况的错误判断。通过正确使用信号量、互斥量以及自旋锁等软件技术,SMP 内核的编程软件将可实现 SMP 的全部优势。 SMP 系统上的开发与调试工具至关重要。设计人员需要进一步了解芯片情况才能紧跟软件处理技术。在多个内核上同时运行多个线程的情况下,功能强大的新型工具将可帮助制造商快速向市场推出令人惊奇的全新产品。

SMP 的高级电源管理


SMP 提供的可扩展电源优势可用来扩展内核频率与工作内核的数量。Cortex-A9 MPCore 能够分别启用与关闭不同的内核。如果内核处于开启状态,则必须运行在相同的时钟频率下。因此,为了高效使用 SMP 内核的电源管理,必须通过测试来确定以下两种选项的性能与功耗基准:一、在关闭其它内核的同时,以最高时钟频率在单个内核上全速运行进程;二、多内核同时运行进程,但运行的时钟频率降低。

SMP 采用的其它电源管理技术还包括动态电压与频率缩放 (DVFS),可根据所需的性能来调节匹配系统的频率与电压。操作系统可实现负载平衡,这也有助于改善电源管理,并帮助设计人员针对功耗来优化系统。

TI OMAP 4 平台是业界率先推出的、基于 ARM Cortex-A9 MPCore 的双内核架构之一。该架构与专业处理引擎进行了平衡,可实现无与伦比的移动多媒体性能。

图 4:TI 全新 OMAP 4 平台为移动设备带来 SMP

OMAP 4 平台的主要特性包括:

  • 内核 ARM Cortex-A9 MPCore SMP 通用处理器,可提高性能与效率;
  • IVA 3 硬件加速器,可实现真正的 1080p 多标准高清录制与回放功能;
  • 影像信号处理器 (ISP) 支持高质量影像与视频捕获,可实现堪比 SLR 的数字高性能,捕获 2000 万像素的静态影像;
  • Imagination Technologies POWERVR™ SGX540 3D 影像内核支持 3D 用户界面,可实现更大的显示屏、逼真的图像以及直观易用的触摸屏等应用;
  • 音频后端 (ABE) 处理器可为显著降低功耗提供虚拟低功耗音频芯片;
  • 灵活的系统支持:
    • 复合型 TV 输出
    • HDMI v1.3 输出可驱动高清显示屏
    • 色彩丰富的更大显示屏支持
      • 外设接口:MIPI 串行摄像机和串行显示屏接口、MIPI® SLIMbusSM、MMC/SD、USB 2.0 移动高速、UART 以及 SPI 等
  • 支持各大操作系统:Linux(包括 Android 和 LiMo)、Microsoft Windows Mobile 和 Symbian;
  • 45 纳米移动工艺技术可提高性能与电源效率;
  • 优化的电源与音频管理配套芯片:TWL6030 和 TWL6040

TI 是唯一一家可为 SMP 提供所有主要移动操作系统支持的公司,这些操作系统包括 Symbian、Linux 以及 Microsoft Windows Mobile 等。OMAP 4 平台是移动产业有关 SMP 转型的领先解决方案,其架构专为优化 SMP 性能而精心设计。例如,我们在设计时对存储器架构、高速缓存量以及存储器接口等给予了充分的考虑,能够以最低的延迟实现最佳性能。OMAP 4 配套提供的 TI 综合软件套件专为 SMP 编写,可充分发挥 SMP 架构内在的处理性能增强与省电优势。

OMAP 4 平台采用市场上最先进高效的电源管理技术,可进一步节省电源。该处理器充分利用 TI SmartReflex™ 2 的电源和性能管理技术,可提供各种智能、自适应性软硬件技术,能够根据器件工作情况、操作模式以及温度等动态控制电压、频率与电源,具体包括:

  • 动态电压与频率缩放 (DVFS);
  • 自适应电压缩放 (AVS);
  • 动态电源切换 (DPS);
  • 静态漏电管理 (SLM);
  • 自适应体偏压 (ABB);
    • 针对速度较慢器件的顺向偏压 (FBB)
    • 逆向偏压 (RBB),可为速度较快的器件减少漏电

OMAP 4 平台充分利用 TI 在移动设备领域的专业知识与丰富经验,可为当前及未来应用提供基于 SMP 的最新处理器解决方案。

OMAP 4 SMP 的强大功能


OMAP 4 SMP 的强大功能

图 5:OMAP 4 SMP 可实现类似 PC 的 Web 浏览体验

在第二个使用案例中,一位消费者正在使用手机欣赏 H.264 视频。这种多媒体应用案例通常不适用于多线程处理技术,因此最好采用单内核工作。在本例中,OMAP 4 将两个内核之中的一个关闭,并让另一个内核在更高频率下工作,从而可提供出色的多媒体内容。由于只有一个内核工作,因而可降低功耗。

图 6:OMAP 4 实现出色的多媒体内容

结论


SMP 对满足新一代移动设备的高性能与低功耗需求将至关重要。SMP 具有可扩展的功率与性能,能够为单内核解决方案提供独特的优势。未来应用将更多地使用多线程技术,这将推动 SMP 成为我们的首选平台。

TI 的 OMAP 4 平台是率先提供 SMP 技术的产品,不但能够实现可扩展的通用处理性能,同时还可提升多媒体处理领域(影像、图像、音频与视频)的功能。我们必须注意,SMP 不会吸收这些多媒体领域的功能,这些多媒体领域需要可在最低功耗下实现最高性能的专门引擎。OMAP 4 可提供 SMP 的优化组合,能够与非对称多处理技术 (AMP) 配合工作。

TI OMAP 4 平台是在移动设备中推进 SMP 技术的领先解决方案,可支持未来奇妙的应用。当前对 SMP 进行投资,将来就可实现无缝的软件重复使用,OEM 厂商也可在各个层次的产品上实现其设计方案的扩展,并全面满足未来的长远需求。

参考文献:


[1]《SmartReflex™ 电源与性能管理技术:降低功耗,优化性能》,作者:Brian Carlson 和 Bill Giolma,2008 年 2 月;
[2]《新一代智能电话平台的对称多处理技术》,作者:Steve Jahnke 与 Steve Krueger,摘自 2009 年 4 月 ARM《IQ》;
[3]《ARM Cortex-A9 处理器》,ARM® 2007 年 9 月。

重要说明:TI 及其在此所提及各子公司的产品与服务均根据 TI 标准销售条款进行销售。TI 建议客户在下订单前查阅最新最全面的产品与服务信息。对于应用协助、客户的应用或产品设计、软件性能或者专利侵权,请恕 TI 概不负责。有关任何其它公司产品或服务的发布信息均不构成 TI 因此对其的批准、保证或授权。

OMAP 与 SmartReflex 是德州仪器的商标。蓝牙文字与徽标归 Bluetooth SIG, Inc. 所有。德州仪器根据许可证使用上述标识。所有其它商标均是其各自所有者的财产。