多核片上系统SOC-多核功耗优化技术分析

薪科技快评 2024-10-17 21:06:25

多核片上系统-多核 SoC 的功耗优化技术

功耗仍是单核与多核系统设计中的首要考量。过高的功耗不仅推升能源成本,还令芯片温度上升,进而影响芯片的可靠性、性能和封装成本。

当前的硬件设计以及嵌入式多核系统的组件(如CPU、磁盘、显示器、存储器等)已广泛采用节能策略。通过将低功耗技术融入设计,还可为数据通信(如音频、视频等)的网络协议带来显著的额外节能。本章深入探讨了组件及网络协议层面的降功率技术。

1 简介

随着技术的不断发展,计算和通信已经逐步向嵌入式多核设备靠拢。如今,我们可以看到越来越多的功能强大的微处理器被用于运行复杂、智能的控制软件,如寻呼机、手机、笔记本电脑、数码相机、摄像机以及视频游戏等众多设备。然而,这些设备在追求移动性和智能性的过程中,却面临着一个内在的冲突:为了延长电池寿命,作为移动系统的设计需要尽可能地节省能源;但同时,作为智能设备,它们又需要强大的处理器来提供更出色的性能。这种冲突使得设备的电池寿命在与处理器性能之间产生了不可避免的矛盾。

尽管半导体和电池技术持续发展,提高了微处理器的能量计算效率及电池续航时间,但性能与电池寿命间的平衡仍至关重要。

多媒体和移动计算是引领新应用和市场趋势的领域。个人移动计算在推动技术进步方面发挥着举足轻重的作用。然而,这些设备面临的一个关键挑战是如何优化用户界面,以实现与用户的有效互动。此外,设备还需支持多媒体任务,并通过无线连接处理各类数据流量,包括实时视频、语音等对延迟敏感的内容。

无线网络极大地增强了个人计算设备的实用性。它为移动用户提供多功能通信,并允许持续访问陆基网络的服务和资源。除语音外还能够支持分组数据和多媒体服务的无线基础设施将推动互联网的成功,进而推动新型网络应用和服务的发展。然而,建立这种个人移动计算范式的技术挑战并非微不足道。

特别是,这些设备的电池资源有限。虽然减小电池的物理尺寸是一个有前途的解决方案,但仅此一项努力就会减少电池保留的电荷量电池。这将反过来减少用户可以使用计算设备的时间量。这种限制往往会破坏移动计算的概念。此外,更广泛和持续地使用网络服务只会加剧这个问题,因为通信消耗了相对较多的能量。不幸的是,尽管无线业务引起了极大的兴趣,但电池性能提高的速度非常缓慢。

能源效率涉及系统各层,如物理层、通信协议栈、架构、操作系统和网络。高能效机制多种多样,节能设计动机丰富。便携消费电子市场的繁荣与增长是最为明显的驱动力。

在其最抽象的形式中,网络系统有两个运行所需的能量消耗来源:

1.通信,由于无线接口消耗的能量和系统各部分之间的内部流量,以及

2.计算,由于应用程序的处理、通信期间所需的任务和操作系统。

因此,最小化能源消耗是一项需要最小化通信和计算贡献的任务。

另一方面,固态电子设备密度持续上升,移动计算机和便携式通信设备的使用不断攀升,导致功耗问题日益严重。然而,低功耗系统得以借助该技术构建。自1990年代以来,通用处理器和数字信号处理器(DSP)的速度-功率效率每2.5年提升10倍。

低能耗设计虽非挑战性研究领域,但仍为最具难度之一。未来移动多核SoC系统设计师需将多媒体处理、高带宽无线电等众多功能融入电池供电的便携微型封装。个人音频、笔记本电脑及无绳电话的续航时间仅数小时,对消费者并不友好。此外,大且重的电池导致产品笨重且缺乏吸引力 [5]。

优化后的文章:未来移动多核SoCS的能效关键在于设计更高层级的功能、系统架构、操作系统和网络,同时充分考虑能效因素。

2 功率感知技术级设计优化2.1 影响 CMOS 功耗的因素

在移动系统领域,CMOS技术已广泛应用于众多组件的制造。得益于CMOS电路在不切换时不耗散功率的特性,低功耗设计的核心任务是将切换活动降至最低,仅在执行计算时进行 [6、7]。

CMOS芯片上的能量消耗来源可分为静态和动态功耗。平均功率由下式给出

静态功耗由下式给出

并且动态功耗由下式给出

功耗的三个主要来源总结为以下等式:

影响开关性能的四个关键参数:第一项代表功率的开关分量,其中α0 →1 为节点转换活动因子,描述了节点在一个时钟周期内进行耗电转换的平均次数;CL 为负载电容,f clk 是时钟频率。第二项是由直接路径短路电流 I sc 产生的,当 NMOS 和 PMOS 晶体管同时激活、直接从电源接地传导电流时,就会产生该电流。最后一项,Ileak(漏电流),可能由衬底注入和亚阈值效应引起,主要由制造技术决定。

"α0→1,描述了在每个时钟周期内,由具有电容CL的节点进行功耗转换的平均次数。这一过程导致CMOS门的平均功率开关分量简化为更高效的运作模式。"

"CMOS电路中,每次开关事件的能量消耗为 CL.V_dd^2 * f_clk 。特性在于,其效率在高电压电平降低时会翻倍提升,这一特性至关重要。"

数字电路能耗的节能技术和权衡是一个很广泛的话题。在尽可能低的电压下工作是最理想的,但是这是以增加延迟并因此降低吞吐量为代价的。还可以通过选择一种在固定电压下最小化有效开关电容的架构来降低功耗:

通过减少操作数量、互连电容、内部位宽度以及使用每次计算需要更少能量的操作。我们将使用公式(8.4)和(8.5)来讨论涉及数字电路能耗的节能技术和权衡。从这些公式中,我们可以看到降低功耗的方法有四种:

- 通过减少操作数量

- 通过减少互连电容

- 通过减少内部位宽度

- 通过使用每次计算需要更少能量的操作

1.降低容量负载 C,

2.降低电源电压 V,

3.降低开关频率 f,

4.减少开关活动。

2.2 降低电压和频率

电源电压缩放是功率优化的常用手段,其主要优点在于Pswitch 对 Vdd 的二次依赖性能产生显著的能源节省。然而,这种方法的主要局限在于降低电源电压可能会影响电路运行速度。因此,需要通过设计和技术策略来弥补电压降低对电路性能的影响。简言之,首先进行速度优化,然后再实施电源电压缩放,这样可以使设计回到其原始时序,同时满足较低的功耗需求。

众所周知,单纯降低时钟频率并不能减少能耗。为了完成相同任务,系统需运行更长时间,导致延迟增加。为降低功耗,可先提高模块速度性能,再调整电源电压,使设计恢复原时序,但功耗要求降低[7]。

当进行频率缩放以优化功率时,可能会遇到性能下降的问题。在存在一定性能松弛限制的情况下,可以采用降低时钟频率的方法来降低功耗。尽管这种情况在整体设计中很少出现,但在大型架构的某些特定单元中,有时并不需要峰值性能。因此,可以在这些单元上实施选择性的频率缩放(以及电压缩放),而不会损失整个系统的速度。

2.3 减少电容

在CMOS电路中,能耗与电容C成正比关系。为了降低能耗,我们应尽量减少电容的使用。CMOS芯片的大部分能耗都用于驱动较大的片外电容,而非核心处理。片外电容通常在5至数十pF之间。对于传统封装技术,每个引脚贡献约13-14pF的电容(焊盘为10pF,印刷电路板为3-4pF)。

好的,我可以帮您优化这篇文章。根据之前的讨论,方程(8.5)表明能耗与电容成正比;I/O功耗可能占芯片总能耗的很大一部分。因此,为了节省能源,应使用较少的外部输出,并尽可能减少它们的切换。包装技术会对能源消耗产生影响。例如,在多芯片模块中,系统的所有芯片都安装在单个基板上并放置在单个封装中,电容减小。此外,访问外部存储器会消耗大量能量。因此,减少电容的一种方法是减少外部访问并通过使用缓存和寄存器等片上资源来优化系统。

根据之前的讨论,方程(8.5)表明能耗与电容成正比;I/O功耗可能占芯片总能耗的很大一部分。因此,为了节省能源,应使用较少的外部输出,并尽可能减少它们的切换。包装技术也会对能源消耗产生影响。例如,在多芯片模块中,所有芯片都安装在单个基板上并放置在单个封装中,从而减小了电容。此外,访问外部存储器会消耗大量能量。因此,减少电容的一种方法是减少外部访问,并通过使用缓存和寄存器等片上资源来优化系统。

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

0 阅读:14