现在的位置: 首页 > 综合 > 正文

NEON-ARM

2013年08月13日 ⁄ 综合 ⁄ 共 2310字 ⁄ 字号 评论关闭

官方解释

公司 应用
Ingenient H.264、VC1、MPEG-4
 On2 Technologies  VP6/7、MPEG-4、VC1、H.264、视频稳定性
 Itiiam Systems MPEG-4、MPEG-2、H.263、H.264、WMV9、VC1
 Aricent Technologies MPEG-4、H.263、H.264、WMV9、音频
  H.264、VC1
 Spirit DSP TEAMSpirit 语音和视频
 VisualOn H.264、MPEG-4、H.263、WMV
 Actimagine MobiClip
 Fraunhofer iis 视频和音频编解码器
Dolby Labs 多通道音频处理
Techno Mathematical MPEG-4
Espico 音频和咨询

SIMD   :  DSP &  SIMD (单指令多数据)

DSP 扩展

ARM DSP 指令集扩展增加了高性能应用中 ARM 解决方案的 DSP 处理能力,同时通过便携式、电池电源设备提供所需的低能耗。DSP 扩展已经过优化,适用于众多软件应用领域(包括伺服马达控制、Voice over IP (VOIP) 和视频/音频编解码器),扩展增强了 DSP 性能,使其能够有效处理所需任务。

功能

  • 单周期 16x16 和 32x16 MAC 实现
  • 与基于 ARM7
    处理器的 CPU 产品相比,性能提高了 2-3 倍
  • 零开销饱和扩展支持
  • 用于加载和存储寄存器对的新指令,包含增强的寻址模式
  • 新的 CLZ 指令改进了算术运算标准化,提高了除法性能
  • 在 ARMv5TE、ARMv6 和 ARMv7 体系结构中完全受支持

应用

用于 ARM 体系结构的编译器可以使用这些 DSP 扩展来改进标准 C 和 C++ 软件的代码生成过程,或者允许软件开发人员明确要求通过内部函数或内联汇编代码使用这些扩展。 

性能

ARM DSP 扩展改进了 DSP 性能,且无需非常高的时钟频率。几乎不增加典型实现中的功耗即可获得此性能。DSP 扩展广泛应用于智能手机以及需要大量信号处理的类似嵌入式系统,从而无需使用其他硬件加速器。DSP 可与 32 位 ARM 和 16 位Thumb® 指令集完全兼容,从而确保所有现有操作系统和应用程序代码都可在支持
DSP 且基于 ARM 处理器的设备上重用。这些扩展广泛适用于大量细分市场,包括无线大容量存储汽车消费娱乐数字图像

 

针对多媒体的 SIMD 扩展

向嵌入式应用程序提供高性能音频和视频处理

当前的智能手机和 Internet 设备必须提供高级媒体和图形性能,才具有竞争力。ARMv6 和 ARMv7 体系结构中的 SIMD 扩展改进了此类性能。

ARM SIMD 媒体扩展随 ARMv6 体系结构引入,从 ARM1136 开始,持续经过 ARM1176™、ARM11™
MPCore
™、Cortex™-A5Cortex-A8  Cortex-A9。这些
SIMD 扩展增强了基于 ARM 处理器的 SoC 的处理能力,而实际上不会增加功耗。SIMD 扩展已经过优化,可适用于众多软件应用领域,包括视频音频编解码器,这些扩展将性能提高了将近
75% 或更多。 

ARMv6 SIMD 功能:

  • 在处理音频和视频时,使性能提高了 75%
  • 同时计算 2x16 位或 4x8 位操作数
  • 小数运算
  • 用户可定义的饱和模式(任意字宽)
  • 双 16x16 乘加/减 32x23 小数 MAC
  • 同时 8/16 位选择操作
  • 在 800MHz 时性能最高达 3.2 GOPS
  • “几乎不增加”典型实现中的功耗即可获得性能。

应用:

  • 媒体流
  • Internet 设备
  • MPEG4 和 H264 编码/解码
  • 语音和手写识别
  • FFT 处理
  • 复杂运算
  • Viterbi 处理

与具有单独可编程 DSP 或加速器的体系结构相比,SIMD 扩展可通过提供一个工具链和处理设备来简化应用软件的开发过程。该工具链环境可缩短上市时间,因为软件在产品开发过程中扮演着越来越重要的角色。SIMD 扩展对操作系统
(OS)
 完全透明,因此可以使用现有 OS 端口。可对 OS 上运行的新应用程序进行编写,以显式使用 SIMD 扩展,从而提供额外功率/性能优势。

除 ARMv6 SIMD 外:

与 ARMv6 体系结构中的 32 位宽 SIMD 相比,NEON
技术是根据 SIMD 概念构建的,该技术采用一个专用模块提供 128 位宽的矢量操作。ARMv7 体系结构中引入了 NEON 技术,该技术只适用于 ARM Cortex-A 类处理器。

更多信息:

NEON 增强了用户体验

NEON 可增强许多多媒体用户体验:

  • 观看任意格式的任意视频
  • 编辑和强化捕获的视频 – 视频稳定性
  • 锯齿消除渲染和合成
  • 游戏处理
  • 快速处理几百万像素的照片
  • 语音识别
  • 强大的多通道高保真音频处理

NEON 的特征和优点

NEON 支持用于 Internet 应用程序的范围广泛的多媒体编解码器:

  • 许多软编解码器标准:MPEG-4、H.264、On2 VP6/7/8、Real、AVS.....
  • 对于各种格式的正常大小的“Internet 流”解码来说,是理想的解决方案
  • 不仅仅针对编解码器,还适用于 2D 和 3D 图形和其他矢量处理
  • 提供现有工具、操作系统支持体系支持

所需周期减少:

  • NEON 可使复杂视频编解码器的性能提升 60-150%
  • 单个简单 DSP 算法可实现更大的性能提升(4 倍 -8 倍)
  • 处理器可更快进入睡眠状态,从而在整体上节约了动态功耗 

NEON 技术的大量元素能够提高性能并简化软件开发过程,如: 

  • 通过对齐和非对齐数据访问,可对 SIMD 操作进行有效的矢量化。
  • 清晰的指令集体系结构,设计用于自动矢量化编译器和手动编码。
  • 有效访问打包数组,如 ARGB 或 xyz 坐标
  • 支持整数和浮点操作,以确保适合从编解码器、高性能计算到 3D 图形等广泛应用领域。
  • 与 ARM 处理器紧密结合,提供单指令流和内存的统一视图,从而能够提供一个具有更简单工具流的开发平台目标。nbsp;
  • 通过具有双 128 位/64 位视图的大型 NEON 寄存器文件,可有效处理数据并尽可能减少对内存的访问,从而增加了数据吞吐量。

抱歉!评论已关闭.