数字信号处理(dsp)ic在20世纪70年代早期的μp演化中已经达到了相同的点,当时8008已证明了8位通用μp的前景,但是8080尚未出现。德州仪器(ti)最近推出的dsp芯片标志着dsp器件通用化的开始。
ti tms320加入了三个更成熟的dsp芯片系列,由英特尔2920,美国微系统s2811和nec 7720以及贝尔实验室,罗克韦尔国际,ibm和其他工厂开发的多个专用dsp单元组成。所有这些旧设备都在寻找它们的利基,而新芯片将不会过时。它们的专用架构使其无法用于许多重要的dsp应用,例如横向滤波器。
相反,情况更多的是320是第一个可能真正广泛使用的dsp设备。原因? 320不仅仅是一个只能执行dsp琐事的专用设备;相反,它是一个通用的单芯片μc,它包含一个非常快速和强大的alu和乘法器。它看起来像一个令人难以置信的“加强型”tms1000:它具有2个控制器的单芯片“哈佛”架构和双极阵列处理器的数字运算。
这种经过验证的熟悉的1芯片μc架构与快速,强大的数字运算能力相结合,可能正是将大量oem产品设计人员引入dsp技术所需要的。反过来,这种发展可能会激发降低320价格所需的大量使用。因此,320可能是第一款实现低10美元价格的vlsi设备,使设计人员能够进入激动人心的新应用,在这些应用中dsp技术可以产生个性化语音识别等理想的终端产品功能。
根据ti的说法,320可以用于语音处理,图像处理,频谱分析,相关,数字滤波和高速调制解调器等应用。它也可以成为经济但优越的机器人的基础。
在最后一个应用程序中,设备高速执行dsp算法的能力可以在高性能机器人中重要的几个任务之间共享:用于接受口头命令的语音识别,用雷达或声纳检测物体的信号分析和机器人执行器驱动的数字伺服回路计算。一个320具有速度和可扩展内存来执行所有这些任务,其中许多同时执行。该器件也是第一款具有中断功能的面向dsp的芯片。它可以使用其通用μp功能在后台模式下执行各种管理任务,然后在中断时可以处理前台中的时间关键dsp任务。
因此,320应该允许设计师帮助解决设计家庭辅助家用机器人的科幻问题。你还可以设想一个320左右的玩具娃娃,它可以口头相互作用并产生各种逼真的话语和动作。只有具有320功能的1芯片μc才能使这些产品在经济上可行。
320只是新一代的第一个。例如,美国国家半导体公司和通用仪器公司都表示,他们正致力于在1983年或1984年推出下一代dsp设备.national称其dsp设备正在等待1-μm处理的改进; gi计划使用其硅栅cmos工艺实现不到100纳秒的周期时间。
目前,320是唯一可用的新一代产品。它与满足通用dsp使用的基本要求有多接近?
去年, edn 发布了11个理想的dsp芯片功能列表,由顾问richard blasco(设计团队成员)组装对于第一个dsp芯片,ami 2811)。 320包含了大部分功能(参见“tms320评级”框)。关于通用用途特别感兴趣的是它的可写控制存储,嵌套子程序,扩展alu和自仿真。
实际上,320所没有的唯一功能是ti声称的功能仍然超出了vlsi技术(硬件浮点功能)的状态,或者那些会使器件对dsp过于狭窄的功能。 (后一种类型的一个例子是硬件,它允许320像2811一样紧密有效地执行横向滤波器抽头。)
请注意,大多数这些理想的功能都是您期望在任何最先进的16/32位μp中找到的功能。那么,320如何能够像普通的μc一样,在实时dsp使用中必不可少的数字运算速度快几个数量级呢?
答案在于芯片面积用于器件的大型32位alu(包括0到16位移位器)和乘法器,它在一个200中执行16×16 = 32位有符号乘法nsec周期(参见方框“dsp芯片是什么?”)。
320应该被广泛使用的一个原因是程序员 - 甚至绝大多数对dsp的复杂理论世界一无所知 - 都可以立即开始使用它。例如,使用intel 8048(可能是世界上使用最广泛的1芯片μc)的大型程序员应该会发现320非常熟悉,就像8048的16位版本一样。只有大约6个320的57条指令与dsp的使用有关,任何正在进行dsp工作的程序员很快就会了解它们的价值。
对于所有dsp算法至关重要的紧密,实时,产品总和操作,两条指令至关重要。第一个是ldt完成大部分工作,在一个200纳秒周期内执行三个操作:它预加载乘法器的t寄存器,累加前一个操作中产生的总和,并将读取的数据移到下一个ram位置。最后一个操作植入z - 1 移位,这在数值实现微分方程时总是需要(即,在进行dsp计算时)。然后,mpy指令将刚装入t寄存器的操作数乘以数据ram中寻址的第二个操作数。
第二个关键的320指令是sovm-set溢出模式。此命令导致alu中的任何溢出产生饱和数据值,而不是翻转符号位并导致最坏情况 - 突然将数据更改为相反极性。
为了配合sovm,320提供了bv(溢出分支),程序员可以使用它来纠正溢出。 ti表示通常程序员会依赖320的溢出锁存来捕获并保持溢出的发生;在完成计算之后,程序员将使用bv来检查是否发生了溢出。如果是这样,程序员可能会选择缩小数据(可能在移位器中)并重做计算。
由于其200纳秒的快速周期,320通常表现出比旧的dsp芯片更好的基准 - 但并非总是如此。例如,nec 7720在0.25微秒内执行横向滤波器抽头,而ami 2811在0.3微秒内执行一个横向滤波器抽头。另一方面,320需要0.4微秒。原因? 7720和2811具有更宽的指令字(分别为23和17位),这允许它们在一个周期内同时寻址两个操作数以进行乘法运算。 320使用较短的16位指令字(以容纳标准外部存储器),只能寻址其中一个操作数,因此需要一个额外的周期来将乘法器的t寄存器与另一个操作数预加载。
然而,320的基准测试等级或优于二阶双二阶滤波器上的nec和ami部分。它真正闪耀的地方是fft,特别是如果你使用强力直线代码而不是软件循环。 320可在272微秒内执行32点复数fft,而7720则为700微秒,2811为400微秒。
320的大型可扩展程序存储器显然有助于此类应用。它可以使用这个更大的片上数据ram在芯片上执行更大的fft(对于7720,64点复数与32点复数相比)。通过从片外表(在程序存储空间中)中引入fft数据块,它还可以执行更大的fft - 例如,在62毫秒内进行1024点计算。 (注意2811s可以并行进行多达512个点的fft而不会降低速度。)
ti还警告不要仅仅在dsp代码段方面将320与其他dsp芯片进行比较。该公司称,一个适当的基准将包括dsp和非dsp程序段的混合。 ti声称,由于其类似μp的架构,320将在这种混合物上表现更好。
320应该要求比旧款dsp芯片小得多的前期投资。其自我仿真功能将使ti能够以约500美元的价格提供单板评估模块。该电路板预计将包含32010版本的320,其片上程序rom中包含一个小型调试监视器,以及ti 9995 16/8位μp。具有a/d和d/a功能的第二块电路板价格也在500美元左右,正计划允许dsp用户连接模拟信号。
320应用程序将从评估板上的ram运行,320处于外部存储器模式。 9995将监视320的断点地址线,当它们出现时,它将在320的中断引脚上放置一个特殊的10v自仿真中断信号。结果,320将从片上调试监视器开始执行,转出所有内部ram和其他寄存器,以便为用户提供调试信息。
ti正在为pascal中的320编写交叉汇编程序(和其他软件工具),以便在99000μps和vax小型机上运行。所有这些硬件和软件支持应该在今年晚些时候或明年初提供。
作为第一代产品,320展示了dsp设备的未来发展预期,主要是更多的内存和更高的速度。经验丰富的dsp用户正在要求这两项改进。
记忆和速度齐头并进;当你有更多的内存时,你可以在每个采样时间内完成更复杂的dsp算法 - 这个过程需要更高的速度。相反,如果你有更快的速度。相反,如果速度更快,则需要更多内存才能充分利用它。
随着vlsi制造进度的允许,320已经规划好了可以扩展的架构。目前的12位程序计数器将初始程序存储空间限制为4k,但正如指令集所示,控制分支位字段将允许扩展到24位或16m字。在320的情况下,这种扩展功能对于处理语音识别和生成所需的大表将非常方便。
320的当前片上数据ram仅存储144个字 - 一个整页加上另一个16个字。但是,片上数据地址指针是16位宽,因此最终可以处理多达64k字的片上数据。
如果您认为目前可用的320芯片采用3-μm设计规则制造,并且ti和其他公司预计在20世纪80年代将超过1-μm规则,您可以预测它将持续多长时间在vlsi进展之前允许完全实现320架构。 (请记住,内存容量会随着设计规则维度的平方而增加。)预计处理器的改进也会提高320(和经济性)。具体而言,ti预计很快将实现芯片缩小,速度将提高25% - 150纳秒周期。
nmos dsp芯片 - 无论是320还是旧设备 - 已经达到了可以直接与双极性位片和lsi系统竞争速度的程度。例如,320将能够使用trw和monolithic memories乘法器和算术单元匹配amd 2900和29500设备和板。
此外,当fft足够小时,320的fft基准与双极器件的基准测试基本相同,因此320可以完全在片内ram中执行。目前,这意味着320对于64点复数fft具有竞争力。由于vlsi的进步允许320采用更大的片上数据ram,因此它将能够处理更大的fft,并且与双极器件相比,可能为大多数用户提供显着的经济效益。
此外,由于320既可作为主机处理器,也可作为阵列处理器,其系统级速度和经济性可能远高于任何双极板级方法。只有奇异的板级系统高性能器件,如罗克韦尔国防电子公司(加利福尼亚州阿纳海姆)cmos/sos 70纳秒16×16乘法器和(更重要的)1纳秒gaas器件仍将领先于nmos dsp芯片
推断320所示的趋势,似乎可以安全地推测,在1990年之前,还应该有一种趋势,即在新的16/32位μp中加入适合执行实时dsp任务的数字运算能力。这些dsp增强功能可能首先以协处理器的形式出现,例如现在出现在浮点运算中的协处理器。
遇到填报无计可施?一文讲透自由表填报,数据分析效率直线提升
华为青浦研发中心拟明年6月竣工交付,开展终端芯片等领域研发
全新Fluke雷射测距仪达100公尺的测量距离
最新浏览器市场份额出炉:谷歌Chrome一路领跑,微软Edge缓增
数字电视机顶盒ATSC制式详细介绍
EDN产品展示 IC和各种半导体芯片
企业该如何做好能耗管控,以应对电力交易市场化挑战
工业自动化是一个突出的业务,它正朝着一个新的方向迈进
NVIDIA公司宣布开放NVIDIA Holodeck抢先体验版
研扬BOXER-8640AI –全能AI解决方案
小米将推红米5新机,全面屏+骁龙450,红米5 Plus联袂登场
74hc595与74hc573区别
基于单片机控制的水温炫彩智能杯垫电路设计
京东家电最高标准奠定老大地位,其他电商平台只能去争第二了!优质高效的售后服务,正是吸粉的关键
IPTV接入网络新技术
基于MEMS投影显示技术创新型应用
iphone8什么时候上市?iphone8最新设计流出!网友:有点iphone4的感觉
美国麻省理工学院:研团队用3D打印制造出精确卫星等离子传感器
Nordic Semiconductor低功耗多协议蓝牙5.3 SoC nRF52840概述
求一种基于FPGA原型验证系统的图像处理解决方案