最少需要几个加法器IP才可以实现累加器的功能呢？

已知一个加法器ip，其功能是计算两个数的和，但这个和延迟两个周期才会输出。现在有一串连续的数据输入，每个周期都不间断，试问最少需要例化几个上述的加法器ip，才可以实现累加的功能。
设计分析
实现累加器的加法器例化的个数。按照原文大佬的设计方法，因为数据连续且加法器的延迟周期是2，使用使用一个实现累加，会有一半的数据丢失。那这样设计他就将奇数偶数的数据进行了分开做一级累加，然后第二级将奇数偶数的累加结果再累加。这样做共需消耗3个加法器。
这样设计当然没问题，但是这样设计是否是最少呢？我先抛出我的思考，我认为在允许少量逻辑设计的情况下，最少需要例化两个上述的加法器ip可以实现累加。
如果比较极限的情况下，一个都可以，先把一串数据使用寄存器缓存，然后一个一个取出来慢慢算即可，但这样是不太可取的，首先，数据是连续的并没有给出数据的极限长度，也就是说不论用任何涉及存储结构进行缓存，都没法确保该次数据能完全被存储。如果题目改成一串连续数据输入，长度最大为10，那我认为用寄存器缓存这样的设计是合理的。
设计架构
回到设计思路：用两个加法器的结构如图示。
设计实现
加法器设计
假设两个时钟周期延时加法器代码如下，通过例化加法器进行构建累加器。
//加法器ipmodule adder#(parameter data_width = 8)(    input clk,    input rst_n,    input [data_width-1:0] a_in,    input [data_width-1:0] b_in,    output reg [data_width-1:0] out  );  reg [data_width-1:0] sum;  always @(posedge clk or negedge rst_n)begin    if(rst_n == 'd0)begin      sum <= 'd0;      out <= 'd0;    end    else begin      sum <= a_in + b_in;      out <= sum;    end  endendmodule
累加器设计
//累加器实现module adder_for_acc  #(parameter data_width = 8)   (     input                        clk,     input                      rst_n,     input       [data_width-1:0] din,     input                  din_valid,     output reg            dout_valid,     output reg [data_width-1:0] dout   );  reg [data_width-1:0]din_r0;  //打一拍  always @(posedge clk or negedge rst_n)begin    if(rst_n == 'd0)begin      din_r0 <= 'd0;    end    else if(din_valid==1'b1)begin      din_r0<= din;    end    else begin      din_r0<='d0;    end  end  //adder0_valid信号  reg adder0_valid;  always @(posedge clk or negedge rst_n)begin    if(rst_n == 'd0)begin      adder0_valid <= 'd0;    end    else if(din_valid==1'b1)begin      adder0_valid<=!adder0_valid;    end    else begin      adder0_valid<='d0;    end  end  wire[data_width-1:0] a_in = (adder0_valid && din_valid)?din:0;  wire[data_width-1:0] b_in = (adder0_valid)?din_r0:0;  wire[data_width-1:0] ab_sum;  adder adder0_dut (    .clk  (clk   ),    .rst_n(rst_n ),    .a_in (a_in  ),    .b_in (b_in  ),    .out  (ab_sum)  );  //第一级加法器输出有效信号  reg [1:0]adder0_valid_dly;  wire ab_sum_valid = adder0_valid_dly[1];  always @(posedge clk ) begin      adder0_valid_dly<={adder0_valid_dly[0],adder0_valid};  end  wire [data_width-1:0] sum_in;  wire [data_width-1:0] ab_sum_in = (ab_sum_valid)?ab_sum:0;  wire [data_width-1:0] accsum_in = (ab_sum_valid)?sum_in:dout;  adder adder1_dut (    .clk  (clk      ),    .rst_n(rst_n    ),    .a_in (ab_sum_in),    .b_in (accsum_in),    .out  (sum_in   )  );    //第二级加法器输出有效信号  reg [3:0]din_valid_r0;  reg [1:0]adder1_valid_dly;  wire adder1_outvld = adder1_valid_dly[1];  always @(posedge clk ) begin    adder1_valid_dly<={adder1_valid_dly[0],ab_sum_valid};  end  //输出  always @(posedge clk ) begin    din_valid_r0<={din_valid_r0[2:0],(din_valid || adder0_valid)};  end  always @(posedge clk or negedge rst_n) begin    if(rst_n == 'd0)begin      dout <= 'd0;      dout_valid <= 'd0;    end    else if(adder1_outvld == 1 && (din_valid_r0[3]==1 && din_valid_r0[2]==0))begin      dout <= sum_in ;      dout_valid <= 'd1;    end    else begin      dout <= dout ;      dout_valid <= 'd0;    end  endendmodule
代码架构设计
打拍：先对数据用寄存器缓存一拍，输入数据暂时用in[i]表示，缓存。
第一级加法器输入选择valid：因为前级积累一拍的数据，设计valid用于指示加法器的输入数据。
第一级加法器信号输入：根据valid信号进行选择数据输入。
调用第一级加法器，同时对输入valid信号进行打两拍处理，指示有效的输出数据。
第二级加法器信号输入：根据valid信号进行选择数据输入。
调用第二级加法器，同时对输入valid信号进行打两拍处理，指示有效的输出数据。
输出结果和valid信号。
经过分析，目前设计延时是4拍，也即两级，这里dout和valid使用的是时序逻辑输出，所以在输入valid拉低后的第五个时钟周期输出正确的结果。
仿真测试
设计仿真测试代码对代码进行测试，这里使用了递增数测试代码可用性，在实际测试时，可通过改变data_len的大小测试单次递增累加后的结果，后续结果依次递增为第一次的n倍。
`timescale 1ns/1psmodule adder_for_acc_tb;  // parameters  localparam  data_width = 8;  localparam  data_len = 5;  // ports  reg clk = 1;  reg rst_n = 0;  reg [data_width-1:0] din;  reg din_valid = 0;  wire  dout_valid;  wire [data_width-1:0] dout;  adder_for_acc   #(    .data_width (        data_width )  )  adder_for_acc_dut (    .clk (clk ),    .rst_n (rst_n ),    .din (din ),    .din_valid (din_valid ),    .dout_valid (dout_valid ),    .dout  ( dout)  );  always @(posedge clk or negedge rst_n)begin    if(rst_n == 'd0)begin            din <= 'd0;      din_valid <= 'd0;    end    else if(dout_valid == 1)begin      din <= 'd0;      din_valid <= 'd1;    end    else if(din == data_len)begin      din <= din;      din_valid <= 'd0;    end    else if(din != data_len)begin      din <= din + 1;      din_valid <= 'd1;    end    else begin      din <= din;      din_valid <= 'd0;    end  end  always #5  clk = ! clk ;  initial begin    begin      #100;      rst_n = 1;      #1000;      $finish;    end  end endmodule
仿真截图
仿真分析
在图示仿真可知，累加器功能正常，在din_valid信号拉低后第五拍可得到输出结果，功能正常。

芯耀辉荣膺2023年度中国IC设计成就奖之“年度产业杰出贡献IP公司”
新清洁能源与水电等领域进行合作
热电偶的使用简介
集成电路芯片制造中的3种硅化物工艺介绍
可编程电子积木-壳乐拼Kickstarter众筹圆满结束!
最少需要几个加法器IP才可以实现累加器的功能呢？
中汇翰骑双组份灌胶设备的工作原理
智能拣货机器人助力仓储物流行业的智能升级
基于西门子PLC实现的无线通讯
政策市场齐发力风电市场整合加剧
什么是DRAM？DRAM存储单元电路读写原理
vga图像显示_fpga控制vga显示图片
iphone8什么时候上市?iphone 8即将发布,科技感外观设计+酷炫新功能,这才是苹果的真正水平!价格再贵都要买买买
可调速台锯制作教程
【节能学院】消防应急照明和疏散指示系统在某康养中心项目的应用
五菱宏光MINI EV登陆欧洲市场：价格翻倍续航里程有望达到193公里
赛拉弗单多晶全系列组件通过TUV SUD长期老化耐久认证
5G专网：边缘计算的具体表现应用
KMT36H磁传感器的基础知识
使用SPCE061A的SIO实现数码录音及播放