您现在的位置是：首页 > 后端

当前栏目

矩阵乘法脉动阵列的C++模拟

C++模拟矩阵乘法

2023-09-14 09:16:18 时间

自从谷歌的TPU问世以后，被人们遗忘很久的脉动阵列又再次火了一把。矩阵乘法就可以用脉动阵列进行计算，而脉动阵列这种数据流又特别适合用硬件进行实现。下面是用脉动阵列进行矩阵乘法的示意图。可以看到，A的每一行不是同时进入脉动阵列的，而B的每一列也不是同时进入脉动阵列的，相邻行或列进入脉动阵列的时间恰好相差一个时钟周期。
在这里插入图片描述

以下是用c++模拟脉动阵列的代码：

#include <iostream>
#include <cstdlib>
#include <ctime>
#include <iomanip>
#define N 256
using namespace std;

typedef struct PE{
    int weight;
    int neuron;
    int psum;
};

class Systolic{
public:
    PE S[N][N];
public:
    void Init(){
        for(int i=0;i<N;i++)
            for(int j=0;j<N;j++){
                S[i][j].psum=0;
                S[i][j].weight=0;
                S[i][j].neuron=0;
            }
    }
    void calc(){
        for(int i=0;i<N;i++)
            for(int j=0;j<N;j++)
                S[i][j].psum+=S[i][j].weight*S[i][j].neuron;
    }
    void shift(int a[N],int b[N]){
        //水平方向传播矩阵A,a[N]是本次要被读入的列(left->right)
        for(int i=0;i<N;i++)
            for(int j=N-1;j>0;j--){
                S[i][j].neuron=S[i][j-1].neuron;
        }
        for(int i=0;i<N;i++)
            S[i][0].neuron=a[i];
        //竖直方向上传播矩阵B,b[N]是本次要被读入的行(up->bottom)
        for(int j=0;j<N;j++)
            for(int i=N-1;i>0;i--){
                S[i][j].weight=S[i-1][j].weight;
        }
        for(int j=0;j<N;j++)
            S[0][j].weight=b[j];
    }
    void Display(){
        cout<<"weight:"<<endl;
        for(int i=0;i<N;i++){
            for(int j=0;j<N;j++)
                cout<<fixed<<setw(4)<<S[i][j].weight<<",";
            cout<<endl;
        }
        cout<<"neuron:"<<endl;
        for(int i=0;i<N;i++){
            for(int j=0;j<N;j++)
                cout<<fixed<<setw(4)<<S[i][j].neuron<<",";
            cout<<endl;
        }
    }
};

void Print(int A[N][N]){
   for(int i=0;i<N;i++){
       for(int j=0;j<N;j++)
           cout<<fixed<<setw(4)<<A[i][j]<<",";
       cout<<endl;
   }
}


void systolic_mm(int A[N][N],int B[N][N],int C[N][N]){
   Systolic S;
   S.Init();
   int a[N];
   int b[N];
   int clock=0;
   while(clock<=3*N-3){
        //产生a[N]
        for(int i=0;i<N;i++)
            a[i]=(clock>=i&&clock<N+i)?A[i][clock-i]:0;
        //产生b[N]
        for(int j=0;j<N;j++)
            b[j]=(clock>=j&&clock<N+j)?B[clock-j][j]:0;
        S.shift(a,b);
        S.calc();
        //cout<<"clock="<<clock<<endl;
        //S.Display();
        clock++;
   }
   for(int i=0;i<N;i++)
       for(int j=0;j<N;j++)
           C[i][j]=S.S[i][j].psum;
   return;
}
void Matrix_Mult(int A[N][N],int B[N][N],int C[N][N]){
   for(int i=0;i<N;i++)
       for(int j=0;j<N;j++){
            C[i][j]=0;
            for(int k=0;k<N;k++)
                C[i][j]+=A[i][k]*B[k][j];
   }
   return;
}

bool Compare(int O1[N][N],int O2[N][N]){
    for(int i=0;i<N;i++)
        for(int j=0;j<N;j++)
            if(O1[i][j]!=O2[i][j])
                return false;
    return true;
}
int main()
{
    srand(time(0));
    int C1[N][N];
    int C2[N][N];
    int A[N][N];
    int B[N][N];
    int n;
    cout<<"Input check num n:";
    cin>>n;
    cout<<"N="<<N<<endl;
    int i=0;
    while(i++<n){
    for(int i=0;i<N;i++)
        for(int j=0;j<N;j++){
            A[i][j]=rand()%50-25;
            B[i][j]=rand()%20-10;
    }
    //cout<<"Matrix A:"<<endl;
    //Print(A);
    //cout<<"Matrix B:"<<endl;
    //Print(B);
    Matrix_Mult(A,B,C1);
    //cout<<"Matrix C1:"<<endl;
    //Print(C1);
    systolic_mm(A,B,C2);
    //cout<<"Matrix C2:"<<endl;
    //Print(C2);
    bool is_right=Compare(C1,C2);
    if(!is_right){
        cout<<"error"<<endl;
        break;}
    cout<<"Compare C1 and C2,and the result is "<<boolalpha<<is_right<<endl;
    }
    return 0;
}

N=256时测试100次，发现改代码不存在错误：
在这里插入图片描述

猜你喜欢

下载安装 Python ，含详细步骤[通俗易懂]
ORA-09945: Unable to initialize the audit trail file ORACLE 报错故障修复远程处理
今晚八点丨西湖大学郭天南：药物研发的底层革命
蓝牙5.0和Wi-Fi，哪一个更适合物联网？
手写 Puppeteer：自动下载 Chromium
CKS CKA CKAD 考试迎来重大变化
Linux双屏显示：开启新窗口之旅（linux双屏显示）
mongodb 数据库操作–备份还原导出导入
微信Windows端IM消息数据库的优化实践：查询慢、体积大、文件损坏等
pycharm与python的关系_pycharm和python区别[通俗易懂]
用JS删除仓库的所有PR
一起开发，1 元就 Go！
MySQL中几种常见的嵌套查询详解
Element 1.4.2 发布，饿了么 Vue 2.0 组件库
视频融合平台EasyCVR如何添加大华设备的云台功能？
Oracle中灵活拼接字段的技巧（oracle中字段拼接）
asp.net2.0中利用Ajax2.0实现JSON传送大量页面数据
Oracle保存过程卡死解决办法探析（oracle保存过程卡死）
如何在Linux系统中卸载Perl？（linuxperl卸载）
基于Sizeof与Strlen的区别以及联系的使用详解
一篇文章告诉你 golang 环境变量的所有基础操作
暗淡的未来无可用的Redis连接（无可用的redis连接）

相关主题

C++设计模式
C++单例模式
C++ 变量类型
C++ unique
c++ 覆盖
c++ 重载
C++ 判断
PAT 1142 C++版
【C++】从C到C++
28 C++ -this指针
C++015-C++函数
C++014-C++字符串
c++：c和c++区别
c++17(23)-typedef
c++多态性
c++ 语法
VC++ 安装
【C++】初窥C++
c++---函数
C++ const 总结

zl程序教程

当前栏目

矩阵乘法脉动阵列的C++模拟

相关文章