计算机视觉 基于CUDA编程的入门与实践 线程及同步四
2023-09-14 09:01:35 时间
如何写出像向量点乘或者矩阵乘法这种重要的数学运算的CUDA程序。这些运算很重要,几乎在所有的应用程序中都要用到。会用到我们之前看到的所有概念,并有助于写以后的其他应用。
一、向量点乘
两个向量的点乘是重要的数学运算,也将会解释CUDA编程中的一个重要概念:归约运算。两个向量的点乘运算定义如下:
(X1,X2,X3)·(Y1,Y2,Y3)=X1Y1+X2Y2+X3Y3
真正的向量可能很长,两个向量里面可能有多个元素,而不仅仅只有三个。最终也会将多个乘法结果累加(归约运算)起来,而不仅仅是3个。现在,你看下这个运算,它和之前的元素两两相加的向量加法操作很类似。不同的是你需要将元素两两相乘。线程需要将它们的所有单个乘法结果连续累加起来,因为所有的一对对的乘法结果需要被累加起来,才能得到点乘的最终结果。最终的点乘的结果将是一个单一值。这种原始输入是两个数组而输出却缩减为一个(单一值)的运算,在CUDA里叫作归约运算。归约运算在很多应用程序里都有用。我们给出进行该种CUDA运算的内核函数如下:
#include "stdio.h"
#include<iostream>
#include <cuda.h>
#include <cuda_runtime.h>
#define N 1024
#define threadsPerBlock 512
__global__ void gpu_dot(float *d_a, float *d_b, float *d_c) {
//Declare shared memory
__shared__ float partial_sum[threadsPerBlock];
int tid
相关文章
- python网络编程基础(线程与进程、并行与并发、同步与异步、阻塞与非阻塞、CPU密集型与IO密集型)
- .NET 同步与异步 之 原子操作和自旋锁(Interlocked、SpinLock)(九)
- C#线程同步的几种方法
- 备忘录中添加提醒不能同步到日历中怎么办?
- Linux线程同步:条件变量
- Swoole协程与传统fpm同步模式比较
- 如何解决Docker容器和宿主机时间同步问题
- java核心知识点学习----多线程并发之线程同步
- 【问题解决方案】谷歌浏览器不能登录或同步的问题解决
- 同步~异步~阻塞~非阻塞
- C#线程同步——lock,Monitor,Mutex(摘录)
- 计算机视觉 基于CUDA编程的入门与实践 线程及同步二
- Linux rsync远程文件同步工具:只对差异文件进行更新
- Java里使用volatile进行线程同步的一个例子
- vuejs上传文件并读取文件同步更新(在$nextTick(()里面操作更新dom才能实时刷新)
- 银行取款[多线程]{使用重入锁Lock接口ReentrantLock锁确保线程同步}
- 银行取款[多线程]{使用同步方法确保线程同步}
- 银行取款[多线程]{未进行线程同步}(junit不适合多线程并发单元测试)
- 线程同步方法和差别~(高并发中多个线程访问统一资源域,容易出现线程安全性)
- 华为云严选上新啦!高效准确的数据同步方案来了
- linux系统编程:线程同步-信号量(semaphore)
- rsync 同步慢 性能优化
- 秒杀多线程第四篇 一个经典的多线程同步问题
- FastAdmin 开发时如何与官方同步升级
- 作为测试人员,如何理解线程同步异步!点进来
- 进程和同步和消息机制
- Android jni线程同步和互斥(生产者和消费者模式)
- Java核心类库之(多线程:实现多线程、线程同步)
- 【redis源码学习】从源码角度看主从复制(3):全量同步 && 部分同步