zl程序教程

计算机视觉

  • 计算机视觉中自注意力构建块的PyTorch实现

    计算机视觉中自注意力构建块的PyTorch实现

    作者:AI Summer 编译:ronghuaiyang 导读一个非常好用的git仓库,封装了非常全面的计算机视觉中的自注意力构建块,直接调用,无需重复造轮子了。git仓库地址:https://github.com/The-AI-Summer/self-attention-cv 用einsum和einops在PyTorch中实现计算机视觉的自我注意机制。专注于计算机视觉自注意模块。 使用 pip

    日期 2023-06-12 10:48:40     
  • 【计算机视觉】数字图像处理基础知识题

    【计算机视觉】数字图像处理基础知识题

    本文是计算机视觉课程的平时练习汇总,所用到的图片和实验报告的获取方式见文末 题11、产生下图所示亮块图像 f1(x,y)(128×128大小,暗处=0,亮处=255),对其进行FFT。 (1)同屏显示原图f1和FFT(f1)的幅度谱图; (2)若令f2(x,y)=(-1)x+y f1(x,y),重复以上过程,比较二者幅度谱的异同,简述理由; (3)若将f2(x,y)顺时针旋转45度得到f

    日期 2023-06-12 10:48:40     
  • 大视觉模型方向,计算机视觉顶尖期刊 IJCV 特刊征稿

    大视觉模型方向,计算机视觉顶尖期刊 IJCV 特刊征稿

    Call for PapersInternational Journal of Computer Vision (IJCV)Special Issue on The Promises and Dangers of Large Vision Models在过去十年里,深度学习彻底颠覆了计算机视觉领域,在许多视觉计算问题上带来了巨大的突破。最近我们观察到另一种趋势在社区里受到了广泛的关注和研究,即视觉

    日期 2023-06-12 10:48:40     
  • 拿来即用!Get计算机视觉核心知识

    拿来即用!Get计算机视觉核心知识

    计算机视觉是目前最热门的研究领域之一!无论是二维码识别、刷脸支付,还是智能安防、无人驾驶等,都需要用到计算机视觉技术。而说到计算机视觉,就不得不提到OpenCV。OpenCV作为一个历史悠久、功能丰富、社区活跃的开源视觉开发库,一方面,它提供了计算机视觉以及图像处理方面最常用最基础的功能支持,是开发的必备工具;另一方面,它在新版本中紧跟潮流,加入了对新的算法、硬件的支持。OpenCV 基于C++编

    日期 2023-06-12 10:48:40     
  • 商汤人事变动:计算机视觉大牛代季峰离职,加入清华电子系

    商汤人事变动:计算机视觉大牛代季峰离职,加入清华电子系

    从「不想只做纯科研」到再次回归纯科研?作者 | 李梅编辑 | 彩娴近日,商汤科技执行研究总监、计算机视觉领域大牛代季峰离职,加入清华大学电子工程系任副教授。目前,代季峰的名字已经出现在清华电子系官网的教师名单中,其个人网站也已经更新了最新履历,职位由商汤执行研究总监变成了清华大学电子工程系副教授。代季峰的本科就读于清华大学自动化系,2014 年在自动化系获得博士学位,师从周杰教授。博士期间,他曾到

    日期 2023-06-12 10:48:40     
  • 常用的20个计算机视觉开源数据集总结

    常用的20个计算机视觉开源数据集总结

    点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 计算机视觉是人工智能的一个领域,它训练计算机解释和理解视觉世界。利用来自相机和视频的字图像以及深度学习模型,机器可以准确地识别和分类物体,然后对它们“看到的”做出反应。本文总结了20个常用的开源计算机视觉数据集,数据集很多如果放网址会被认定广告,所以请自行通过名字搜索,数据集按照字母顺序排序。1、COVID-19 X-Ray Da

    日期 2023-06-12 10:48:40     
  • 精选Github计算机开源视觉项目

    精选Github计算机开源视觉项目

    今天有空,在GitHub翻了各种库,挑出下面有意思的库~Open.HD 使用现成的商业 (COTS) WiFi 适配器,但它不会在标准 WiFi 模式下运行它们,这不适合低延迟或超长距离视频传输。相反,Open.HD 以类似于简单广播的方式配置 WiFi 适配器,很像你可能已经在使用的模拟视频传输硬件。这个 GoPro Hero 5 Session 设置谨慎地每两秒拍摄一张新照片,然后将其流式传输

    日期 2023-06-12 10:48:40     
  • 小白系列(3)| 计算机视觉之直接视觉跟踪

    小白系列(3)| 计算机视觉之直接视觉跟踪

    摘要:在这篇文章中,我们将回顾一些基础的跟踪方法。首先,我们将介绍几种视觉跟踪方法。然后,我们将解释如何对它们进行分类。我们还将讨论直接视觉跟踪的基本内容,特别关注基于区域的方法和基于梯度的方法。目录:视觉跟踪简介对视觉跟踪方法进行分类基于区域的跟踪方法基于梯度的方法总结01 视觉跟踪视觉跟踪,也称为目标跟踪或视频跟踪,是使用视觉信息估计场景中目标对象的轨迹的问题。视觉信息可以来自不同的成像源。

    日期 2023-06-12 10:48:40     
  • 【计算机视觉】检测与分割详解

    【计算机视觉】检测与分割详解

    【导读】神经网络在计算机视觉领域有着广泛的应用。只要稍加变形,同样的工具和技术就可以有效地应用于广泛的任务。在本文中,我们将介绍其中的几个应用程序和方法,包括语义分割、分类与定位、目标检测、实例分割。作者 | Ravindra Parmar编译 | XiaowenDetection andSegmentation through ConvNets——计算机视觉-目标检测与分割神经网络在计算机视觉领

    日期 2023-06-12 10:48:40     
  • 异常检测原理及其在计算机视觉中的应用

    异常检测原理及其在计算机视觉中的应用

    这篇文章涵盖了三件事,首先什么是视觉角度的异常检测?用于异常检测的技术有哪些?它在哪里使用?异常检测是什么?“异常值(又名异常)是数据集中的观察结果,它似乎与该数据集的其余部分不一致”——约翰逊 1992 年什么是离群值/异常值?“离群值是一种观察结果,它与其他观察结果的偏差如此之大,以至于引起人们怀疑它是由不同的机制产生的”——霍金斯 1980异常是与常态不同、很少发生并且不符合“模式”其余部分

    日期 2023-06-12 10:48:40     
  • 强化学习&计算机视觉及图形图像技术 | 犀牛鸟精英人才计划课题宣讲会第二场

    强化学习&计算机视觉及图形图像技术 | 犀牛鸟精英人才计划课题宣讲会第二场

    “犀牛鸟精英人才计划课题宣讲会通过邀请各课题指导团队专家,线上为同学们解答课题背景、研究方向、应用场景、培养模式等,帮助学生更好的选择与研究兴趣更匹配的研究课题,欢迎感兴趣的同学和老师参与。本文推送“课题答疑宣讲会第二场”,内容为“强化学习&计算机视觉及图形图像技术”。”点击下方按钮,预约本次直播如对相关课题有疑问,欢迎同学们届时在项目官方QQ交流群(群号:563339770)中或直播评论

    日期 2023-06-12 10:48:40     
  • 【征稿】2023 IEEE 进化计算国际会议专题:进化计算机视觉和图像处理

    【征稿】2023 IEEE 进化计算国际会议专题:进化计算机视觉和图像处理

    原文链接可直达公众号各位同仁们好,我们最近在2023年IEEE进化计算国际会议(IEEE CEC) 上组织了关于“进化计算机视觉和图像处理” 的Special Session,将接收所有关于进/演化计算算法应用于解决计算机视觉和图像处理问题的论文。 投稿截止日期为:2023年1月13日投稿时请选择 CEC-SS: Special Session on Evolutionary Computer V

    日期 2023-06-12 10:48:40     
  • 计算机视觉与OpenMMLab开源算法体系

    计算机视觉与OpenMMLab开源算法体系

    文章目录计算机视觉的任务OpenMMLab算法框架通用:强大的训练器统一:模块抽象统一:训练流程统一:数据接口灵活:训练流程控制内容异或问题卷积神经网络的整体结构计算机视觉是一门让计算机学会"看"的学科,研究如何自动理解图像和视频中的内容计算机视觉的任务分类检测:关键点检测(输出若干个点的坐标)分割:语义分割,示例分割lmage classification:输出有哪些类别。o

    日期 2023-06-12 10:48:40     
  • 博士申请|上海交通大学叶南阳助理教授招收计算机视觉/机器学习方向博士生

    博士申请|上海交通大学叶南阳助理教授招收计算机视觉/机器学习方向博士生

    新智元报道  编辑:LRS【新智元导读】叶南阳老师正在招收2023秋季入学博士生。上海交通大学助理教授叶南阳,博士毕业于剑桥大学,目前的研究兴趣包括但不限于分布外泛化(Out-of-Distribution Generalization)、贝叶斯深度学习和因果推理(causal inference),解决基于独立同分布假设(i.i.d assumption)的传统机器学习中较差的泛化性能,致

    日期 2023-06-12 10:48:40     
  • 计算机视觉大牛沈春华回国,全职加入浙江大学计算机辅助设计与图形学国家重点实验室

    计算机视觉大牛沈春华回国,全职加入浙江大学计算机辅助设计与图形学国家重点实验室

    作者 | 青暮重磅消息!原澳大利亚阿德莱德大学教授、计算机视觉大牛沈春华已回国,并全职加入浙江大学。据主页介绍,沈春华于今年12月入职浙江大学,并兼任莫纳什大学信息技术学院的数据科学与AI无偿兼职教授。他本科毕业于南京大学,并拥有南京大学信号处理系和澳大利亚国立大学应用统计学系的两个硕士学位,于2005年获得阿德莱德大学计算机视觉博士学位。博士毕业后,他在NICTA和澳大利亚国立大学工作,并于20

    日期 2023-06-12 10:48:40     
  • 面向计算机视觉的深度学习:1~5

    面向计算机视觉的深度学习:1~5

    一、入门计算机视觉是理解或操纵图像和视频的科学。 计算机视觉具有许多应用,包括自动驾驶,工业检查和增强现实。 深度学习在计算机视觉中的使用可以分为多个类别:图像和视频中的分类,检测,分割和生成。 在本书中,您将学习如何为计算机视觉应用训练深度学习模型并将其部署在多个平台上。 我们将在本书中使用 TensorFlow,这是一个用于深入学习的流行 python 库,用于示例。 在本章中,我们将介绍以下

    日期 2023-06-12 10:48:40     
  • 旷视科技孙剑:如何在大公司和创业公司做好计算机视觉研究(一)

    旷视科技孙剑:如何在大公司和创业公司做好计算机视觉研究(一)

    AI科技评论按:本文为旷视科技首席科学家孙剑日前在 CCF 与 KDD China 联合主办的ADL上做的题为《如何在大公司和创业公司做好计算机视觉研究》的分享,雷锋网(公众号:雷锋网)进行了全文整理。以下是第一部分。 传送门:旷视科技孙剑:如何在大公司和创业公司做好计算机视觉的研究(二)              旷视科技

    日期 2023-06-12 10:48:40     
  • Magic Leap 收购瑞士计算机视觉公司 Dacuda 3D 部门

    Magic Leap 收购瑞士计算机视觉公司 Dacuda 3D 部门

    雷锋网(公众号:雷锋网)消息,日前 Magic Leap 收购 Dacuda 公司的 3D 扫描部门。 据雷锋网了解,Dacuda 是瑞士的一家计算机视觉公司。该公司曾开发出可放入口袋的扫描仪,并且致力于 3D SlAM 技术的研发。在 2016年,该公司放出一个 Demo 视频,将 iPhone 6 放入 蔡司VR One 头显,利用他们的3D SLAM Scan 引擎,可令移动 VR 设

    日期 2023-06-12 10:48:40     
  • 【计算机视觉】森林火灾检测-2

    【计算机视觉】森林火灾检测-2

    转载请注明出处:http://blog.csdn.net/xiaowei_cqu/article/details/7523683 有关火灾检测的几篇论文的算法小总结: An Early Fire-Detection Method Based on Image Processing Thou-Ho (Chao-Ho) Chen, Ping-Hsueh Wu, and Yung-Chue

    日期 2023-06-12 10:48:40     
  • 【计算机视觉】森林火灾检测-1

    【计算机视觉】森林火灾检测-1

    转载请注明出处:http://blog.csdn.net/xiaowei_cqu/article/details/7522467 前段时间做了一个火灾检测的小程序,因为时间紧,实现的算法也简单。只用了两步处理:运动检测和颜色检测。日后还会再改进~ 运动检测 其实就是检测背景,对背景建模然后提取前景中运动的物体作为候选火灾样本。尝试了两种简单的背景算法:高斯背景建模和背景相减,还是背景

    日期 2023-06-12 10:48:40     
  • 计算机视觉 什么是计算机视觉

    计算机视觉 什么是计算机视觉

    一、什么是计算机视觉?         作为人类,我们可以轻松地感知周围世界的三维结构。想想当你看着坐在你旁边桌子上的花瓶时,三维感知是多么生动。您可以通过在其表面上播放的微妙的光影图案来分辨每个花瓣的形状和半透明度,并毫不费力地将每朵花从场景的背景中分割出来(图1)。

    日期 2023-06-12 10:48:40     
  • 计算机视觉 基于CUDA编程的入门与实践 线程及同步三

    计算机视觉 基于CUDA编程的入门与实践 线程及同步三

    一、线程同步         对于需要线程之间互相交换数据才能完成任务的场景,必须存在某种能让线程彼此交流的机制。就需要共享内存,当很多线程并行工作并且访问相同的数据或者存储器位置的时候,线程间必须正确的同步。         不过,线程间交换数据并不一定需要使用共享内存,

    日期 2023-06-12 10:48:40     
  • 计算机视觉 图像形成 几何图形和变换 3D到2D投影

    计算机视觉 图像形成 几何图形和变换 3D到2D投影

    一、正交和平行透视法         现在我们知道如何表示2D和3D几何图元以及如何在空间上转换它们,我们需要指定如何将 3D图元投影到图像平面上。 我们可以使用线性3D到2D投影矩阵来做到这一点。最简单的模型是正交法,它不需要除法就可以得到最终的(不均匀的)结果。更常用的模

    日期 2023-06-12 10:48:40     
  • 计算机视觉 图像形成 几何图形和变换

    计算机视觉 图像形成 几何图形和变换

    一、图像形成概述         在分析和处理图像之前,需要建立一个描述场景几何形状的词汇表。还需要了解在给定一组光照条件、场景几何、表面特性和相机光学器件的情况下产生特定图像的图像形成过程。同时了解图像形成过程的简化模型。     

    日期 2023-06-12 10:48:40     
  • 计算机视觉 特征检测与匹配 点特征提取(2)

    计算机视觉 特征检测与匹配 点特征提取(2)

    1、Forstner–Harris特征点         虽然 Anandan (1984) 和 Lucas 和 Kanade (1981) 是第一个分析自相关矩阵的不确定性结构的人,但他们是在将确定性与光流测量相关联的背景下这样做的。 Forstner (1986) 和 H

    日期 2023-06-12 10:48:40     
  • 计算机视觉 图像形成 几何图形和变换 3D变换

    计算机视觉 图像形成 几何图形和变换 3D变换

    一、3D变换          这组三维坐标变换与可用于二维变换的坐标变换非常相似,并在表 2.2 中进行了总结。 与在 2D 中一样,这些变换形成了一组嵌套的组。 表 3D 坐标变换的层次结构。 每个变换还保留其下方行中列出的属性

    日期 2023-06-12 10:48:40     
  • 计算机视觉 特征检测与匹配 线和消失点

    计算机视觉 特征检测与匹配 线和消失点

            虽然边缘和一般曲线适合描述自然物体的轮廓,但人造世界充满了直线。 检测和匹配这些线条可用于各种应用,包括建筑建模、城市环境中的姿态估计以及打印文档布局的分析。         从一

    日期 2023-06-12 10:48:40     
  • 计算机视觉 特征检测与匹配 特征描述符

    计算机视觉 特征检测与匹配 特征描述符

    1、概述         检测到关键点特征后,我们必须匹配它们,即我们必须确定哪些特征来自不同图像中的相应位置。 在某些情况下,例如,对于视频序列或已校正的立体对,每个特征点周围的局部运动可能主要是平移的。在这种情况下,可以使用简单的误差度量,如平方差之和或归一化互相关,直接

    日期 2023-06-12 10:48:40     
  • 计算机视觉 特征检测与匹配 图像分割

    计算机视觉 特征检测与匹配 图像分割

    一、图像分割概述         图像分割是寻找“一起”的像素组的任务。在统计和机器学习中,这个问题被称为聚类分析或更简单的聚类,是一个广泛研究的领域,发展出数百种不同的算法。聚类和分割的主要区别在于前者通常忽略像素布局和邻域,而后者则严重依赖空间线索和约束。  

    日期 2023-06-12 10:48:40     
  • 计算机视觉 特征检测与匹配 特征匹配

    计算机视觉 特征检测与匹配 特征匹配

            一旦我们从两个或多个图像中提取了特征及其描述符,下一步就是在这些图像之间建立一些初步的特征匹配。我们采用的方法部分取决于应用程序,例如,不同的策略可能更适合格式化已知重叠的图像(例如,在图像拼接中)与可能没有任何对应关系的图像(例如,当尝试从数据库中识别对象时)

    日期 2023-06-12 10:48:40     
  • 微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)

    微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)

        微软在机器学习与自然语言处理方面积累了大量的资料,同时近1年来,也逐步开放了大量的在线资源。例如在我博客前几个月介绍的Infer.NET项目就是其中1个项目。今天给大家介绍的是"微软牛津计划". .NET开源文章目录:【目录】本博客其他.NET开源项目文章目录 本文原始地址链接 :微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计

    日期 2023-06-12 10:48:40