写论文的笔记
MobileNet论文阅读笔记
深度可分离卷积(Depth Separable Convolution)MobileNetV2 提出了一个适合移动端架构的高效神经网络结构:深度可分离卷积。其基本思想是用分解版本替代完成的卷积运算符,将卷积拆分为两个单独的层。第一层称为深度卷积,它通过对每个输入通道应用单个卷积滤波器来执行轻量级滤波。第二层是 1×1 卷积,称为逐点卷积,它负责通过计算输入通道的线性组合来构建新特征。 标准卷积
日期 2023-06-12 10:48:40谷歌Borg论文阅读笔记(二)—— 任务混部和资源隔离
BorgMaster在全局进行任务调度和分配资源,Borglet管理主机层面的资源隔离。 相关笔记:谷歌Borg论文阅读笔记(一)—— 集群操作系统Google的混部情况Google几乎所有的机器都是混部的,在一台机器上,可能运行着不同jobs的tasks。根据论文中所说,Google的50%的机器运行了9个甚至更多的tasks。90%的机器运行着25个tasks,达到4500个线程。因此,Goo
日期 2023-06-12 10:48:40【论文笔记】2019-ACL-Dialog State Tracking: A Neural Reading Comprehension Approach
概要问题动机 以往的 DST 方法通常都是输出一个对所有槽值的预测概率分布,使得模型无法预测 unseen 的槽值。这篇文章的作者以不同角度看待 DST 问题,将其建模为一个阅读理解任务,让模型回答“What is the state of the current dialog ?”这个问题。主要贡献 应用阅读理解的方法,提出了一个简单的基于注意力的神经网络模型来提取对话历史中的槽值,并克服了以
日期 2023-06-12 10:48:40【论文笔记】2021-EMNLP-Knowledge-Aware Graph-Enhanced GPT-2 for Dialogue State Tracking
概要 为了建模槽间关系,本文提出了一种新的混合体系结构,它通过来自图注意网络的表示来增强 GPT-2,从而允许对槽值进行因果的、顺序的预测。模型体系结构捕获跨域的槽间关系和依赖关系。提出了一种新的混合架构,将集成 GPT- 2 与图注意网络 (GATs) 进行对话状态跟踪。当在 == 稀疏监督(只有会话级别监督,而不是回合级别监督)== 下训练样本显著减少时,该模型具有良好的鲁棒性。证明了该
日期 2023-06-12 10:48:40论文笔记《On The insecurity of SMS One-Time Password Message against Local Attackers in Modern Mobile Dev
概述 本文发表在NDSS22,原文链接ndss2021_3B-4_24212_paper.pdf 本文围绕短信验证码单因素认证的安全性问题,基于Local Attack的攻击模型,针对从短信OTP在被发送到受害者手机中,到最终输入到目标app中的这一过程,提出了多种有趣的攻击方式来窃取短信OTP。IntroductionSMS 1FA OTP SMS 1FA OTP全称(SMS One-Fa
日期 2023-06-12 10:48:40Raft论文读书笔记
Raft是当前分布式领域最重要的一致性算法之一,今天我们就来好好研究研究这个算法的[论文][1], 还有对应[网站][2], [动画][3], 不想看英文的也有中文的[翻译][4],所以我这边就不翻译了,主要还是记录一下论文重点和自己的心得。 Raft算法作者的初衷是对标Paxos算法(过去十年分布式一致性的事实标准),但是要比它更易理解,主要手段有:1. 分解,把整个一致性问题拆分为**L
日期 2023-06-12 10:48:40Bag of Tricks for Image Classification with Convolutional Neural Networks论文笔记
一、高效的训练 1、Large-batch training 使用大的batch size可能会减小训练过程(收敛的慢?我之前训练的时候挺喜欢用较大的batch size),即在相同的迭代次数下, 相较于使用小的batch size,使用较大的batch size会导致在验证集上精度下降。文中介绍了四种方法。 &nb
日期 2023-06-12 10:48:40Online Object Tracking: A Benchmark 论文笔记(转)
转自:http://blog.csdn.net/lanbing510/article/details/40411877 有博主翻译了这篇论文:http://blog.csdn.net/roamer_nuptgczx/article/details/45790415 Factors that affect the performance of a tracing algorithm 1 Illu
日期 2023-06-12 10:48:40论文笔记(8):BING: Binarized Normed Gradients for Objectness Estimation at 300fps
译文: 《基于二值化赋范梯度特征的一般对象估计》 摘要: 通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传统的滑动窗口对象检测方法。我们观察到一般对象都会有定义完好的封闭轮廓,而且通过将相关图像窗口重置为固定大小,就可以通过梯度幅值进行区分。基于以上的观察以及复杂度的考虑,为了明确训练方法,我们将窗口固定为8*8的,并将梯度幅值转化为一个简单的64维的特征来描述这个窗口。 我们进一步
日期 2023-06-12 10:48:40论文笔记(7):Constrained Convolutional Neural Networks for Weakly Supervised Segmentation
UC Berkeley的Deepak Pathak 使用了一个具有图像级别标记的训练数据来做弱监督学习。训练数据中只给出图像中包含某种物体,但是没有其位置信息和所包含的像素信息。该文章的方法将image tags转化为对CNN输出的label分布的限制条件,因此称为 Constrained convolutional neural network (CCNN)。 该方法把训练过程看作是有线性限
日期 2023-06-12 10:48:40论文理解与笔记【CVPR_2022.6】Region-Aware Face Swapping
论文理解与笔记【CVPR_2022】Region-Aware Face Swapping 论文的缩写全拼:一、贡献二、介绍三、提出问题,也是论文解决的问题四、具体实现方案五、实验六、
日期 2023-06-12 10:48:40论文笔记:An Experimental Comparison of Performance Metrics for Event Detection Algorithms in NILM(1)
目录 0. 摘要 1. 背景介绍 2. 算法、数据集和性能度量 2.1 性能度量 2.2 事件检测算法 2.3 数据集 3. 研究方法 3.1 训练与测试 3.2 性能度量计算 3.3 Pairwise correlation 3.4 分层聚类,Hierarchical clustering 4. 实验结果、解读和讨论
日期 2023-06-12 10:48:40论文笔记:基于复合滑动窗的CUSUM暂态事件检测算法
目录 1. 前言 2. 双边CUSUM算法原理 3. 基于复合滑动窗的暂态事件检测 3.1 高斯加权平均 3.2 检测窗口的Sigmoid处理 3.3 检测暂态过程起止位置 4. Summary 1. 前言 本文是对以下论文的解读笔记。注意在下文中“该论文”和“本文”是指向不同的对象。 史帅彬
日期 2023-06-12 10:48:40NILM论文笔记:R.Reddy, et al: A feature fusion technique for improved NILM
目录 0. 前言 1. 论文概要 2. 混合特征生成 3. 数据合成 4. 对比实验 4.1 数据生成 4.2 事件检测 4.3 特征提取(Feature extraction) 0. 前言 本文是“Raghunath Reddy, et al: A feature fusion technique for i
日期 2023-06-12 10:48:40【视频目标检测论文阅读笔记】Optimizing Video Object Detection via a Scale-Time Lattice
1.1 论文信息 标题Optimizing Video Object Detection via a Scale-Time Lattice会议CVPR 2018原文链接Optimizing Video Object Det
日期 2023-06-12 10:48:40BEVFusion:Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation——论文笔记
参考代码:bevfusion 1. 概述 介绍:在这篇文章中提出一种Lidar和Camera在BEV空间下实现特征融合的方法,有效利用了图像丰富语义信息和雷达深度信息
日期 2023-06-12 10:48:40《PersFormer:3D Lane Detection via Perspective Transformer and the OpenLane Benchmark》论文笔记
参考代码:PersFormer_3DLane OpenLane数据地址:OpenLane 1. 概述 介绍:在2D场景下检测得到的车道线在下游任务中会将其转换到bev空间下
日期 2023-06-12 10:48:40《Feature-metric Loss for Self-supervised Learning of Depth and Egomotion》论文笔记
参考代码:FeatDepth 1. 概述 介绍:在自监督深度估计中以光度重构误差作为损失函数,需要计算的是每个像素点的对应差异,但是在一些无/弱纹理或是存在多
日期 2023-06-12 10:48:40《DeepVideoMVS:Multi-View Stereo on Video with Recurrent Spatio-Temporal Fusion》论文笔记
参考代码:deep-video-mvs 1. 概述 介绍:这篇文章针对视频深度估计提出一种基于multi-view的连续深度估计方法,该方法有效利用了spatial和tem
日期 2023-06-12 10:48:40《Learning optical flow from still images》论文笔记
主页:home page 参考代码:depthstillation 1. 概述 导读:在这篇文章中提出了一个生成光流训练数据的策略,用以弥补真实光流训练数据的
日期 2023-06-12 10:48:40《Learning Stereo from Single Images》论文笔记
参考代码:stereo-from-mono 1. 概述 导读:在进行立体匹配的过程中成对且带标签的训练数据是很难去获取的,对此现有的很多方法都是在虚拟的合成数据
日期 2023-06-12 10:48:40《MonoDepth2:Digging Into Self-Supervised Monocular Depth Estimation》论文笔记
参考代码:monodepth2 1. 概述 导读:由于图片的准确深度信息获取的代价是比较大的,因而使用带有标注的数据去训练会存在较大的成本。因此近来自监督的方法吸引了较多研
日期 2023-06-12 10:48:40《CREStereo:Practical Stereo Matching via Cascaded Recurrent Network with Adaptive Correlation》论文笔记
参考代码:CREStereo 1. 概述 介绍:双目立体匹配在像Middlebury数据上已经取得了不错的效果,但是将训练得到的匹配模型应用到实际场景下时输出效果会出现较大
日期 2023-06-12 10:48:40《RAFT:Recurrent All-Pairs Field Transforms for Optical Flow》论文笔记
参考代码:RAFT 作者主页:Zachary Teed 1. 概述 导读:这篇文章提出了一种新的光流估计pipline,与之前介绍的PWC-Net类似其也包含
日期 2023-06-12 10:48:40《ATOM:Accurate Tracking by Overlap Maximization》论文笔记
参考代码:pytracking 1. 概述 导读:现有的跟踪网络很多都着力于将目标从背景中区分开来,也就是提升前景背景的分辨能力,但是对目标位置估计的准确性&
日期 2023-06-12 10:48:40《Siamese RPN:High Performance Visual Tracking with Siamese Region Proposal Network》论文笔记
参考代码:DaSiamRPN 1. 概述 导读:这篇文章提出了一种端到端的离线训练网络Siamese region proposal network(Siamese-RPN
日期 2023-06-12 10:48:40《AdaptSegNet:Learning to Adapt Structured Output Space for Semantic Segmentation》论文笔记
参考代码:AdaptSegNet 1. 概述 导读:这篇文章着力于解决模型未见过数据的适应性,一般来讲模型对于与训练集中数据类似的数据表现较好,但是对于未知场
日期 2023-06-12 10:48:40《UC-Net:Uncertainty Inspired RGB-D Saliency Detection via Conditional Variational Autoencoders》论文笔记
参考代码:UC-Net 1. 概述 导读:这篇文章研究的是RGB-D数据的显著性目标检测问题,其中的D代表的是深度图,可以通过如Kinect之类的深度传感器/
日期 2023-06-12 10:48:40《HigherHRNet:Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation》论文笔记
参考代码:HigherHRNet 1. 概述 导读:在bottom-up类型的人体关键点检测算法中,人物目标密集和人物目标过小都是算法表现不好的场景,对此这篇
日期 2023-06-12 10:48:40《HRNet:Deep High-Resolution Representation Learning for Human Pose Estimation》论文笔记
参考代码:HRNet 1. 概述 导读:这篇文章聚焦人体关键点检测任务中高分辨率特征的学习表达,现有的特征表达方式一般采取分辨率从高到低的演化路径,这篇文章中
日期 2023-06-12 10:48:40《R2CNN:Rotational Region CNN for Orientation Robust Scene Text Detection》论文笔记
代码地址: R2CNN 1. 概述 这篇文章提出了R2CNN模型用于去检测自然场景下任意角度旋转的文本,该模型是基于Faster R-CNN结构的。该方法首先使用RPN网络在文本区域的坐
日期 2023-06-12 10:48:40