zl程序教程

统计学习方法

  • 李航《统计学习方法》笔记之朴素贝叶斯法

    李航《统计学习方法》笔记之朴素贝叶斯法

    第4章朴素贝叶斯法朴素是整个算法的强假设,即变量之间是强相互独立的。例子路人拿出来3颗豆,两颗红豆1颗绿豆,我和路人各自抽了一颗,路人发现自己抽中的是绿豆,他想用剩下的那颗和我换,我换不换?换不换豆,抽中红豆概率一样吗?P(A \mid B) 表示在B发生的条件下发生A的概率。P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(B \mid A) P(A)}{P(B)}

    日期 2023-06-12 10:48:40     
  • 统计机器学习方法 for NLP:基于CRF的词性标注

    统计机器学习方法 for NLP:基于CRF的词性标注

    知乎: nghuyong 链接: https://zhuanlan.zhihu.com/p/523164712前言最近在重刷李航老师的《统计机器学习方法》尝试将其与NLP结合,通过具体的NLP应用场景,强化对书中公式的理解,最终形成「统计机器学习方法 for NLP」的系列。这篇将介绍条件随机场CRF(绝对给你一次讲明白)并基于CRF完成一个词性标注的任务。CRF是什么条件随机场(Conditio

    日期 2023-06-12 10:48:40     
  • 【统计学习方法】1、统计学习方法概论

    【统计学习方法】1、统计学习方法概论

    文章目录 第一章 统计学习方法概论1.1 统计学习1.2 监督学习1.2.1 基本概念 1.3 统计学习三要素1.3.1 模型1.3.2 策略 1.4 模型评估与模型选择1.4.1 训练误差

    日期 2023-06-12 10:48:40     
  • 统计学习方法笔记 -- 感知机

    统计学习方法笔记 -- 感知机

    感知机(perceptron),听着很牛比,其实就是二类分类的线性分类模型  属于判别模型,1957年由Rosenblatt提出,是神经网络和支持向量机的基础  任何统计机器学习都是三要素,只需要说清楚模型,策略和算法 感知机模型  感知机是一种线性分类模型。 假设空间是定义在特征空间中的线性分类模型或线性分类器,即函数集合   几何解释为,  线性方程,wx+b=0,对应于特征空间中

    日期 2023-06-12 10:48:40     
  • 统计学习方法笔记 -- 隐马尔可夫模型

    统计学习方法笔记 -- 隐马尔可夫模型

    参考,隐马尔可夫模型(HMM)攻略 首先看看确定的状态序列,这种状态序列中状态的变化是确定的,比如  红绿灯,一定是绿灯- 红灯- 黄灯,这样的状态序列  当然也有些不确定状态序列,比如  天气,今天是晴天,你不能确定明天也一定是晴天或雨天  于是我们用概率来表示这种不确定性,称为马尔可夫过程 (Markov Process),马尔可夫过程的阶数表示当前状态依赖于过去几个状态,出于简单考

    日期 2023-06-12 10:48:40     
  • 《机器学习与数据科学(基于R的统计学习方法)》——1.4 机器学习背后的数学

    《机器学习与数据科学(基于R的统计学习方法)》——1.4 机器学习背后的数学

    本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.4节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.4 机器学习背后的数学 为了让这本书的受众尽可能广泛,我做了一个慎重的决定——省去数学。我对这个决定并不感到特别兴奋,因为我坚信彻底理解机器学习需要深入理解每个算法的数学原理。虽然在

    日期 2023-06-12 10:48:40     
  • 《机器学习与数据科学(基于R的统计学习方法)》——1.6 统计计算的R工程

    《机器学习与数据科学(基于R的统计学习方法)》——1.6 统计计算的R工程

    本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.6节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.6 统计计算的R工程 在过去的几年里,R统计环境在机器语言社区里面逐渐获得了相当突出的重要性。虽然有很多其他选择来执行与数据分析、数据建模和机器学习有关的任务,R成为了今天数据科学家

    日期 2023-06-12 10:48:40     
  • 《机器学习与数据科学(基于R的统计学习方法)》——1.9 数据集

    《机器学习与数据科学(基于R的统计学习方法)》——1.9 数据集

    本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.9节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.9 数据集 本书尽力教大家机器学习的方法,因为机器学习是关于数据的,所以我们需要大量的样本数据集以供在例子中使用。为了让事情简单一点(并且不需要你花费大量时间去寻找数据集),书中使用

    日期 2023-06-12 10:48:40     
  • 《机器学习与数据科学(基于R的统计学习方法)》——1.10 在生产中使用R

    《机器学习与数据科学(基于R的统计学习方法)》——1.10 在生产中使用R

    本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.10节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.10 在生产中使用R 当你用R完成了一个机器学习项目时,接踵而来的问题就是能否将解决方案部署到生产环境中去。答案通常是否定的。因为性能和内存限制,开源的R语言对生产系统来说通常不是

    日期 2023-06-12 10:48:40     
  • 《机器学习与数据科学(基于R的统计学习方法)》——2.8 读取JSON文件

    《机器学习与数据科学(基于R的统计学习方法)》——2.8 读取JSON文件

    本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第2章,第2.8节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.8 读取JSON文件 为机器学习项目读取数据时,另一种你可能遇到的数据文件类型是JSON,也就是JavaScript Object Notation。JSON是基于文本的开源标准,为

    日期 2023-06-12 10:48:40