您现在的位置是：首页 > 云平台

当前栏目

通过EM算法的参数辨识和分类识别matlab仿真

识别 MATLAB 算法参数通过分类仿真 EM

2023-09-11 14:15:32 时间

up目录

一、理论基础

二、核心程序

三、测试结果

一、理论基础

EM（expectation-maximization）算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法，模型一般是依赖于不可观测的潜在变量。EM迭代算法交替E步（使用当前参数创造一个log-likelihood函数，并求期望）和M步（求使得E步骤log-likelihood函数期望最大的参数）。然后M步参数估计的结果用作下一个E步骤中潜在变量的分布。

EM算法是1977年Arthur等人的论文。EM算法通常是用来寻找一个统计模型中最大似然参数的。通常这些模型都是涉及到一些无法观测的未知量以及可观测的数据。也就是说，要么数据中包含丢失的值，要么模型的存在要依赖于其他因变量的存在。比如，一个混合模型可以假设每个观测值都与一个相关的但却无法观测的隐变量相关，该隐变量是确定当前观测值属于哪个混合部分的变量。使用极大似然估计的方法求解后验概率通常需要我们推导关于所有未知变量、因变量参数等的似然函数，同时需要能求解该函数。在带有因变量的统计模型中，这通常都不可能。该似然函数的结果通常都依赖于隐变量的值，也就是说求解该似然函数需要知道因变量结果，而求解因变量的结果又依赖于该似然函数。正常情况下，这是无法得到结果的。而EM算法的来源是作者观察到如下的情况可以解决这些问题。即我们可以先任意对一种未知变量任意赋值，然后利用这个值去求解另一个变量，再用求到的结果反过来求事先任意赋值的变量。如此交替循环直到二者的结果基本不变为止。虽然这个方法并不总是奏效，但是可以证明的是，在二者几乎不变的情况下，似然函数的结果要么是最大值要么是鞍点（saddle point）。一般情况下，我们可能能发现多个最大值，该方法无法保证求得全局最大值。

EM算法的好处，或者说它被需要的原因是什么？其实之前我已经在HMM模型的参数估计章节中，对EM算法的具体应用已经有了一个专门的描述。从HMM的例子中，我们知道当一个实际问题中，除了可观测的变量外，还需要一些隐变量帮助我们去建模，此时EM算法可以帮助对这种包含隐变量的问题进行参数估计，除了HMM外，还有k-means聚类算法也运用了EM算法，它的隐变量可以说是具体的那些聚类本身。

EM算法全称Expectation-Maximization算法，即最大化期望算法。根据这个名字就能很清楚知道这个算法的核心元素，一个是期望，另一个是期望的最大化。而这两个元素代表了EM算法的两个流程。首先EM算法是一个迭代性质的算法，即每个迭代都能得到新的经过学习后的参数，迭代的结束标志一般是人为定义阈值或者参数收敛。其次EM算法每个迭代主要执行两个步骤：

1.求期望，得到一个关于参数的期望函数式。类似于我将样本数据输入到

2.对期望函数式求使其最大化的参数。

二、核心程序

function [gamma,llm]=em1k(r,k)
load ('data.mat')
x=dataset1;
L=size(x);
l=L(1);
zc=zeros(r,40);llm=-inf;
for zzz=1:r
sigma=zeros(2,2,k);
mu=zeros(k,2);
pik=ones(k,1)/k;
[mu,sigma]=km1s(2);
for zz=1:40
p=zeros(l,k);
for ii=1:k
    p(:,ii)=mvnpdf(x,mu(ii,:),sigma(:,:,ii));
end
gamma=zeros(l,k);
for ii=1:l
    su=0;
    for jj=1:k
        su=pik(jj)*p(ii,jj)+su;
    end
    for jj=1:k
        gamma(ii,jj)=pik(jj)*p(ii,jj)/su;
    end
end
nk=zeros(k,1);
for ii=1:k
    nk(ii)=sum(gamma(:,ii));
end
pik=nk/l;
for ii=1:k
    mu(ii,1)=sum(gamma(:,ii).*x(:,1))/nk(ii);
    mu(ii,2)=sum(gamma(:,ii).*x(:,2))/nk(ii);
end
ssig=zeros(2,2,l);
for ii=1:k
    for jj=1:l
        ssig(:,:,jj)=gamma(jj,ii).*(x(jj,:)-mu(ii,:))'*(x(jj,:)-mu(ii,:));
    end
    sigma(1,1,ii)=sum(ssig(1,1,:))/nk(ii);
    sigma(1,2,ii)=sum(ssig(1,2,:))/nk(ii);
    sigma(2,1,ii)=sum(ssig(2,1,:))/nk(ii);
    sigma(2,2,ii)=sum(ssig(2,2,:))/nk(ii);
end
ll=0;
for ii=1:l
    bb=0;
    for jj=1:k
        bb=bb+pik(jj)*mvnpdf(x(ii,:),mu(jj,:),sigma(:,:,jj));
    end
    ll=ll+log(bb)/log(exp(1));
end
zc(zzz,zz)=ll;
end
if llm<ll
    llm=ll;
    mii=zzz;
    gam=gamma;
end
end
figure (5)
subplot(1,2,1);
colo=zeros(l,3);
colo(:,1:2)=gam;
for ii=1:l
plot(x(ii,1),x(ii,2),'.','color',colo(ii,:));
hold on
end
hold off;
subplot(1,2,2)
plot(1:40,zc(mii,:));
xlabel('iteration times')
ylabel('maximum log-likelihood')
end
up41

三、测试结果

猜你喜欢

springmvc 之 SpringMVC视图解析器
paip.java 线程无限wait的解决
IT ~ 2021，你以为的测试路在哪里？
【工具类】Base64工具类
一文弄懂FlexE Mux & Demux
微信小程序---- setData 列表性能优化
Java实现蓝桥杯历届试题波动数列
detectron2（目标检测框架）无死角玩转-09：源码详解（5）-anchor生成
做考试系统用到的关于onbeforeunload一些兼容性问题
【华为云技术分享】ARM体系结构基础(4)
Vue.js 2.0 学习重点记录
ubuntu下设置开机自启动项
quartz定时任务框架的使用以及原理
华为OD机试 - 最大时间（Java & JS & Python）
java死锁（Java-level deadlock）
.Net Core使用Ocelot网关(一) -负载,限流,熔断,Header转换
Apache Spark源码走读（十）ShuffleMapTask计算结果的保存与读取 &WEB UI和Metrics初始化及数据更新过程分析
java 读取excel poi 和cell 方法
为什么我们会看到 SAP Spartacus 服务器端渲染 `rendering in process` 的日志
java中判断 101-200 之间有多少个素数，并输出所有的素数
[WASM] Create and Run a Native WebAssembly Function
正则匹配

相关主题

人体姿态识别
识别验证码
类型识别
身份证识别
用Python识别验证码
基于matlab的车牌识别
1020.数字识别

zl程序教程

当前栏目

通过EM算法的参数辨识和分类识别matlab仿真

一、理论基础

二、核心程序

三、测试结果

相关文章