您现在的位置是：首页 > 后端

当前栏目

Python每日一练（机器学习篇）——第44天：机器学习

Python 机器学习每日 44

2023-09-14 09:05:12 时间

文章目录

1. 决策树的生成与训练-信息熵的计算
2. 使用梯度下降对逻辑回归进行训练
《100天精通Python》专栏推荐白嫖80g Python全栈视频

废话少说速度上号刷题卷起来

1. 决策树的生成与训练-信息熵的计算

描述：

其中dataSet.csv的示例数据集如下所示：

实现代码：

# -*- coding: UTF-8 -*-
from math import log
import pandas as pd
 
dataSet = pd.read_csv('dataSet.csv', header=None)
 
def calcInfoEnt(dataSet):
    # 数据集的样本数量 D
    numEntres = len(dataSet)
    #code start here
    # 样本类别分组
    label = dataSet.iloc[:,-1].value_counts()
     
    infoEnt = 0.0
    for i in label.index:
        # Pi
        Pi = label[i]/numEntres
        # H(D)
        infoEnt = infoEnt - Pi * log(Pi, 2)
         
    return infoEnt
    #code end here
    #返回值 infoEnt 为数据集的信息熵，表示为 float 类型
     
if __name__ == '__main__':
    print(calcInfoEnt(dataSet))
    #输出为当前数据集的信息熵

运行结果：
在这里插入图片描述

2. 使用梯度下降对逻辑回归进行训练

描述：

实现代码：

import numpy as np
import pandas as pd

def generate_data():
    datasets = pd.read_csv('dataSet.csv', header=None).values.tolist()
    labels = pd.read_csv('labels.csv', header=None).values.tolist()
    return datasets, labels
def sigmoid(X):
    #补全 sigmoid 函数功能
    #code start here
    s = 1/(1+np.exp(-X))
    return s
    #code end here
def gradientDescent(dataMatIn, classLabels):
    alpha = 0.001  # 学习率，也就是题目描述中的 α
    iteration_nums = 100  # 迭代次数，也就是for循环的次数
    dataMatrix = np.mat(dataMatIn) 
    labelMat = np.mat(classLabels).transpose() 
    m, n = np.shape(dataMatrix)  # 返回dataMatrix的大小。m为行数,n为列数。
    weight_mat = np.ones((n, 1)) #初始化权重矩阵
    #iteration_nums 即为循环的迭代次数
    #请在代码完善部分注意矩阵乘法的维度，使用梯度下降矢量化公式
    #code start here
    for i in range(iteration_nums):
        error = sigmoid(dataMatrix*weight_mat)-labelMat
        weight_mat=weight_mat-alpha*dataMatrix.transpose()*error
    
    return weight_mat

    #code end here
if __name__ == '__main__':
    dataMat, labelMat = generate_data()
    print(gradientDescent(dataMat, labelMat))

运行结果：

在这里插入图片描述

《100天精通Python》专栏推荐白嫖80g Python全栈视频

《100天精通Python从入门到就业》：本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从0到100的不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/yuan2019035055/category_11466020.html

优点：订阅限时9.9付费专栏进入千人全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以抱团取暖（大厂内推机会）！
专栏福利：简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书：Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等

猜你喜欢

【阿里云资讯】阿里云加入双11全球狂欢节启动企业级生态大促
Ubuntu18.04安装Android Studio
spark 任务运行原理
安装SQLserver2008时出现的错误
Servlet | HttpServletRequest接口、通过request接口获取请求参数
Atitit opencv 模板匹配
Android kotlin 从入门到进阶系列讲解（入门篇）Android之GSON的使用
主打综合实力的静态代码测试工具 Klocwork 2022.4 版本更新解析
使用 Python 实现 LDAP 交互的例子
初始化的一些问题（Vector使用）
用以替换系统NSLog的YouXianMingLog
L17 怎么向应用程序商店提交应用
ASP.NET Core路由中间件[3]: 终结点（Endpoint）
【项目实战】MyBatis的映射文件中resultMap标签与parameterType标签的区别探讨
动车上的书摘-java对象流与序列化
输入数字如何获取
工作手册会计核算制度目录 1. 会计核算管理制度1 2. 会计档案管理办法4 1.会计核算管理制度 8. 1.采取借贷记账法记账，采用权责发生制，即凡是收益已经实现，用已经发生，不论款
Python之schedule：schedule库的简介、安装、使用方法之详细攻略
java实现蓝桥杯约瑟夫环
Verilog HDL 语法整理（五）
从需求出发来看关系模型与非关系模型--关系模型与非关系模型概述
[Android Security] 如何把java代码转换成smali代码

相关主题

Python中的切片
python机器学习
python tkinter(2)
Python 类装饰器
python反序列化
Python爬虫示例

zl程序教程