csv 转 ffm[通俗易懂]
大家好,又见面了,我是你们的朋友全栈君。
1. FFM介绍
FFM最初的概念来自Yu-Chin Juan与其比赛队员,是他们借鉴了来自Michael Jahrer的论文中的field概念提出了FM的升级版模型。通过引入field的概念,FFM把相同性质的特征归于同一个field。 FFM 模型不同于常见的DataFrame格式文件,需要将数据格式转换成如下所示的格式:
y field_1:index_1:value_1 field_2:index_2:value_2 … 0 0:0:0.1 1:1:0.5 … 0 0:0:0.2 1:2:0.3 … 1 0:0:0.2 1:2:0.3 …
且满足一下三个要求:
1. 样本归一化:对样本进行归一化,否则容易造成数据溢出,梯度计算失败。
2. 特征归一化:为了消除不同特征取值范围不同造成的问题,需要对特征进行归一化。
3.省略零值特征:零值特征对模型没有任何贡献,省略零值特征,可以提高FFM 模型训练和预测的速度,这也是稀疏样本采用FFM 的显著优势
2. code
原始代码详将我的github:https://github.com/tide1994cc/csv2ffm
跪谢大家给的小星星~~~
处理代码如下,可以直接import 使用,使用方法非常简单,导入数据,然后实例化一个ffm对象即可,自动将转换后的数据保存在本地。创建对象时,如要的两个参数是 分类列是那些lie,用list表示,标签列是哪一列。也用list表示。详细使用方式如下:
部分原始处理代码如下:
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/146230.html原文链接:https://javaforall.cn
相关文章
- pycharm自带python环境吗_Python IDE环境之 新版Pycharm安装详细教程[通俗易懂]
- 用Python做图像处理[通俗易懂]
- Ubuntu20.04安装详细图文教程(双系统)[通俗易懂]
- STM32-USART串口通信【USART和UART的区别】[通俗易懂]
- Spring Boot 集成MyBatis[通俗易懂]
- python下载hashlib命令_python之hashlib模块[通俗易懂]
- stm32之继电器驱动[通俗易懂]
- mysql 修改密码报错解决[通俗易懂]
- C++中list用法详解[通俗易懂]
- web.xml配置contextConfigLocation[通俗易懂]
- 大数据实时项目(采集部分)[通俗易懂]
- 虚拟存储技术的概念及特点[通俗易懂]
- 【腾讯云】记录一次Could not connect to SMTP host: smtp.163.com, port: 25的解决办法[通俗易懂]
- 上海电信光猫SA1456C桥接后4K IPTV继续使用[通俗易懂]
- 快速从CSV文件中导入MSSQL数据(mssql导入csv)
- csv文件快速用Oracle11g导入CSV文件(oracle11g导入)
- Oracle数据库中快速导入CSV文件的方法(oracle 导入csv)
- Oracle如何导入CSV文件?(oracle导入csv文件)
- Oracle快速导入CSV文件实现数据分析(oracle csv文件)
- 将CSV数据导入MySQL中实现数据仓库管理(csv挂到mysql)
- MySQL中简易CSV数据导入完美处理空行(csv导入MySQL空行)
- 解决CSV导入MySQL出错的绝招(csv导入mysql失败)
- 用 CSV 快速写入 MySQL 数据库(csv 写入 mysql)
- 越来越慢CSV导入Oracle的漫漫等待(csv导入oracle慢)
- 海量CSV文件快速倒入Oracle数据库(csv倒入oracle)