博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据挖掘与数据分析(三)—— 探索性数据分析EDA(多因子与复合分析) & 可视化(2)——回归分析(最小二乘法&决定系数&残差不相关)&主成分分析&奇异值分解
阅读量:2135 次
发布时间:2019-04-30

本文共 463 字,大约阅读时间需要 1 分钟。

回归分析

回归分析确定两种或两种以上变量之间的相互依赖的定量关系的方法

 

线性回归最常见的解法就是最小二乘法

线性回归效果的度量主要有两种:决定系数和残差不相关

决定系数越接近于1,回归效果越好;越接近于0,回归效果越差

右边的式子是多元线性回归的

 

主成分分析 PCA

主成分分析最重要的作用就是降维

例如这张表中,可以把表看作一个空间,每条数据都是空间中的一个向量。表中有4个属性,每个属性都是一个维度,每个向量都有4个维度

虽然每个向量有4个维度,但是维度也是有主要次要之分的,比如维度A就是一个比较次要的维度,因为通过它我们不能把几个对象区分开,而维度B的区分度就比较大,就可以认为是一个主要的成分

 

步骤

  • 求特征协方差矩阵
  • 求协方差的特征值和特征向量
  • 将特征值按照从大到小的顺序排序,选择其中最大的k个
  • 将样本点投影到选取的特征向量上

 

 

 

奇异值分解SVD

Singular Value Decomposition

除了基本的PCA方法,奇异值分解也是一种常用的线性降维与成分提取的思路

奇异值分解也可以认为是一种PCA的方法

 

 

 

 

转载地址:http://fmygf.baihongyu.com/

你可能感兴趣的文章
Centos7 or Other Linux RPM包查询下载
查看>>
运行springboot项目出现:Type javax.xml.bind.JAXBContext not present
查看>>
Java中多线程向mysql插入同一条数据冲突问题
查看>>
Idea Maven项目使用jar包,添加到本地库使用
查看>>
FastDFS集群架构配置搭建(转载)
查看>>
HTM+CSS实现立方体图片旋转展示效果
查看>>
FFmpeg 命令操作音视频
查看>>
问题:Opencv(3.1.0/3.4)找不到 /opencv2/gpu/gpu.hpp 问题
查看>>
目的:使用CUDA环境变量CUDA_VISIBLE_DEVICES来限定CUDA程序所能使用的GPU设备
查看>>
问题:Mysql中字段类型为text的值, java使用selectByExample查询为null
查看>>
程序员--学习之路--技巧
查看>>
解决问题之 MySQL慢查询日志设置
查看>>
contOS6 部署 lnmp、FTP、composer、ThinkPHP5、docker详细步骤
查看>>
TP5.1模板布局中遇到的坑,配置完不生效解决办法
查看>>
PHPstudy中遇到的坑No input file specified,以及传到linux环境下遇到的坑,模板文件不存在
查看>>
TP5.1事务操作和TP5事务回滚操作多表
查看>>
composer install或composer update 或 composer require phpoffice/phpexcel 失败解决办法
查看>>
TP5.1项目从windows的Apache服务迁移到linux的Nginx服务需要注意几点。
查看>>
win10安装软件 打开时报错 找不到 msvcp120.dll
查看>>
PHPunit+Xdebug代码覆盖率以及遇到的问题汇总
查看>>