• 欢迎访问小杰博客网站
  • 欢迎访问小杰博客网站哦

机器学习笔记-20行代码实现房价预测

python 小杰 2年前 (2021-01-05) 915次浏览 已收录 0个评论

scikit-learn 是基于 Python 语言的机器学习工具,sklearn是目前python中十分流行的用来实现机器学习的第三方包,其中包含了多种常见算法如:决策树,逻辑回归、集成算法(如随机森林)等等。

1.从sklearn导入数据集

sklearn自带多个数据集:

  • 鸢尾花数据集:load_iris():用于分类任务的数据集
  • 手写数字数据集:load_digits():用于分类任务或者降维任务的数据集
  • 乳腺癌数据集load-barest-cancer():简单经典的用于二分类任务的数据集
  • 糖尿病数据集:load-diabetes():经典的用于回归认为的数据集,值得注意的是,这10个特征中的每个特征都已经被处理成0均值,方差归一化的特征值。
  • 波士顿房价数据集:load-boston():经典的用于回归任务的数据集
  • 体能训练数据集:load-linnerud():经典的用于多变量回归任务的数据集

2.划分数据集,将数据划分为训练集和测试集两大部分。

3.开始训练,我们用线性回归模型。

4.对模型进行评估

5.查看斜率

array([-1.19007229e-01, 3.64055815e-02, 1.68552680e-02, 2.29397031e+00,
-1.60706448e+01, 3.72371469e+00, 9.22765437e-03, -1.30674803e+00,
3.43072685e-01, -1.45830386e-02, -9.73486692e-01, 7.89797436e-03,
-5.72555056e-01])

6.使用模型,对数据进行预测

7.与真实值对比

8.模型调用完成,下面进行误差分析

结果为:3.1432440289344696

9.保存结果

总结

Sklearn是一个常用机器学习库,Sklearn 包含了很多种机器学习的方法:

  • Classification 分类
  • Regression 回归
  • Clustering 非监督分类
  • Dimensionality reduction 数据降维
  • Model Selection 模型选择
  • Preprocessing 数据预处理

    参考网站一
    参考链接二


小杰博客 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:机器学习笔记-20行代码实现房价预测
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址