神经网络从小白到入门:一、从波士顿房价问题切入TF神经网络:KNN算法

本文主要是介绍神经网络从小白到入门:一、从波士顿房价问题切入TF神经网络:KNN算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文中的波士顿房价问题所需数据,在晚上是公共资源,将该数据存储到网盘中,分享就不存放到CSDN上了,CSDN的收费过于离谱

链接:https://pan.baidu.com/s/1VGDAzZpPLLSCALgscNbZ1A

提取码:tg5n

以下为波士顿房价数据中的各个字段信息说明

  • CRIM–城镇人均犯罪率
  • ZN - 占地面积超过25,000平方英尺的住宅用地比例。
  • INDUS - 每个城镇非零售业务的比例。
  • CHAS - Charles River虚拟变量(如果是河道,则为1;否则为0)
  • NOX - 一氧化氮浓度(每千万份)
  • RM - 每间住宅的平均房间数
  • AGE - 1940年以前建造的自住单位比例
  • DIS加权距离波士顿的五个就业中心
  • RAD - 径向高速公路的可达性指数
  • TAX - 每10,000美元的全额物业税率
  • PTRATIO - 城镇的学生与教师比例
  • B - 1000(Bk - 0.63)^ 2其中Bk是城镇黑人的比例
  • LSTAT - 人口状况下降%
  • MEDV - 自有住房的中位数报价, 单位1000美元

亦或者使用包自带的数据,如下:

from sklearn.datasets import load_boston
dataset=load_boston()print(dataset)

在这里插入图片描述

将上面的信息再粘贴一次,描述以下波士顿数据字段的说明信息

  • CRIM–城镇人均犯罪率
  • ZN - 占地面积超过25,000平方英尺的住宅用地比例。
  • INDUS - 每个城镇非零售业务的比例。
  • CHAS - Charles River虚拟变量(如果是河道,则为1;否则为0)
  • NOX - 一氧化氮浓度(每千万份)
  • RM - 每间住宅的平均房间数
  • AGE - 1940年以前建造的自住单位比例
  • DIS加权距离波士顿的五个就业中心
  • RAD - 径向高速公路的可达性指数
  • TAX - 每10,000美元的全额物业税率
  • PTRATIO - 城镇的学生与教师比例
  • B - 1000(Bk - 0.63)^ 2其中Bk是城镇黑人的比例
  • LSTAT - 人口状况下降%
  • MEDV - 自有住房的中位数报价, 单位1000美元

1. 预测房价

首先我们基于上述波士顿数据,来预测房价,由于波士顿数据具有多个维度,且上述的维度过多,故我们将暂时只基于影响最为明显的维度来预测

1.1 使用pandas来加载和分析数据。

有时间我来总结以下pandas工具包,一直帮别人看代码,看书中有很多重要的都是介绍pandas的,但是一直没有系统的总结,后续有时间我来梳理以下pandas工具包,现在我们使用pandas包来辅助分析我们的波士顿数据。

  1. 加载数据
import pandas as pd
dataframe=pd.DataFrame(dataset['data'])print(dataframe)

在这里插入图片描述

  1. 修改字段别名
dataframe.columns=dataset['feature_names']
print(dataframe)

在这里插入图片描述

  1. 联合数据的价格
dataframe['price']=dataset['target']
print(dataframe)

在这里插入图片描述

  1. 分析对房价影响最大的显著特征是什么?

即分析数据中各个维度中对于房价的影响是最大的维度是什么?

以下使用的方式是采用手工的方式确定的,在大数据和人工智能中存在一定的算法做到自动推算出对房价影响最大的显著特征,由于此处是一个切入点话题,故在此将问题简单化

4.1 获取房价中的显著特征矩阵

df_corr=dataframe.corr()
print(df_corr)

在这里插入图片描述

4.2 使用matplotlib包显示特征举证

%matplotlib inline
import seaborn as snssns.heatmap(dataframe.corr(),annot=True,fmt='.1f')

在这里插入图片描述

  1. 确认在特征矩阵中[RM - 每间住宅的平均房间数]是房价的显著特征

在4的分析中我们发现卧室的个数与房屋价格成正相关

  1. 输出RM与房价的关系
X_rm=dataframe['RM'].values
Y=dataframe['price'].values
rm_to_price={r:y for r,y in zip (X_rm,Y)}
print(rm_to_price)
import matplotlib.pyplot as pltplt.scatter(X_rm,Y)
plt.show()

在这里插入图片描述

  1. 传统分析方法

当需要咨询房价是,输入RM信息,在上述的对应关系中查找,如果有则返回该信息,如果没有则返回该RM信息的相关信息值得算式值


import numpy as np
def find_price_by_similar(history_price,query_x,topn=3):most_similar_items=sorted(history_price.items(),key=lambda e:(e[0]-query_x)**2)[:topn]print(most_similar_items)most_similar_prices=[price for rm,price in most_similar_items]average_price=np.mean(most_similar_prices)return average_pricefind_price_by_similar(rm_to_price,4)find_price_by_similar(rm_to_price,7)

在这里插入图片描述

代码是给人看的,只是偶尔给机器运行一下

这篇关于神经网络从小白到入门:一、从波士顿房价问题切入TF神经网络:KNN算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/512805

相关文章

如何解决idea的Module:‘:app‘platform‘android-32‘not found.问题

《如何解决idea的Module:‘:app‘platform‘android-32‘notfound.问题》:本文主要介绍如何解决idea的Module:‘:app‘platform‘andr... 目录idea的Module:‘:app‘pwww.chinasem.cnlatform‘android-32

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、

SpringBoot应用中出现的Full GC问题的场景与解决

《SpringBoot应用中出现的FullGC问题的场景与解决》这篇文章主要为大家详细介绍了SpringBoot应用中出现的FullGC问题的场景与解决方法,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录Full GC的原理与触发条件原理触发条件对Spring Boot应用的影响示例代码优化建议结论F

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

Pyserial设置缓冲区大小失败的问题解决

《Pyserial设置缓冲区大小失败的问题解决》本文主要介绍了Pyserial设置缓冲区大小失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录问题描述原因分析解决方案问题描述使用set_buffer_size()设置缓冲区大小后,buf

resultMap如何处理复杂映射问题

《resultMap如何处理复杂映射问题》:本文主要介绍resultMap如何处理复杂映射问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录resultMap复杂映射问题Ⅰ 多对一查询:学生——老师Ⅱ 一对多查询:老师——学生总结resultMap复杂映射问题

java实现延迟/超时/定时问题

《java实现延迟/超时/定时问题》:本文主要介绍java实现延迟/超时/定时问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java实现延迟/超时/定时java 每间隔5秒执行一次,一共执行5次然后结束scheduleAtFixedRate 和 schedu

如何解决mmcv无法安装或安装之后报错问题

《如何解决mmcv无法安装或安装之后报错问题》:本文主要介绍如何解决mmcv无法安装或安装之后报错问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mmcv无法安装或安装之后报错问题1.当我们运行YOwww.chinasem.cnLO时遇到2.找到下图所示这里3.

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col