白手起家学习数据科学 ——k-Nearest Neighbors之“例子篇”(九)

2023-11-22 12:08

本文主要是介绍白手起家学习数据科学 ——k-Nearest Neighbors之“例子篇”(九),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

例子:最喜欢的编程语言(Example: Favorite Languages)

DataSciencester网站用户调查结果出来了,我们发现在许多大城市里人们所喜欢的编程语言如下:

# each entry is ([longitude, latitude], favorite_language)cities = [([-122.3 , 47.53], "Python"),  # Seattle([ -96.85, 32.85], "Java"),    # Austin([ -89.33, 43.13], "R"),       # Madison]

公司副总裁想要知道,在没有参加调查的地方,是否我们能使用这些结果预测最喜欢的编程语言。

像往常一样,第一个步骤是把数据画出来:

# key is language, value is pair (longitudes, latitudes)
plots = { "Java" : ([], []), "Python" : ([], []), "R" : ([], []) }# we want each language to have a different marker and color
markers = { "Java" : "o", "Python" : "s", "R" : "^" }
colors  = { "Java" : "r", "Python" : "b", "R" : "g" }for (longitude, latitude), language in cities:plots[language][0].append(longitude)plots[language][1].append(latitude)# create a scatter series for each language
for language, (x, y) in plots.iteritems():plt.scatter(x, y, color=colors[language], marker=markers[language], label=language, zorder=10)plot_state_borders(plt)      # pretend we have a function that does thisplt.legend(loc=0)            # let matplotlib choose the location
plt.axis([-130,-60,20,55])   # set the axesplt.title("Favorite Programming Languages")
plt.show()

这里写图片描述

由于相近的地方趋向同一种编程语言,KNN似乎是一种合理的预测语言模型。

如果我们试着使用相邻城市而不是本身来预测每个城市所喜爱的语言,会发生什么呢:

# try several different values for k
for k in [1, 3, 5, 7]:num_correct = 0for city in cities:location, actual_language = cityother_cities = [other_cityfor other_city in citiesif other_city != city]predicted_language = knn_classify(k, other_cities, location)if predicted_language == actual_language:num_correct += 1print k, "neighbor[s]:", num_correct, "correct out of", len(cities)

看起来3NN执行的效果最好,大约59%的正确率:

这里写图片描述

现在我们能看出在最近邻方案中什么区域被分类成哪种语言,我们能画图如下:

plots = { "Java" : ([], []), "Python" : ([], []), "R" : ([], []) }k = 1 # or 3, or 5, or ...for longitude in range(-130, -60):for latitude in range(20, 55):predicted_language = knn_classify(k, cities, [longitude, latitude])plots[predicted_language][0].append(longitude)plots[predicted_language][1].append(latitude)

在下图,展示的是k=1情况:
这里写图片描述

当k增加到5时,边界变得更加光滑:
这里写图片描述

这里是我们粗略的进行比较,如果它们有单位,你可能想要先进行尺度变换操作。接下来我们将要介绍不同维度距离的变化。

这篇关于白手起家学习数据科学 ——k-Nearest Neighbors之“例子篇”(九)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/410024

相关文章

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》:本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么,可以干什么?3、Spr

SpringBoot集成Milvus实现数据增删改查功能

《SpringBoot集成Milvus实现数据增删改查功能》milvus支持的语言比较多,支持python,Java,Go,node等开发语言,本文主要介绍如何使用Java语言,采用springboo... 目录1、Milvus基本概念2、添加maven依赖3、配置yml文件4、创建MilvusClient

SpringValidation数据校验之约束注解与分组校验方式

《SpringValidation数据校验之约束注解与分组校验方式》本文将深入探讨SpringValidation的核心功能,帮助开发者掌握约束注解的使用技巧和分组校验的高级应用,从而构建更加健壮和可... 目录引言一、Spring Validation基础架构1.1 jsR-380标准与Spring整合1

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入