机器学习实战python与R共舞

2023-10-28 10:38

本文主要是介绍机器学习实战python与R共舞,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

机器学习实战中的代码,学习并交流。第一个是kNN分类函数。以下是Python的代码,后来也尝试用R写了一下,发现他们在处理数据上R还是很强大的。

#!/usr/bin/python
from numpy import *
import operatordef classfy0(inX,dataSet,labels,k):dataSetSize=dataSet.shape[0]  # shape 方法获得数据的行数和列数,然后选取行数diffMat=tile(inX,(dataSetSize,1))-dataSet #tile 方法是数组的重复,里边的元祖表示的是对这个数组重复的纬度,这里表示几行几列sqDiffMat=diffMat**2sqDistances=sqDiffMat.sum(axis=1)  #按照行来对计算的平方和求加,下一步计算距离distances=sqDistances**0.5sortedDistIndicies=distance.argsort() #获取距离的数据进行排序classCount={}for i in range(k):voteIlabels=labels[sortedDistIndicies[i]]        #获得排序的前k个元素,sortedDistIndicies[i] 是排序后距离值的索引,这个索引也是label的索引。每个元素的标签是新建字典的键classCount[voteIlabels]=classCount.get(voteIlabels,0)+1 # 字典的值是每个字典的键出现的次数的累计,get方法内输入0,表示#如果不存在该键,则得到的值就是输入的值,这里因为创建的是空字典,每一个键的输入都是不存在的,第二次输入的时候,在上一个的计数上加1sortedClassCount=sorted(classCount.iteritems(), key=operator.itemgetter(1),reverse=True)    #对字典进行排序,sorted中的参数key是operator.itemgetter取第一个类型,#也就是按照字典的值来排序return sortedClassCount[0][0]  #返回排序后是一个元祖,返回第一个元祖的第一个值。

下边是R的代码,由于是初学,附上了很多注释,还望见谅。

kNN<-function(input, dataset,label,k){if(class(input)!="numeric") stop(cat("you must input a numeric vector"))if(class(dataset)!="matrix") stop(cat("you mush input your traning data as a matrix"))datasize=nrow(dataset)diffMat=matrix(rep(input,datasize),nrow=datasize,byrow = TRUE)-datasetsqDiffMat=diffMat^2sqDistances=apply(sqDiffMat,1,sum)distances=sqrt(sqDistances)sortedDistIndicies=order(distances)classCount=list()              #创建一个空列表,列表的名字是标签,列表的内容是前k个标签中,某个标签出现的次数for(i in 1:k){name=label[sortedDistIndicies[i]]       #获取前k个排序后的标签的名字sortedDistIndicies[i] 是获得排序后距离值的索引,这个索引也是label的索引。classCount[[name]]=c(classCount[[name]],1) #并把标签出现的次数赋值为标签的内容,classCount[[name]] 是null,#因为这个是个空列表,每次如果出现这个标签,就加上1}results=lapply(classCount, function(x) sum(x)) #对列表中的数据进行相加,看出现的频率return(results[1])
}

这篇关于机器学习实战python与R共舞的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/292638

相关文章

使用Python绘制蛇年春节祝福艺术图

《使用Python绘制蛇年春节祝福艺术图》:本文主要介绍如何使用Python的Matplotlib库绘制一幅富有创意的“蛇年有福”艺术图,这幅图结合了数字,蛇形,花朵等装饰,需要的可以参考下... 目录1. 绘图的基本概念2. 准备工作3. 实现代码解析3.1 设置绘图画布3.2 绘制数字“2025”3.3

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python

python 字典d[k]中key不存在的解决方案

《python字典d[k]中key不存在的解决方案》本文主要介绍了在Python中处理字典键不存在时获取默认值的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录defaultdict:处理找不到的键的一个选择特殊方法__missing__有时候为了方便起见,

Golang使用minio替代文件系统的实战教程

《Golang使用minio替代文件系统的实战教程》本文讨论项目开发中直接文件系统的限制或不足,接着介绍Minio对象存储的优势,同时给出Golang的实际示例代码,包括初始化客户端、读取minio对... 目录文件系统 vs Minio文件系统不足:对象存储:miniogolang连接Minio配置Min

使用Python绘制可爱的招财猫

《使用Python绘制可爱的招财猫》招财猫,也被称为“幸运猫”,是一种象征财富和好运的吉祥物,经常出现在亚洲文化的商店、餐厅和家庭中,今天,我将带你用Python和matplotlib库从零开始绘制一... 目录1. 为什么选择用 python 绘制?2. 绘图的基本概念3. 实现代码解析3.1 设置绘图画

Python pyinstaller实现图形化打包工具

《Pythonpyinstaller实现图形化打包工具》:本文主要介绍一个使用PythonPYQT5制作的关于pyinstaller打包工具,代替传统的cmd黑窗口模式打包页面,实现更快捷方便的... 目录1.简介2.运行效果3.相关源码1.简介一个使用python PYQT5制作的关于pyinstall

使用Python实现大文件切片上传及断点续传的方法

《使用Python实现大文件切片上传及断点续传的方法》本文介绍了使用Python实现大文件切片上传及断点续传的方法,包括功能模块划分(获取上传文件接口状态、临时文件夹状态信息、切片上传、切片合并)、整... 目录概要整体架构流程技术细节获取上传文件状态接口获取临时文件夹状态信息接口切片上传功能文件合并功能小

python实现自动登录12306自动抢票功能

《python实现自动登录12306自动抢票功能》随着互联网技术的发展,越来越多的人选择通过网络平台购票,特别是在中国,12306作为官方火车票预订平台,承担了巨大的访问量,对于热门线路或者节假日出行... 目录一、遇到的问题?二、改进三、进阶–展望总结一、遇到的问题?1.url-正确的表头:就是首先ur