机器学习实战python与R共舞

2023-10-28 10:38

本文主要是介绍机器学习实战python与R共舞,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

机器学习实战中的代码,学习并交流。第一个是kNN分类函数。以下是Python的代码,后来也尝试用R写了一下,发现他们在处理数据上R还是很强大的。

#!/usr/bin/python
from numpy import *
import operatordef classfy0(inX,dataSet,labels,k):dataSetSize=dataSet.shape[0]  # shape 方法获得数据的行数和列数,然后选取行数diffMat=tile(inX,(dataSetSize,1))-dataSet #tile 方法是数组的重复,里边的元祖表示的是对这个数组重复的纬度,这里表示几行几列sqDiffMat=diffMat**2sqDistances=sqDiffMat.sum(axis=1)  #按照行来对计算的平方和求加,下一步计算距离distances=sqDistances**0.5sortedDistIndicies=distance.argsort() #获取距离的数据进行排序classCount={}for i in range(k):voteIlabels=labels[sortedDistIndicies[i]]        #获得排序的前k个元素,sortedDistIndicies[i] 是排序后距离值的索引,这个索引也是label的索引。每个元素的标签是新建字典的键classCount[voteIlabels]=classCount.get(voteIlabels,0)+1 # 字典的值是每个字典的键出现的次数的累计,get方法内输入0,表示#如果不存在该键,则得到的值就是输入的值,这里因为创建的是空字典,每一个键的输入都是不存在的,第二次输入的时候,在上一个的计数上加1sortedClassCount=sorted(classCount.iteritems(), key=operator.itemgetter(1),reverse=True)    #对字典进行排序,sorted中的参数key是operator.itemgetter取第一个类型,#也就是按照字典的值来排序return sortedClassCount[0][0]  #返回排序后是一个元祖,返回第一个元祖的第一个值。

下边是R的代码,由于是初学,附上了很多注释,还望见谅。

kNN<-function(input, dataset,label,k){if(class(input)!="numeric") stop(cat("you must input a numeric vector"))if(class(dataset)!="matrix") stop(cat("you mush input your traning data as a matrix"))datasize=nrow(dataset)diffMat=matrix(rep(input,datasize),nrow=datasize,byrow = TRUE)-datasetsqDiffMat=diffMat^2sqDistances=apply(sqDiffMat,1,sum)distances=sqrt(sqDistances)sortedDistIndicies=order(distances)classCount=list()              #创建一个空列表,列表的名字是标签,列表的内容是前k个标签中,某个标签出现的次数for(i in 1:k){name=label[sortedDistIndicies[i]]       #获取前k个排序后的标签的名字sortedDistIndicies[i] 是获得排序后距离值的索引,这个索引也是label的索引。classCount[[name]]=c(classCount[[name]],1) #并把标签出现的次数赋值为标签的内容,classCount[[name]] 是null,#因为这个是个空列表,每次如果出现这个标签,就加上1}results=lapply(classCount, function(x) sum(x)) #对列表中的数据进行相加,看出现的频率return(results[1])
}

这篇关于机器学习实战python与R共舞的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/292638

相关文章

Python获取C++中返回的char*字段的两种思路

《Python获取C++中返回的char*字段的两种思路》有时候需要获取C++函数中返回来的不定长的char*字符串,本文小编为大家找到了两种解决问题的思路,感兴趣的小伙伴可以跟随小编一起学习一下... 有时候需要获取C++函数中返回来的不定长的char*字符串,目前我找到两种解决问题的思路,具体实现如下:

python连接本地SQL server详细图文教程

《python连接本地SQLserver详细图文教程》在数据分析领域,经常需要从数据库中获取数据进行分析和处理,下面:本文主要介绍python连接本地SQLserver的相关资料,文中通过代码... 目录一.设置本地账号1.新建用户2.开启双重验证3,开启TCP/IP本地服务二js.python连接实例1.

基于Python和MoviePy实现照片管理和视频合成工具

《基于Python和MoviePy实现照片管理和视频合成工具》在这篇博客中,我们将详细剖析一个基于Python的图形界面应用程序,该程序使用wxPython构建用户界面,并结合MoviePy、Pill... 目录引言项目概述代码结构分析1. 导入和依赖2. 主类:PhotoManager初始化方法:__in

Python从零打造高安全密码管理器

《Python从零打造高安全密码管理器》在数字化时代,每人平均需要管理近百个账号密码,本文将带大家深入剖析一个基于Python的高安全性密码管理器实现方案,感兴趣的小伙伴可以参考一下... 目录一、前言:为什么我们需要专属密码管理器二、系统架构设计2.1 安全加密体系2.2 密码强度策略三、核心功能实现详解

Python Faker库基本用法详解

《PythonFaker库基本用法详解》Faker是一个非常强大的库,适用于生成各种类型的伪随机数据,可以帮助开发者在测试、数据生成、或其他需要随机数据的场景中提高效率,本文给大家介绍PythonF... 目录安装基本用法主要功能示例代码语言和地区生成多条假数据自定义字段小结Faker 是一个 python

Python实现AVIF图片与其他图片格式间的批量转换

《Python实现AVIF图片与其他图片格式间的批量转换》这篇文章主要为大家详细介绍了如何使用Pillow库实现AVIF与其他格式的相互转换,即将AVIF转换为常见的格式,比如JPG或PNG,需要的小... 目录环境配置1.将单个 AVIF 图片转换为 JPG 和 PNG2.批量转换目录下所有 AVIF 图

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

详解如何通过Python批量转换图片为PDF

《详解如何通过Python批量转换图片为PDF》:本文主要介绍如何基于Python+Tkinter开发的图片批量转PDF工具,可以支持批量添加图片,拖拽等操作,感兴趣的小伙伴可以参考一下... 目录1. 概述2. 功能亮点2.1 主要功能2.2 界面设计3. 使用指南3.1 运行环境3.2 使用步骤4. 核

Python 安装和配置flask, flask_cors的图文教程

《Python安装和配置flask,flask_cors的图文教程》:本文主要介绍Python安装和配置flask,flask_cors的图文教程,本文通过图文并茂的形式给大家介绍的非常详细,... 目录一.python安装:二,配置环境变量,三:检查Python安装和环境变量,四:安装flask和flas

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA