数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展

本文主要是介绍数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近期学习汤小丹老师的《计算机操作系统》收获颇多,联想到之前有朋友说:Python比R语言好,原因是Python能处理的数据量比R语言大,在我看来二者并没有谁好谁差,只是看谁能用的好,谁用的频率大而已。

当数据量较大的时候,想是得需要借助多台计算机并行跨节点的方式才能处理。例如,目前已经有了PySpark 、SparkR等的分布式处理方法。

情况描述

1.使用软件对数据进行计算,常常伴随会出现执行时间长,数据卡顿的现象。

2.计算机执行程序的时候,通常在内存保存待处理的数据。程序是为了实现一个特定的目标而预先设计的一组可操作的工作步骤,就可以称为一个程序。对于计算机系统,程序就是系统可以识别的一组有序的指令。

3.这组指令指挥这计算机系统工作。对于计算机系统,简单的说,程序就是系统可以识别的一组有序的指令。程序存储在磁盘上,被加载到内存中,计算机系统从内存中逐条读取指令并执行。

因此数据卡顿这个原因是由于数据计算内存在进行控制,数据量的计算是在内存中发生,那内存的数量是一定的,怎么可能不会卡顿呢?

如何对数据计算过程中的卡顿进行一些改善,于是引入了计算机的虚存概念。

虚存的概念

**把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”,这是虚拟内存。**进程不完全载入,就叫虚存。可以分成按需取页和按需取段两种方式。

如果用户编制程序时,可以不考虑内存的实际容量,即允许程序中的逻辑地址空间大于内存的绝对地址空间,那么,会使用户感到极大的方便。存储管理利用磁盘作为内存的后援,当一个大型的程序要装入内存时,仅把当前需要的部分装入,其余部分暂留在磁盘上。程序执行中要用到不在内存中的信息时,再由操作系统将其装入内存。如果内存空间不够,则可由操作系统采用覆盖技术。这样,用户就感到计算机系统提供了容量极大的内存空间。实际上,这个容量极大的内存空间不是物理意义上的内存,而是操作系统中的一种存储管理方式,这种方式为用户提供的是一个虚拟的存储器。虚拟存储器比实际内存的容量大,起到了扩充内存空间的作用。

虚存的实际应用

以R语言为例,查看系统中对R语言能够处理的数据分配内存限制进行查看,使用memory.limit(),得到R语言的内存限制为8073,约为7.8G,和我计算机的最大内存接近,R语言在使用内存室,并没有多大的限制。
在这里插入图片描述

此时,R语言的内存使用是7.8G,这和系统的内存几乎相同,是不是意味着,内存没有办法进行增加?此时,可以进一步借助虚拟内存对R语言的内存进行扩增。输入memory.limit(102400),就直接把系统分配给R语言的内存使用上限调到100G。如下所示:
在这里插入图片描述

那这样操作是不是合理呢?并不是的,还需要在windows中对数据的虚拟内存进行适当上限的调整才可以。
在这里插入图片描述
对以上进行设置后,重启计算机,默认的虚拟内存就成功了。

不过再用R语言处理数据,需要每次新打开R语言之前都要运行memory.limit(102400)一下。

使用memory.size()查看现在的workspace的内存使用情况和之前的内存情况是否相同。

memory.limit()
memory.limit(102400)
memory.size()

在这里插入图片描述

当再次使用该软件对数据进行分析和运算时,试试看,数据的处理速度,可谓之:千里江陵~~

这篇关于数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/801967

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Window Server2016加入AD域的方法步骤

《WindowServer2016加入AD域的方法步骤》:本文主要介绍WindowServer2016加入AD域的方法步骤,包括配置DNS、检测ping通、更改计算机域、输入账号密码、重启服务... 目录一、 准备条件二、配置ServerB加入ServerA的AD域(test.ly)三、查看加入AD域后的变

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动