数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展

本文主要是介绍数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近期学习汤小丹老师的《计算机操作系统》收获颇多,联想到之前有朋友说:Python比R语言好,原因是Python能处理的数据量比R语言大,在我看来二者并没有谁好谁差,只是看谁能用的好,谁用的频率大而已。

当数据量较大的时候,想是得需要借助多台计算机并行跨节点的方式才能处理。例如,目前已经有了PySpark 、SparkR等的分布式处理方法。

情况描述

1.使用软件对数据进行计算,常常伴随会出现执行时间长,数据卡顿的现象。

2.计算机执行程序的时候,通常在内存保存待处理的数据。程序是为了实现一个特定的目标而预先设计的一组可操作的工作步骤,就可以称为一个程序。对于计算机系统,程序就是系统可以识别的一组有序的指令。

3.这组指令指挥这计算机系统工作。对于计算机系统,简单的说,程序就是系统可以识别的一组有序的指令。程序存储在磁盘上,被加载到内存中,计算机系统从内存中逐条读取指令并执行。

因此数据卡顿这个原因是由于数据计算内存在进行控制,数据量的计算是在内存中发生,那内存的数量是一定的,怎么可能不会卡顿呢?

如何对数据计算过程中的卡顿进行一些改善,于是引入了计算机的虚存概念。

虚存的概念

**把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”,这是虚拟内存。**进程不完全载入,就叫虚存。可以分成按需取页和按需取段两种方式。

如果用户编制程序时,可以不考虑内存的实际容量,即允许程序中的逻辑地址空间大于内存的绝对地址空间,那么,会使用户感到极大的方便。存储管理利用磁盘作为内存的后援,当一个大型的程序要装入内存时,仅把当前需要的部分装入,其余部分暂留在磁盘上。程序执行中要用到不在内存中的信息时,再由操作系统将其装入内存。如果内存空间不够,则可由操作系统采用覆盖技术。这样,用户就感到计算机系统提供了容量极大的内存空间。实际上,这个容量极大的内存空间不是物理意义上的内存,而是操作系统中的一种存储管理方式,这种方式为用户提供的是一个虚拟的存储器。虚拟存储器比实际内存的容量大,起到了扩充内存空间的作用。

虚存的实际应用

以R语言为例,查看系统中对R语言能够处理的数据分配内存限制进行查看,使用memory.limit(),得到R语言的内存限制为8073,约为7.8G,和我计算机的最大内存接近,R语言在使用内存室,并没有多大的限制。
在这里插入图片描述

此时,R语言的内存使用是7.8G,这和系统的内存几乎相同,是不是意味着,内存没有办法进行增加?此时,可以进一步借助虚拟内存对R语言的内存进行扩增。输入memory.limit(102400),就直接把系统分配给R语言的内存使用上限调到100G。如下所示:
在这里插入图片描述

那这样操作是不是合理呢?并不是的,还需要在windows中对数据的虚拟内存进行适当上限的调整才可以。
在这里插入图片描述
对以上进行设置后,重启计算机,默认的虚拟内存就成功了。

不过再用R语言处理数据,需要每次新打开R语言之前都要运行memory.limit(102400)一下。

使用memory.size()查看现在的workspace的内存使用情况和之前的内存情况是否相同。

memory.limit()
memory.limit(102400)
memory.size()

在这里插入图片描述

当再次使用该软件对数据进行分析和运算时,试试看,数据的处理速度,可谓之:千里江陵~~

这篇关于数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/801967

相关文章

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻:当你的API接口又双叒崩了!2️⃣ 神兵天降:3行代码解决验证难题3️⃣ 深度

检查 Nginx 是否启动的几种方法

《检查Nginx是否启动的几种方法》本文主要介绍了检查Nginx是否启动的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录1. 使用 systemctl 命令(推荐)2. 使用 service 命令3. 检查进程是否存在4

Java方法重载与重写之同名方法的双面魔法(最新整理)

《Java方法重载与重写之同名方法的双面魔法(最新整理)》文章介绍了Java中的方法重载Overloading和方法重写Overriding的区别联系,方法重载是指在同一个类中,允许存在多个方法名相同... 目录Java方法重载与重写:同名方法的双面魔法方法重载(Overloading):同门师兄弟的不同绝

MySQL字符串转数值的方法全解析

《MySQL字符串转数值的方法全解析》在MySQL开发中,字符串与数值的转换是高频操作,本文从隐式转换原理、显式转换方法、典型场景案例、风险防控四个维度系统梳理,助您精准掌握这一核心技能,需要的朋友可... 目录一、隐式转换:自动但需警惕的&ld编程quo;双刃剑”二、显式转换:三大核心方法详解三、典型场景

Spring配置扩展之JavaConfig的使用小结

《Spring配置扩展之JavaConfig的使用小结》JavaConfig是Spring框架中基于纯Java代码的配置方式,用于替代传统的XML配置,通过注解(如@Bean)定义Spring容器的组... 目录JavaConfig 的概念什么是JavaConfig?为什么使用 JavaConfig?Jav

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

springboot中配置logback-spring.xml的方法

《springboot中配置logback-spring.xml的方法》文章介绍了如何在SpringBoot项目中配置logback-spring.xml文件来进行日志管理,包括如何定义日志输出方式、... 目录一、在src/main/resources目录下,也就是在classpath路径下创建logba

SQL Server中行转列方法详细讲解

《SQLServer中行转列方法详细讲解》SQL行转列、列转行可以帮助我们更方便地处理数据,生成需要的报表和结果集,:本文主要介绍SQLServer中行转列方法的相关资料,需要的朋友可以参考下... 目录前言一、为什么需要行转列二、行转列的基本概念三、使用PIVOT运算符进行行转列1.创建示例数据表并插入数

C++打印 vector的几种方法小结

《C++打印vector的几种方法小结》本文介绍了C++中遍历vector的几种方法,包括使用迭代器、auto关键字、typedef、计数器以及C++11引入的范围基础循环,具有一定的参考价值,感兴... 目录1. 使用迭代器2. 使用 auto (C++11) / typedef / type alias