独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)

本文主要是介绍独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文标题:How to Create a Linux Virtual Machine For Machine Learning Development With Python 3

作者:Jason Brownlee

翻译:杨金鸿

翻译校对:白静

文字校对:丁楠雅

本文长度为3000字,建议阅读8分钟

本文主要内容包括Linux虚拟机的优点、安装教程以及使用VM的技巧。


Linux是使用Python进行机器学习开发的极佳环境。这些工具能够被简便快捷地安装,并且您可以直接开发和运行大型模型。

 

在本教程中,您将了解如何使用Python创建和安装用于机器学习的Linux虚拟机。完成本教程后,您将知道:


  • 如何下载和安装VirtualBox来管理虚拟机

  • 如何下载和安装Fedora Linux

  • 如何在Python 3中为机器学习安装一个SciPy环境


如果您的电脑操作系统是Windows、Mac OS X和Linux。那么本教程是适合您的。


Linux虚拟机的好处


您可能有很多原因想要使用Linux虚拟机来进行Python机器学习开发。例如,下面列出了使用虚拟机的5大好处:


  • 使用在本机系统上不可用的工具(如果您的操作系统是Windows)

  • 在不影响本地环境的情况下安装和使用机器学习工具(例如:使用Python 3工具)

  • 为不同的项目(Python2和Python3)提供高度定制的环境

  • 为了节省机器的状态,并准确地找出你离开的地方(从机器转跳到机器)

  • 与其他开发人员共享开发环境(创建一次,多次重用)


也许最有利的一点是第一点,能够很容易地使用不受环境支持的电脑操作系统,使用机器学习工具。


我是一个OS X用户,尽管机器学习工具可以使用BREW和MacPorts安装,我还是认为为机器学习开发安装和使用Linux虚拟机更容易。


概述


本教程分为三个部分:


1.下载并安装VirtualBox

2.下载并在虚拟机中安装Fedora Linux

3.安装Python机器学习环境


1. 下载并安装VirtualBox


VirtualBox是一个用于创建和管理虚拟机的免费开源平台。


一旦安装好,你就可以创建所有你喜欢的虚拟机,只要你有ISO映像或者CD就可以安装。


  • 访问VirtualBox.org

  • 点击“下载VirtualBox”来访问下载页面

 


  • 为您的虚拟机选择二进制文件

  • 为您的系统安装软件,并遵循安装说明

 


  • 打开VirtualBox软件并批准它的工作

 


2.下载并安装Fedora Linux


我选择了Fedora Linux,因为我认为和其他的Linux相比,它更亲切、更温和。对于面向虚拟机和开发人员的RedHat Linux来说,它具有领先优势。


2.1下载Fedora ISO映像


让我们从下载Fedora Linux的ISO开始。Fedora 25为64位版本。


  • 访问getfedora.org

  • 单击“Workstation”访问虚拟机页面

  • 点击“立刻下载”来访问下载页面

  • 在“其他下载”下,点击“64位1.3 GB实时镜像”

 


  • 您现在应该有一个具有名字的ISO文件: “Fedora-Workstation-Live-x86_64-25-1.3.iso“


现在我们已经准备好在VirtualBox中创建VM了。


2.2创建Fedora虚拟机


现在,让我们在VirtualBox中创建Fedora虚拟机。


  • 打开VirtualBox软件

  • 点击“NEW”按钮

  • 选择名称和操作系统 

          名称:Fedora25

          类型:Linux

          版本:Fedora (64-bit)

          点击:“Continue”

 


  • 配置内存大小

          2048

  • 配置硬盘

          现在创建一个虚拟硬盘。

          硬盘文件类型。

          VDI(VirtualBox磁盘镜像)。

          物理硬盘上的存储。

          动态分配

          文件位置和大小:10G


现在我们已经准备好从ISO映像安装Fedora。


2.3 Fedora Linux 安装


现在,让我们在新的虚拟机上安装Fedora Linux。


  • 选择新的虚拟机并点击“开始”按钮

  • 单击文件夹图标,选择Fedora ISO文件

          “Fedora-Workstation-Live-x86_64-25-1.3.iso”

 


  • 点击“开始按钮”

  • 选择第一个选项“Start Fedora-Live-Workstation-Live 25”并按下回车键

  • 点击“ESC”键跳过检查

  • 选择“实时系统用户”

  • 选择“安装到硬盘驱动器”

 


  • 完成“语言选择”(英语)

  • 完成“安装目标”(“ATA VBOX硬盘”)

          您可能需要等一分钟才能让VM创建硬盘

 


  • 点击“开始安装”

  • 设置root密码

  • 创建你自己的一个用户

            记下用户名和密码(以便以后可以使用)

            勾选“让这个用户为管理员”(这样您就可以安装软件)

 


  • 等待安装完成。(大约5分钟)

  • 点击“退出”,点击右上方的电源图标,选择“关机”


2.4 Fedora Linux安装完成


Fedora Linux已经安装;让我们完成最后的安装,使它可以使用。


  • 在VirtualBox选择fedora25 VM,在“存储”下,单击“光盘驱动器”选择“从虚拟驱动器中删除磁盘”,以弹出ISO镜像

  • 单击“开始”按钮启动Fedora Linux的安装

  • 使用你创建的用户登入系统

 


  • 完成安装

         选择语言“英语”

         点击“下一步”

         选择键盘为“US”

         点击“下一步”

         配置隐私权

         点击“下一步”

         连接你的网络账户

         点击“跳过”

         点击“开始使用Fedora”

  • 关闭自动启动的帮助系统


现在我们有了Fedora Linux虚拟机,准备安装新的软件。


3.安装Python机器学习环境


Fedora使用Gnome 3作为窗口管理器。Gnome 3与之前的Gnome版本有很大的不同;通过使用内置的帮助系统,您可以学习如何使用它。


3.1 安装Python环境


让我们从为机器学习开发安装所需的Python库开始。


  • 打开终端

         点击“Activities”

         输入:“终端”

         点击图标或者按回车键

 


  • 确认Python3安装

          输入:

python3 --version

 


  • 安装Python机器学习环境。具体地:

          NumPy

          SciPy

          Pandas

          Matplotlib

          Statsmodels

          Scikit-Learn


DNF是一个软件安装系统,正式的yum。第一次运行DNF时,它将更新包的数据库,这可能需要一分钟。


输入:

sudo dnf install python3-numpy python3-scipy python3-scikit-learn python3-pandas python3-matplotlib python3-statsmodels


当提示时输入您的密码,通过按“y”或“enter”来确认安装。


3.2 确认Python环境


现在已经安装了环境,我们可以通过打印每个必需的库的版本来确认它。


  • 打开:“Gedit”.

          点击:“Activities”

          输入:“gedit“

  • 点击图标或者按回车键


在主目录中将其保存为versions.py

# scipy

import scipy

print('scipy: %s' % scipy.__version__)

# numpy

import numpy

print('numpy: %s' % numpy.__version__)

# matplotlib

import matplotlib

print('matplotlib: %s' % matplotlib.__version__)

# pandas

import pandas

print('pandas: %s' % pandas.__version__)

# scikit-learn

import sklearn

print('sklearn: %s' % sklearn.__version__)

# statsmodels

import statsmodels

print('statsmodels: %s' % statsmodels.__version__)


没有复制粘贴的支持;你可能想要在VM中打开Firefox、浏览这个界面并且复制粘贴这个脚本到你的gedit窗口中。

 


  • 在终端中运行脚本


输入:

python3 versions.py

 


使用VM的技巧


本节列出一些使用VM进行机器学习开发的技巧。


  • 复制粘贴和文件夹共享:这些特性需要在Linux虚拟机中安装“Guest Additions”。我没有能够正确地安装它,因此不使用这些特性。如果你喜欢,你可以试试;请在评论中让我知道你是怎么做的。


  • 使用GitHub:我建议在GitHub中存储所有代码,并从VM中检查代码。这使得从VM中获取代码和资产变得更加容易。


  • 使用Sublime. 我认为对用于Linux开发来说,Sublime是一个很棒的文本编辑器,至少比Gedit好。


  • 使用AWS来做大的工作:您可以使用相同的步骤在Amazon Web Services上安装Fedora Linux,以便在云中运行大型模型。


  • VM工具:通过关闭窗口,您可以在任何时候保存VM。您还可以在任意时刻获取VM的快照,并返回到快照。如果您正在对文件系统进行较大的更改,那么这将是很有帮助的。


  • 您可以轻松地在Linux中安装Python2和Python 3,并使用Python(而不是python3)二进制文件,或者使用替代方案来在两者之间切换。


  • 笔记本:考虑在VM内运行一个笔记本服务器并打开防火墙,这样您就可以在VM之外的主工作站进行连接和运行


你有什么建议可以分享吗?请在评论中告诉我。


扩展阅读


下面是一些关于进一步阅读的资源,如果您对本教程中使用的工具是新手的话。


  • VirtualBox User Manual

  • Fedora Documentation

  • Fedora Wiki (tons of help on common topics)

  • SciPy Homepage

  • Scikit-Learn Homepage


总结


在本教程中,您了解了如何为Python机器学习开发安装Linux虚拟机。


具体来说,你学到了:


  • 如何下载和安装VirtualBox,免费的开源软件来管理虚拟机。

  • 如何下载和安装Fedora Linux,这是一个面向开发者的友好的Linux发行版。

  • 如何为机器学习开发安装和测试一个Python3环境。


你完成了这个教程吗?请在下面的评论中告诉我。


原文链接:

https://machinelearningmastery.com/linux-virtual-machine-machine-learning-development-python-3/

编辑:文婧

杨金鸿,北京护航科技有限公司员工,在业余时间喜欢翻译一些技术文档。喜欢阅读有关数据挖掘、数据库之类的书,学习java语言编程等,希望能在数据派平台上熟识更多爱好相同的伙伴,今后能在数据科学的道路上走的更远,飞的更远。

翻译组招募信息

工作内容:将选取好的外文前沿文章准确地翻译成流畅的中文。如果你是数据科学/统计学/计算机专业的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友,数据派翻译组欢迎你们加入!

你能得到:提高对于数据科学前沿的认知,提高对外文新闻来源渠道的认知,海外的朋友可以和国内技术应用发展保持联系,数据派团队产学研的背景为志愿者带来好的发展机遇。

其他福利:和来自于名企的数据科学工作者,北大清华以及海外等名校学生共同合作、交流。

点击文末“阅读原文”加入数据派团队~


为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。


转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。


点击“阅读原文”加入组织~

这篇关于独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程代码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901777

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

Java调用DeepSeek API的最佳实践及详细代码示例

《Java调用DeepSeekAPI的最佳实践及详细代码示例》:本文主要介绍如何使用Java调用DeepSeekAPI,包括获取API密钥、添加HTTP客户端依赖、创建HTTP请求、处理响应、... 目录1. 获取API密钥2. 添加HTTP客户端依赖3. 创建HTTP请求4. 处理响应5. 错误处理6.

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

Android 悬浮窗开发示例((动态权限请求 | 前台服务和通知 | 悬浮窗创建 )

《Android悬浮窗开发示例((动态权限请求|前台服务和通知|悬浮窗创建)》本文介绍了Android悬浮窗的实现效果,包括动态权限请求、前台服务和通知的使用,悬浮窗权限需要动态申请并引导... 目录一、悬浮窗 动态权限请求1、动态请求权限2、悬浮窗权限说明3、检查动态权限4、申请动态权限5、权限设置完毕后

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

如何通过Python实现一个消息队列

《如何通过Python实现一个消息队列》这篇文章主要为大家详细介绍了如何通过Python实现一个简单的消息队列,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录如何通过 python 实现消息队列如何把 http 请求放在队列中执行1. 使用 queue.Queue 和 reque