在Docker中部署JupyterNotebook/JupyterHub

2023-11-11 10:59

本文主要是介绍在Docker中部署JupyterNotebook/JupyterHub,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

发现自己已经大半年没有更新博客了,主要还是忙,我觉得还是要把博客捡起来,不论是做环境搭建的整理还是技术点的记录都是好的,这个时间还是得花。不然时间一场就都忘了。

目录

  • 写在前面
  • JupyterNotebook的搭建
    • 镜像的选择
    • 启动容器
      • 容器参数配置——密码登录
      • 容器参数配置——文件夹映射
      • 容器参数配置——Jupyer后台运行
      • 容器参数配置——SSL证书配置与反向代理
  • JupyterHub的搭建
    • 什么是JupyerHub
    • 搭建JupyerHub

写在前面

从题目中可以猜到,本篇博文会分成两个部分:

  • JupyterNotebook的搭建
  • JupyterHub的搭建

当然本次的搭建都是在Docker中完成的,在Docker中搭建环境个人认为与本地搭建有以下优势:

  • DockerHub上有全球开发者提供的现成镜像,包括一些软件开发商提供的官方镜像,可以节省我们搭建环境的时间,因为有一些莫名其妙的BUG会困扰我们数小时甚至数天。
  • 已经搭建好的镜像可以很方便地进行迁移,也就是说,如果我们到了一个新环境,不需要再重复造轮子搭建环境了。
  • 最重要的:正因为Docker搭建环境的便携性,我们可以把更多的精力花在技术本身,而不是各种个样的环境构建上。

这里简单介绍以下JupyterNotebook,我习惯性的叫它为朱比特,对应的就是爱情之神丘比特,主要还是谐音的关系。以Python为例,Jupyter是一个可交互式的编程平台,它基于iPython ,类似IDLE,但是有比原生IDLE更强大的功能,例如可以支持MarkdownLatex等语法,同时,Matplotlib等绘图库也可以inline展示,这对数据分析、机器学习、人工神经网络的调参,编程语言教学等具有重大意义。可以发现,国内外的一些Python库的教学视频,很多都是基于Jupyter的。由于我本人是从事大数据的,因此也打算在进行数据分析时,从原来的PyCharm切换到Jupyter。

JupyterNotebook的搭建

在Docker中搭建JupyterNotebook的过程很简单,一共分为两步

  • 选取并拉取镜像
  • 容器参数设置与启动容器

镜像的选择

在官方的Docker镜像选择文档中,提供了一系列镜像,它们分别对应于不同的需求。

  • jupyter/base-notebook
  • jupyter/minimal-notebook
  • jupyter/r-notebook
  • jupyter/scipy-notebook
  • jupyter/tensorflow-notebook
  • jupyter/datascience-notebook
  • jupyter/pyspark-notebook
  • jupyter/all-spark-notebook

其中jupyter/base-notebook是所有镜像的基础。
根据需求选择好镜像后,就可以pull镜像了,例如选择了jupyter/datascience-notebook,则在终端中执行以下命令:

$ docker pull jupyter/datascience-notebook

启动容器

你可以直接使用docker run来启动容器,即按照官方文档中最简单的启动方法

docker run -p 8888:8888 jupyter/scipy-notebook:latest

利用这种方式启动容器时,Jupyter会运行在8888端口上,同时,所有的操作都是一次性的,也就是说,不会持久化到磁盘,在容器被关闭后,都会被删除。

这里介绍一些常用的参数配置

  • 密码登录
  • 文件夹映射
  • Jupyer后台运行
  • SSL证书配置与反向代理

容器参数配置——密码登录

默认情况下,Jupyter是不需要密码的,自己用还行,要是想在云服务器上搭建,就会产生安全问题。

Juyter使用的是sha1加密算法,虽然都是sha1,但是我们不能将明文用python自带的hashlib库进行加密后直接使用,要使用Jupyer自带的命令进行生成。

具体可以参考如下做法:

1、 使用最朴素的方式启动一个临时Jupyer容器
2、从网页打开Jupyer,并新建一个笔记本。或者以交互模式进入容器,打开Python的原生交互界面。这里以后者为例。
3、依次运行以下代码:

from notebook.auth import passwd
passwd()

输入密码和确认密码后,你会得到一个以sha1开头的字符串,类似

sha1:67c9e60bb8bxxxxxxaed

将整个字符串复制,包括``sha1`这个前缀。

然后,运行容器时,加上--NotebookApp.password参数即可。

$ docker run -d -p 8888:8888 jupyter/base-notebook start-notebook.sh --NotebookApp.password='sha1:74ba40f8xxxxxe'

启动服务后,在浏览器端会显示这样的效果:
在这里插入图片描述

容器参数配置——文件夹映射

前面我们所有的操作都是临时的,在容器被关闭后,所有的数据都会丢失,因此,在一般情况下,有必要将数据持久化。Docker自带这样的功能,也就是才启动容器时,增加参数-v。在Jupyer中,我们要将外部文件夹映射到/home/jovyan/work

以下是命令示例:

$ docker run -p 10000:8888 -v /your/local/folder:/home/jovyan/work jupyter/r-notebook

容器参数配置——Jupyer后台运行

直接在容器启动时加参数`-d``即可。
以下是命令时例:

docker run -d -p 8888:8888 jupyter/scipy-notebook:latest

容器参数配置——SSL证书配置与反向代理

默认情况下,Jupyer使用http,但是现在主流是https,Jupyer官方也建议使用https。这对本地来说无关紧要,对于部署在外网环境的,还是建议使用https。
JupyerNotebook Docker官方镜像也提供了设置https的方法。
我们从运营商申请到SSL证书时候,会有多种格式,这里我们选择Apache的就可以了。
在部署时,我们值需要.key.crt文件,并且将原文件重命名为notebook.keynotebook.crt。首先要先将证书所在的文件夹映射至容器中,这里是/etc/ssl/notebook

⚠️:Docker可以支持多个文件夹的映射,即多个-v参数,所以这里的映射与之前持久化的映射并不冲突。

然后运行以下命令:

docker run -d -p 8888:8888 \-v /some/host/folder:/etc/ssl/notebook \jupyter/base-notebook start-notebook.sh \--NotebookApp.keyfile=/etc/ssl/notebook/notebook.key--NotebookApp.certfile=/etc/ssl/notebook/notebook.crt

容器成功运行后,8888端口就不再提供http服务,而是https服务。

最后,简单说一下反向代理问题,现在主流的服务器,例如Apache、Nginx都有反向代理功能,Apache的可以参考我的博客:

  • Apache设置https反向代理
  • 使用Apache的虚拟主机以及代理搞定多个网站的子域名(包括跨域情况)解析问题->其实这就是http反向代理

如果不是Apache,Jupyer官方也提供了相关指南
设置好网站的反向代理后,需要注意的是Jupyter是用Socket来与Kernel进行通信的,所以还要开启服务器软件的Socket反向代理功能。 在这里,http情况下对应的是ws,https对应的是wss。这些在上面提及的官方指南中也有说明。

JupyterHub的搭建

本节,首先介绍一下什么是JupyterHub,以及它与JupyterNotebook的关系,然后简单介绍一下搭建过程。

什么是JupyerHub

JupyerHub是一个多用户的JupyerNotebook管理器。默认情况下,JupyerNotebook是不支持多用户使用的。而JupyterHub刚好弥补了这一缺点。在Docker中,JupyterHub更像一个守卫,首先,你要通过身份验证,然后,通过一个叫Spawn的机制为每一个通过验证的用户生成一个新的Docker容器,这样就可以多用户使用JupyterNotebook了。

同时,JupyerHub还支持文件夹共享,这个对于多用户协作来说是刚需,而这是普通JupyerNotebook做不到的。

搭建JupyerHub

这里推荐一篇文章,讲得很仔细,我参照他说的做,一次成功,也推荐给大家。我就不赘述了,避免重复造轮子。
使用Docker安装多用户版的JupyterHub

这篇关于在Docker中部署JupyterNotebook/JupyterHub的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/389573

相关文章

闲置电脑也能活出第二春?鲁大师AiNAS让你动动手指就能轻松部署

对于大多数人而言,在这个“数据爆炸”的时代或多或少都遇到过存储告急的情况,这使得“存储焦虑”不再是个别现象,而将会是随着软件的不断臃肿而越来越普遍的情况。从不少手机厂商都开始将存储上限提升至1TB可以见得,我们似乎正处在互联网信息飞速增长的阶段,对于存储的需求也将会不断扩大。对于苹果用户而言,这一问题愈发严峻,毕竟512GB和1TB版本的iPhone可不是人人都消费得起的,因此成熟的外置存储方案开

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

在 Windows 上部署 gitblit

在 Windows 上部署 gitblit 在 Windows 上部署 gitblit 缘起gitblit 是什么安装JDK部署 gitblit 下载 gitblit 并解压配置登录注册为 windows 服务 修改 installService.cmd 文件运行 installService.cmd运行 gitblitw.exe查看 services.msc 缘起

Solr部署如何启动

Solr部署如何启动 Posted on 一月 10, 2013 in:  Solr入门 | 评论关闭 我刚接触solr,我要怎么启动,这是群里的朋友问得比较多的问题, solr最新版本下载地址: http://www.apache.org/dyn/closer.cgi/lucene/solr/ 1、准备环境 建立一个solr目录,把solr压缩包example目录下的内容复制

禅道Docker安装包发布

禅道Docker安装包发布 大家好, 禅道Docker安装包发布。 一、下载地址 禅道开源版:   /dl/zentao/docker/docker_zentao.zip  备用下载地址:https://download.csdn.net/download/u013490585/16271485 数据库用户名: root,默认密码: 123456。运行时,可以设置 MYSQL_ROOT_P

Spring Roo 实站( 一 )部署安装 第一个示例程序

转自:http://blog.csdn.net/jun55xiu/article/details/9380213 一:安装 注:可以参与官网spring-roo: static.springsource.org/spring-roo/reference/html/intro.html#intro-exploring-sampleROO_OPTS http://stati

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、Nginx等服务的需求,一定不要错过这个机会。赶紧去看看吧! 什么是华为云Flexus X实例 华为云Flexus X实例云服务是新一代开箱即用、体

部署若依Spring boot项目

nohup和& nohup命令解释 nohup命令:nohup 是 no hang up 的缩写,就是不挂断的意思,但没有后台运行,终端不能标准输入。nohup :不挂断的运行,注意并没有后台运行的功能,就是指,用nohup运行命令可以使命令永久的执行下去,和用户终端没有关系,注意了nohup没有后台运行的意思;&才是后台运行在缺省情况下该作业的所有输出都被重定向到一个名为nohup.o

kubernetes集群部署Zabbix监控平台

一、zabbix介绍 1.zabbix简介 Zabbix是一个基于Web界面的分布式系统监控的企业级开源软件。可以监视各种系统与设备的参数,保障服务器及设备的安全运营。 2.zabbix特点 (1)安装与配置简单。 (2)可视化web管理界面。 (3)免费开源。 (4)支持中文。 (5)自动发现。 (6)分布式监控。 (7)实时绘图。 3.zabbix的主要功能