本文主要是介绍【分布式机器学习】spark环境在线运行平台Databricks,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Databricks是一个在Apache Spark之上运行的平台。 它方便地具有笔记本电脑系统设置,可以轻松地在云中配置群集,并且它还集成了用于探索和可视化的集成工作区。通过该平台,可以轻松设置运行Spark数据帧和练习编码的环境。
进入https://databricks.com/try-databricks,需要注册并申请免费试用,选择免费的Community Edition打开你的帐户。
登录页面https://community.cloud.databricks.com/?o=588140745259459#
进入Databricks,发现它是一个类似jupyter notebook的平台
点击create→Notebook→输入project的名称,选择语言→创建成功
下面就可以在spark环境中编写自己的project了
点击workspace可以看到目前已创建的projects
简直是神器啊xdm!!!
这篇关于【分布式机器学习】spark环境在线运行平台Databricks的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!