在机器学习中,无监督学习一直是我们追求的方向,而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段,它们能利用大量的未标注数据构建强大的主题聚类。本文从最基础的 K 均值聚类到基于密度的强大方法介绍了 6 类主流方法,它们各有擅长领域与情景,且基本思想并不一定限于聚类方法。 本文将从简单高效的 K 均值聚类开始,依次介绍均值漂移聚类、
转自:数据派THU ID:DatapiTHU 原文题目:Want to Becomea Data Scientist? Read This Interview First 作者:Kevin Gray 翻译:韩海畴 校对:闵黎 本文长度为3800字,建议阅读8分钟 本文为你解答数据科学究竟是什么及一个好数据科学家应具备的品质。 市场营销学者Kevin Gray对肯纳索州立大