更多原始数据文档和JupyterNotebook Github: https://github.com/JinnyR/Datacamp_DataScienceTrack_Python Datacamp track: Data Scientist with Python - Course 23 (2) Exercise Hierarchical clustering of the grain
问题描述 依据Visualizing Data using t-SNE实现t-SNE算法,并对MNIST或者Olivetti数据集进行可视化训练。 有以下几点要求: 不能使用现成的t-SNE库,例如sklearn等;可以使用支持矩阵、向量操作的库实现,例如numpy;将数据降低至二维,同一类型的数据使用同一种颜色绘制散点图。 符号介绍 x i x_i xi:第 i i i个原始数据;
t-SNE全称为t-distributed Stochastic Neighbor Embedding,翻译为t-随机邻近嵌入,它是一种嵌入模型,能够将高维空间中的数据映射到低维空间中,并保留数据集的局部特性,该算法在论文中非常常见,主要用于高维数据的降维和可视化。提出论文为:Visualizing Data using t-SNE。 t-SNE可以算是目前效果最好的数据降维和可视