organizing专题

【论文阅读第一期】Goods:Organizing Google’s Datasets总结

论文阅读第一期的文章《Goods:Organizing Google’s Datasets》讲的是关于谷歌在海量元数据管理方面的实践。本篇总结主要从3个方面进行展开:1.什么是元数据;2.如何管理元数据;3.启发与总结 1.什么是元数据 元数据被称之为描述数据的数据,记录的是文件的特征,包括数据属性、拥有者、权限、数据块等信息。无论是mysql、oracle这样的关系型数据库,还是Hive、H

dimension reduce(梯度下降)self-organizing maps(自组织映射)

使数据集的维度减小可以简化问题,带来优化 如更快的处理时间、虚拟化高维度的数据集、抗噪音、增强其他数据挖掘算法 线性降维(Linear dimension reduce) main linear components能使数据在这一轴的变化范围最大 1-st component是使数据在这一维变化最大的轴方向 2-nd component是当投影到1-st component方向时数

Self Organizing Maps 自映射人工神经网络

原文地址:Self Organizing Maps作者:shiqj1980 the ebook: http://davis.wpi.edu/~matt/courses/soms/ using som in excel:http://www.geocities.com/adotsaha/NN/SOMinExcel.html  人工神经网络技术在模式识别方面有着独特的优势,神经网络能够进行非线性

自组织神经网络介绍:自组织特征映射SOM(Self-organizing feature Map)

http://blog.csdn.net/xbinworld/article/details/50818803 本文详细介绍一下自组织神经网络概念和原理,并重点介绍一下自组织特征映射SOM网络。SOM和现在流行的ANN(MLP)模型在结构上类似,都由非常简单的神经元结构组成,但是SOM是一类“ 无监督学习” 模型,一般的用法是将高维的input数据在低维的空间表示[1],因此SOM天然