蓝天,小湖,湖水中一方小筑

MMDS Notes: W3 - Communities in Social Network (Basic)

第三周分两部分,第一部分是 Communities in Social Network 。是介绍如何在社交网络中给用户分组的。这一部分的课也分为基础和高级,这一篇是基础, 高级的课程另开一篇吧(主要是基础中还有些东西没完全弄明白…)。

MMDS Notes: W2 - Locality-Sensitive Hashing

Locality-Sensitive Hashing,LSH,局部敏感hash或叫位置敏感hash。它的想法是在对原始数据空间的数据做Hash后,让位置相邻的数据有很大概率被放到同一个或者相近的bucket中,而不相邻的点放在一起的概率要很小。这样就会减少后期数据处理的数据集,从而简化后续的工作。

MMDS Notes: W1 - HDFS & MR

前段时间在Cousera上各种挤时间跟完了一门 MMDS ,手上留下了一堆笔记,整理下,顺便给新blog开光吧。

课程总共7周,这篇整理的第一周的 HDFSMR 部分。