[python] 如何开始大数据分析



Answers

您可以考虑的一件事是DMelt( http://jwork.org/dmelt/ )数据分析程序。 一个值得注意的特性是它有数百个使用Python语言的例子和一些书籍。 我使用它的原因是它在我的Windows 10上运行(因为它使用Java VM),而且它具有非常好的2D / 3D图形,可以导出为矢量图形格式。

Question

我一直是R的长期用户,最近开始使用Python。 使用传统的RDBMS系统进行数据仓库,使用R / Python进行数字运算,我觉得现在需要掌握大数据分析。

我想知道如何开始大数据处理。 - 如何从Map / Reduce和Hadoop的使用开始简单

  • 如何利用我在R和Python中的技能开始进行大数据分析。 以Python Disco项目为例。
  • 使用RHIPE包并查找玩具数据集和问题区域。
  • 找到正确的信息,以便我决定是否需要从RDBMS类型数据库迁移到NoSQL

总而言之,我想知道如何从小规模开始,逐步建立我在大数据分析中的技能和专业知识。

感谢您的建议和意见。 我为此查询的通用性质道歉,但我希望获得有关此主题的更多观点。

  • 苛刻



Related