Apache软件基金会主席道格切割:数据革命

2014中国大数据技术大会首日全体会议上,Cloudera的首席架构师,Apache软件基金会主席道格作为第一位演讲嘉宾切割,发表了“数据革命”的演讲。

HBase集群安装部署(完全分布式)

Windows下Eclipse连接Hadoop

bankmark NoSQL性能对比测试,国产SequoiaDB优势明显

近期,知名独立基准测评机构bankmark,针对SequoiaDB、及Cassandra NoSQL MongoDB三款数据库产品做了性能对比测试。在所有的测试中,SequoiaDB的性能在大多数情境下都大大优于其他的产品。
  • 2014年12月09日
  • 来源:CSDN CODE
  • 分享

在云上搭建大规模实时数据流处理系统

如今数据规模变得越来越大,传统的软硬件工具已很难满足数据处理的需求。本文将结合汽车状态实时监控系统,讲述如何在阿里云上使用卡夫卡和风暴搭建大规模消息分发和实时数据流处理系统,及其中遇到的挑战。

Facebook的数据仓库是如何扩展到300pb的

Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的。我们基于蜂巢的数据仓库中存储了超过300pb的数据,并且以每日新增600tb的速度增长去年这个数据仓库所存储的数据量增长了3倍。

大数据的下一个五年:Hadoop将推动数据平民化

美国联合市场研究(Allied Market Research)机构近日预测,到2020年,Hadoop的市场价值会超过500亿。

值得马克的11个开源机器学习项目

随着机器学习越来越受到开发者关注,出现了很多机器学习的开源项目,在本文列举的11个机器学习开源项目中,无论你是Java爱好者还是Python狂人,在这里你都可以找到自己想要的机器学习开源项目。

与Hadoop之间的PK火花胜算几何?

虽然火花活跃在Cloudera、MAPR、Hortonworks等众多知名大数据公司,但是如果本身的缺陷得不到及时处理将会严重影响火花,火花的普及和发展。
  • 2014年12月05日
  • 来源:CSDN CODE
  • 分享

通信Hadoop RPC客户端客户端的流程分析

的Hadoop RPC的通信与其他系统的RPC通信不太一样,作者针对Hadoop的使用特点,专门的设计了一套RPC框架,这套框架个人感觉还是有点小复杂的。
每页显示 815条数据共 < 八十二 >      到第
由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。

Hadoop社区活动

Top_arrow