Apache Hadoop和大数据的历史

摘要

Apache Hadoop始于2006年,是b谷歌文件系统和MapReduce执行引擎的开源实现。它很快成为大数据现象的重要组成部分。许多其他工具加入了Hadoop生态系统,比如Apache Hive、Spark和Kafka带来了SQL、程序化数据处理和流。最近,机器学习、人工智能和物联网也加入了竞争。当然,向云计算的结构性转变已经改变了这些工具的部署和使用方式。

Alan Gates是Hortonworks(现在的Cloudera)的联合创始人,也是Apache大数据项目的提交者,从2007年开始,他将谈论大数据的历史,当前的技术状态,并提供一些关于大数据在不久的将来走向的想法。

生物

艾伦·盖茨是Hortonworks(现为Cloudera)的创始人之一。自20世纪90年代以来,他一直在数据库内部进行开发。2007年,他加入了Yahoo!并帮助把小猪带到阿帕奇。从那时起,他一直积极参与Apache Hive,并指导许多其他Apache项目。他目前是Cloudera架构团队的成员。Alan拥有俄勒冈州立大学(Oregon State University)数学学士学位和富勒神学院(Fuller Theological Seminary)神学硕士学位。他是O 'Reilly出版社出版的《Programming Pig》一书的作者。

谈话时间和地点

2019年2月26日下午1:20在MH 225