HDFS共24篇 第3页

通过系统日志采集大数据的实现方法

通过系统日志采集大数据的实现方法-华尔子博-奥夏网
通过系统日志采集大数据的实现方法。目前使用最广泛的、用于系统日志采集的海量数据采集工具有 Hadoop 的 Chukwa、ApacheFlumeAFacebook 的 Scribe 和 LinkedIn 的 Kafka 等
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
02220

分布式SQL大数据查询引擎的发展,什么是分布式查询引擎

分布式SQL大数据查询引擎的发展,什么是分布式查询引擎-华尔子博-奥夏网
分布式SQL大数据查询引擎的发展,什么是分布式查询引擎。简而言之,它由各种集成过程组成,可将所有数据加载到一个中央位置,这是即将到来的数据建模和分析用例的唯一事实来源。 虽然在较早的日...
南宫世家的头像-华尔子博-奥夏网南宫世家3年前
02250

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?-华尔子博-奥夏网
Hadoop 是一种分析和处理大数据的软件平台,是一个用 Java 语言实现的 Apache 的开源软件框架,在大量计算机组成的集群中实现了对海量数据的分布式计算。
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
02030

Hadoop HDFS分布式文件系统简介及特性

Hadoop HDFS分布式文件系统简介及特性-华尔子博-奥夏网
Hadoop HDFS分布式文件系统简介及特性。大数据时代,需要处理分析的数据集的大小已经远远超过了单台计算机的存储能力,因此需要将数据集进行分区并存储到若干台独立的计算机中。
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
02510