子博兄的头像-华尔子博-奥夏网
管理员
个人博客分享,技术资料分享!

MapReduce编程实例:单词计数

MapReduce编程实例:单词计数-华尔子博-奥夏网
本节介绍如何编写基本的 MapReduce 程序实现数据分析。本节代码是基于 Hadoop 2.7.3 开发的。 任务准备 单词计数(WordCount)的任务是对一组输入文档中的单词进行分别计数。假设文件的量比较大...
3个月前
05611

Hadoop HBase数据库的详解介绍及使用范例

Hadoop HBase数据库的详解介绍及使用范例-华尔子博-奥夏网
这里我们继续深入详细了解HBase,并通过一个实例使用HBase进行数据操作。 1. HBase数据模型HBase的数据模型主要包含: - Table:对应关系数据库中的表,用于存储类似数据。 - Row:对应表中的行,根据...
1年前
07311

NoSQL数据库类型简介

NoSQL数据库类型简介-华尔子博-奥夏网
近些年来,NoSQL 数据库的发展势头很快。据统计,目前已经产生了 50 到 150 个 NoSQL 数据库系统。但是,归结起来,可以将典型的 NoSQL 划分为 4 种类型,分别是键值数据库、列式数据库、文档数...
1年前
0379

NoSQL非关系型数据库简介及与关系数据库的区别

NoSQL非关系型数据库简介及与关系数据库的区别-华尔子博-奥夏网
虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
1年前
03714

HDFS读取和写入数据简介 HDFS的文件访问机制

HDFS读取和写入数据简介 HDFS的文件访问机制-华尔子博-奥夏网
HDFS的文件访问机制为流式访问机制,即通过 API 打开文件的某个数据块之后,可以顺序读取或者写入某个文件。由于 HDFS 中存在多个角色,且对应的应用场景主要为一次写入、多次读取的场景,因此...
2年前
014811

Scrapy是什么,Scrapy网络爬虫简介

Scrapy是什么,Scrapy网络爬虫简介-华尔子博-奥夏网
Scrapy是什么,Scrapy网络爬虫简介。Scrapy 是一个为了爬取网站数据、提取结构性数据而编写的应用框架,可以应用在包括数据挖掘、信息处理或存储历史数据等一系列的程序中。
3年前
02130

大数据开发涉及到的关键技术及开发流程有哪些?

大数据开发涉及到的关键技术及开发流程有哪些?-华尔子博-奥夏网
大数据开发涉及到的关键技术及开发流程有哪些?大数据本身是一种现象而不是一种技术。大数据技术是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预...
3年前
02770

大数据时代的10个重大变化,大数据带来的影响

大数据时代的10个重大变化,大数据带来的影响-华尔子博-奥夏网
大数据时代的到来改变了人们的生活方式、思维模式和研究范式,大数据时代的10个重大变化,大数据带来的影响。
3年前
02420

什么是大数据时代?大数据能给我们带来什么?

什么是大数据时代?大数据能给我们带来什么?-华尔子博-奥夏网
年来,信息技术迅猛发展,尤其是以互联网、物联网、信息获取、社交网络等为代表的技术日新月异,促使手机、平板电脑、pc 等各式各样的信息传感器随处可见,虚拟网络快速发展,现实世界快速虚拟...
3年前
02190

Redis主从复制的配置方法和执行过程 Redis主从同步配置

Redis主从复制的配置方法和执行过程 Redis主从同步配置-华尔子博-奥夏网
尽管 Redis 的性能很好,但是有时候依旧满足不了应用的需要,比如过多的用户进入主页,导致 Redis 被频繁访问,此时就存在大量的读操作。 对于一些热门网站的某个时刻(比如促销商品的时候)每...
2年前
010115