51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

经验分享

hadoop 的 DataNode 副本存储策略相关

hadoop 的 DataNode 副本存储策略相关

厉飞雨 阅读(85) 评论(0) 赞(5)

### 1 副本存储策略: 1、默认的副本策略: BlockPlacementPolicyDefault 1)1st replica. 如果写请求方所在机器是其中一个 datanode,则直接存放在本地,否则随机在 集群中选择一个 datanode. 2)2nd replica. 第二个副本存放于不同第一个副本的所在的机架. 3)3rd ...

Hadoop 有哪些调度器?我们该如何选择?

Hadoop 有哪些调度器?我们该如何选择?

厉飞雨 阅读(65) 评论(0) 赞(4)

Hadoop 有哪些调度器?我们该如何选择? ### hadoop 中常用的调度器有三种: 1)FIFO:(hadoop2.x 之前的默认调度器),它先按照作业的优先级高低,再按照到达时间的先后选择被执行的作业。 2)计算能力调度器(容量调度器)Capacity schedular:(hadoop2.x 之后的默认调度器)支持多个队列,每个队列可配置一定的资源量,每个队列...

Hadoop 的性能调优从哪些方面着手

Hadoop 的性能调优从哪些方面着手

厉飞雨 阅读(95) 评论(0) 赞(3)

Hadoop 的性能调优从哪些方面着手 一、硬件方面 二、操作系统参数调优 三、jvm 层面 四、hadoop 层面性能调优 #### 一、硬件方面(网络,多磁盘,多机架)---系统集成人员来做 机架分开,节点均匀放置 #### 二、操作系统参数调优 a)多个网卡:多网卡绑定,做负载均衡或者主备 b)磁盘...

Hadoop 中通过拆分任务到多个节点运行来实现并行计算,但某些节点运行较慢会拖慢整个 任务的运行,Hadoop 采用什么机制应对这个情况

Hadoop 中通过拆分任务到多个节点运行来实现并行计算,但某些节点运行较慢会拖慢整个 任务的运行,Hadoop 采用什么机制应对这个情况

厉飞雨 阅读(76) 评论(0) 赞(5)

Hadoop 中通过拆分任务到多个节点运行来实现并行计算,但某些节点运行较慢会拖慢整个任务的运行,Hadoop 采用什么机制应对这个情况 #### Speculative Execution 推测执行 (1)推测执行(Speculative Execution)是指在分布式集群环境下,因为程序 BUG,负载不均衡或者资源分布不均等原因,造成同一个 job 的多个 task ...

什么是 Hadoop 分布式缓存

什么是 Hadoop 分布式缓存

厉飞雨 阅读(73) 评论(0) 赞(3)

什么是 Hadoop 分布式缓存 1)Hadoop 分布式缓存是 Map-Reduce 框架提供的用于缓存应用程序所需文件(文本文件、 存档文件、Jar 文件等)的工具。 2)当 MapReduce 处理大型数据集间的 join 操作时,此时如果一个数据集很大而另外一 个集合很小,以至于可以分发到集群中的每个节点之中。 这种情况下,我们就用到了 Hadoop ...

分布式事务,一文帮你讲透!

分布式事务,一文帮你讲透!

厉飞雨 阅读(47) 评论(0) 赞(4)

在微服务化的时代,分布式事务是一个重要的技术点,这篇文章我们将深入的分析分布式事务。 什么是事务? {#什么是事务?} ================ 事务(Transaction)是数据库管理系统(DBMS)中用于确保数据一致性和可靠性的一组操作。 事务具有以下四个关键特性,通常称为 ACID特性: * **原子性(Atomicity)**:事务中的所有操作要么全部...

分布式集群的CAP理论(待完善)

分布式集群的CAP理论(待完善)

厉飞雨 阅读(40) 评论(0) 赞(2)

分布式系统的最大难点,就是**各个节点的状态如何保持一致** CAP理论是在设计分布式系统的过程中,处理数据一致性问题时必须考虑的理论。 C(一致性)、A(高可用)、P(分区容忍) 1. 一致性 读操作获取到最新的写结果 Consistency : Every read receives the most recent write or an error 2. 高可...

hadoop 优化文件系统

hadoop 优化文件系统

厉飞雨 阅读(60) 评论(0) 赞(6)

hadoop 优化文件系统 Linux 文件系统推荐使用 EXT4 和 XFS 文件系统,相比较而言,更推荐后者,因为 XFS 已经帮我们做了大量的优化。 Linux 文件系统会记录文件创建、修改和访问操作的时间信息,这在读写操作频繁的应用中将带来不小的性能损失。在挂载文件系统时设置 noatime和 nodiratime 可禁止文件系统记录文件和目录的访问时间,这...

分布式算法:Paxos 是如何达成共识的?

分布式算法:Paxos 是如何达成共识的?

厉飞雨 阅读(53) 评论(0) 赞(4)

你好,我是猿java。 提到分布式算法,就不得不说 Paxos算法,曾在一段时间里,Paxos 几乎成了分布式共识的代名词,现如今很多流行的算法, 比如:ZAB,Raft 都是基于 Paxos 改进而来,这足以看出 Paxos的重要性。 但是,由于 Paxos算法比较晦涩难懂,令很多人望而却步。今天我们就来讨论这个为分布式共识算法奠定了基石的开山之作。 > 申明...