今日聚焦!hdfs disk balancer 磁盘均衡器

来源：博客园 2023-03-31 12:54:38

1、背景
2、hdfs balancer和 hdfs disk balancer有何不同？
3、操作
- 3.1 生成计划
- 3.2 执行计划
- 3.3 查询计划
- 3.4 取消计划
4、和disk balancer相关的配置
5、额外知识点
- 5.1 新的block存储到那个磁盘(卷)中
- 5.2 磁盘数据密度度量标准
6、参考文档

1、背景

在我们的hadoop集群运行一段过程中，由于多种原因，数据在DataNade的磁盘之间的分布可能是不均匀。比如：我们刚刚给某个DataNode新增加了一块磁盘或者集群上存在大批量的write & deltete操作等灯。那么有没有一种工具，能够使单个DataNode中的多个磁盘的数据均衡呢？借助Hadoop提供的Diskbalancer命令行工具可以实现。

2、hdfs balancer和 hdfs disk balancer有何不同？

hdfs balancer：是为了集群中DataNode的数据均衡，即针对多个DataNode的。

hdfs disk balancer：是为了使单台DataNode中的多个磁盘中的数据均衡。

(资料图片)

注意：目前DiskBalancer不支持跨存储介质（SSD、DISK等）的数据转移，所以磁盘的均衡都是要求在一个storageType下的。因为hdfs中存在异构存储。

3、操作

3.1 生成计划

[hadoopdeploy@hadoop01 ~]$ hdfs diskbalancer -plan hadoop01 -out hadoop01-plan.json

-plan: 后面接的是主机名。-out: 指定计划文件的输出位置。

3.2 执行计划

[hadoopdeploy@hadoop01 ~]$ hdfs diskbalancer -execute hadoop01-plan.json

3.3 查询计划

[hadoopdeploy@hadoop01 ~]$ hdfs diskbalancer -query hadoop01

-query 后面跟的是主机名

3.4 取消计划

[hadoopdeploy@hadoop01 ~]$ hdfs diskbalancer -cancel hadoop01-plan.json

4、和disk balancer相关的配置

配置	描述
`dfs.disk.balancer.enabled`	此参数控制是否为集群启用diskbalancer。如果未启用，任何执行命令都将被DataNode拒绝。默认值为true。
`dfs.disk.balancer.max.disk.throughputInMBperSec`	这控制了diskbalancer在复制数据时消耗的最大磁盘带宽。如果指定了10MB之类的值，则diskbalancer平均只会复制10MB/S。默认值为10MB/S。
`dfs.disk.balancer.max.disk.errors`	设置能够容忍的在指定的移动过程中出现的最大错误次数，超过此阈值则失败。例如，如果一个计划有3对磁盘要在其中复制，并且第一个磁盘集遇到超过5个错误，那么我们放弃第一个副本并启动计划中的第二个副本。最大错误的默认值设置为5。
`dfs.disk.balancer.block.tolerance.percent`	设置磁盘之间进行数据均衡操作时，各个磁盘的数据存储量与理想状态之间的差异阈值。取值范围[1-100]，默认为10。例如，各个磁盘的理想数据存储量为100 GB，此参数设置为10。那么，当目标磁盘的数据存储量达到90 GB时，则认为该磁盘的存储状态就已经达到预期。
`dfs.disk.balancer.plan.threshold.percent`	设置在磁盘数据均衡中可容忍的两磁盘之间的数据密度域值差，取值范围[1-100]，默认为10。如果任意两个磁盘数据密度差值的绝对值超过了阈值，则说明需要对该的磁盘进行数据均衡。例如，如果一个2盘节点上的总数据为100 GB，那么磁盘均衡器计算每个磁盘上的期望值为50 GB。如果容差为10%，则单个磁盘上的数据需要大于60 GB（50 GB + 10%容差值），DiskBalancer才能开始工作。
`dfs.disk.balancer.plan.valid.interval`	磁盘平衡器计划有效的最大时间。支持以下后缀（不区分大小写）：ms（milis）、s（sec）、m（min）、h（h）、d（day）以指定时间（例如2s、2m、1h等）。如果未指定后缀，则假定为毫秒。默认值为1d

5、额外知识点

5.1 新的block存储到那个磁盘(卷)中

当数据写入新的block时，DataNode会根据策略选择不同的磁盘来存储。

循环策略：默认策略，将新的块均匀的分布在可用的磁盘上，可能造成数据倾斜。

可用空间策略：选择更多可用空间(按百分比)的磁盘。可能造成在某段时间内，某个磁盘的IO压力变大。

5.2 磁盘数据密度度量标准

上图来自https://www.bilibili.com/video/BV11N411d7Zh/?p=81

6、参考文档

1、https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HDFSDiskbalancer.html2、https://help.aliyun.com/document_detail/467585.html3、https://www.bilibili.com/video/BV11N411d7Zh/?p=81

今日聚焦!hdfs disk balancer 磁盘均衡器

1、背景

2、hdfs balancer和 hdfs disk balancer有何不同？

3、操作

3.1 生成计划

3.2 执行计划

3.3 查询计划

3.4 取消计划

4、和disk balancer相关的配置

5、额外知识点

5.1 新的block存储到那个磁盘(卷)中

5.2 磁盘数据密度度量标准

6、参考文档

推荐阅读

今日聚焦!hdfs disk balancer 磁盘均衡器

mu奇迹sf发布网大全 mu奇迹sf发布网合集_环球今日报

环球热点！车辆颜色太鲜艳被查处？原来是改变车身颜色未登记

155户居民幸福回迁！城阳区今年首个棚户区改造回迁社区选房仪式成功举行-当前讯息

最近更新

今日聚焦!hdfs disk balancer 磁盘均衡器

mu奇迹sf发布网大全 mu奇迹sf发布网合集_环球今日报

环球热点！车辆颜色太鲜艳被查处？原来是改变车身颜色未登记

155户居民幸福回迁！城阳区今年首个棚户区改造回迁社区选房仪式成功举行-当前讯息

环球观热点：为一棵树，挪一条路——北京守护三千五百年绿色“活化石”

环球消息！中国人寿去年净利320亿降36.8%？人寿的未来该咋看？

观战台：曼城主场火拼利物浦 拜仁多特打响国家德比_当前消息

美国一边打压TikTok，一边做这种事！

热点聚焦：中国食品（00506.HK）：3月30日南向资金增持10000股

集中“晒账本” 今年中央预算有何看点？

首个国产利拉鲁肽获批上市，华东医药领衔GLP-1赛道_全球报资讯

环球焦点！绿景中国2022年总收益23.41亿 股东应占亏损7.3亿

我国成功发射宏图一号01组卫星 全球报资讯

日本政府债券严重短缺 回购利率跌至创纪录水平|环球快资讯

奇点商务风长条款刷卡柜锁,百搭现代家具|世界快讯

你我贷借款平台上征信吗？不注意这些小心踩大坑

每日看点!大安盐碱地改良 促进生态治理 提升粮食产能

环球滚动:大理医美怎么样？痘痘肌的初次伊肤泉微针体验

视讯！默认网关不可用怎么修复？路由器连接内网与外网什么意思？

大连人队新十号拉尔森亮相，新赛季贝尼特斯将会如何使用新核心？

画风突变！嫌疑人悠闲品茶时被民警扑倒_焦点快报

大连金石滩召开全域旅游服务标准化建设启动大会 今日看点

夏邑县农机化新型农业经营主体发展问题及建议

一诺威：公司股票将于4月3日在北交所上市-环球热讯

环球最资讯丨穆迪：当前银行业压力对美国主权信用构成的风险“有限”

2022年中华医学科技奖发布，8个项目获一等奖

世界资讯：进一步推动中医医疗资源整合 青岛市海慈中医医疗集团莱西医院揭牌

子曰唯女子与小人难养也近之则不逊远之则怨_唯女子与小人难养也近则不逊远则怨

不尽相同的理解_不尽相同的近义词-全球报资讯

英甲前瞻：切尔滕汉姆无欲无求！谢周三盼客胜登顶头名

独家丨银行理财“借道”保险资管配存款受限

小米13 Ultra定档：4月中旬发布 环球快资讯

【快播报】网传天津“小升初改革”？相关部门：信息不属实！

当前资讯!港财库局许正宇:美银行业危机对港影响轻微

新材料行业周报：稀土价格企稳回升 锂价疲弱带动相关材料持续下行

每日聚焦：三国志战棋版战法甘棠遗爱什么样-战法甘棠遗爱介绍

天天观察：如何运用斐波拉契黄金分割线？

茂名社保局官网个人查询_茂名市社保个人查询

物业能处理邻里纠纷么

杭州二批供地：10宗地总成交145亿元 60%封顶摇号、2宗底价成交|全球热门

创识科技：3月28日融资买入1161.41万元，融资融券余额1.3亿元_热门

尧治河义林水电公司集体协商案例入选湖北省优秀集体协商案例_世界播资讯

天天微动态丨司机因“开门杀”获刑，警惕小动作引发大事故

qq聊天记录在哪个文件夹里怎么查看 几个方法教会你-每日看点

房屋安全鉴定专业机构-环球即时看

广东中山报告1例H3N8禽流感病例，发病前有活禽暴露史

环球播报:英汉烟草词汇_关于英汉烟草词汇的简介

这是CBA？山东队携手同曦队首节狂轰81分-全球新消息

全球即时：硅谷银行盘前暴跌97.41%

千仞雪能把比比东拉进神殿，为何却拉不了唐三，海神有何特殊？

华润万象生活：建议更换毕马威为公司新任核数师-世界动态

每日快看：达内教育2022年净利润8523万元，同比扭亏为盈

米酒可以带上火车吗(米酒可以带上火高铁) 天天播资讯

感到幸福你就拍拍手歌词凤凰传奇_感到幸福你就拍拍手歌词|环球速讯

观天下！内蒙古苏尼特左旗公安全面推进“抓党建 整作风 强素质 树形象”专项活动

精选！2023年上半年全国计算机等级考试在淄博师范高等专科学校顺利举行

曲靖市2名干部接受纪律审查和监察调查 今日热搜

077期赢四海福彩3D预测奖号：精选15注单注|全球快播报

淘宝刷单降权多久恢复_淘宝刷单是真的吗_全球新资讯

【世界速看料】拥有加氢站数量全球首位！中石化公布2022年年报

跟着企业去办事丨廊坊：从滞后到超前的“服务之变”

观战台：曼城主场火拼利物浦拜仁多特打响国家德比_当前消息

环球焦点！绿景中国2022年总收益23.41亿股东应占亏损7.3亿

我国成功发射宏图一号01组卫星全球报资讯

日本政府债券严重短缺回购利率跌至创纪录水平|环球快资讯

每日看点!大安盐碱地改良促进生态治理提升粮食产能

大连金石滩召开全域旅游服务标准化建设启动大会今日看点

世界资讯：进一步推动中医医疗资源整合青岛市海慈中医医疗集团莱西医院揭牌

小米13 Ultra定档：4月中旬发布环球快资讯

新材料行业周报：稀土价格企稳回升锂价疲弱带动相关材料持续下行

qq聊天记录在哪个文件夹里怎么查看几个方法教会你-每日看点

观天下！内蒙古苏尼特左旗公安全面推进“抓党建整作风强素质树形象”专项活动

曲靖市2名干部接受纪律审查和监察调查今日热搜

中手游2022财年转亏2亿元因多款游戏未能如期取得版号_资讯

从新疆到广东，从花园植物到室内植物，来自10位花友的过冬养护分享视焦点讯

新时代新征程新伟业·实干书写高质量发展新答卷 | 种好一棵草做强一杯奶 “链”出2000亿元

上海航交所：本周中国出口集运市场总体平稳综合指数小幅走低

北京天坛有多少块砖视讯

药明康德大赚88亿市值反蒸发2200亿股东疯狂套现125亿

法国大学排名最新快讯

环球短讯！美股三大指数集体收跌大型科技股多数下跌

国产新车品鉴:凯美瑞中期改款今年秋天推出有望亮相洛杉矶车展|世界今日报

2023青海省公安机关考录人民警察（公安厅职位）资格复审通知环球快看