资讯专栏INFORMATION COLUMN

[HADOOP问题] 常见问题解决

flybywind / 969人阅读

摘要:问题日志页面出现异常原因是根目录空间不足,解决问题的办法之一是清理根目录下不必要的文件,解决办法二就是,上面也就有提示了,不多说了。

博客原文:
hackershell

问题1:在程序的日志中看到,在reduce阶段出现了异常:Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out ,程序里需要打开文件,系统默认为1024,也可以通过ulimit -a查看

编辑文件/etc/security/limits.conf 在文件后面添加:

# End of file
*       soft       nofile  102400
*       hard       nofile  409600

遇到这种错误网上也有不同的可能解决方法和解释,你们可以自己找找。

问题2: yarn日志页面出现异常:

Java HotSpot(TM) 64-Bit Server VM warning: Insufficient space for shared memory file:
   /tmp/hsperfdata_hdp/6676
Try using the -Djava.io.tmpdir= option to select an alternate temp location

原因是根目录空间不足,解决问题的办法之一是清理根目录下不必要的文件,解决办法二就是,上面也就有提示了,不多说了。

/tmp/hsperfdata_username 目录的作用是什么呢?

jvm运行时在linux下默认在/tmp下生成上面的目录,目录下存放pid文件,和一些jvm进程信息,jmap、jstack等工具会读取该目录下的pid文件获取链接信息

问题3: 当任务不能跑满集群的时,为什么集群的节点会出现几个节点跑满容器,而其他节点则非常空闲?

原因是集群调度器默认处于批处理模式下,一个心跳会尽可能的分配任务,心跳先到达则会优先领取任务,我们可以通过参数yarn.scheduler.fair.max.assign参数设置为1,就可以大致的均衡任务到不同的节点

更新时间2015-07-18

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/64412.html

相关文章

  • 前雅虎CTO:Hadoop扩展过程中的7个危险信号

    摘要:的扩展和运维是非常复杂的过程,在其具体的实施过程中隐藏着潜在的危机,根据经验罗列了项危机信号和相应的解决方案,帮助使用者提前避免灾难的发生。危机信号开支失控在基于部署的环境中,排名第一的成功灾难是开支失控。 本文作者Raymie Stata是Hadoop即服务公司Altiscale的创始人兼CEO,也是雅虎前任CTO,协助雅虎完成开源策略,并参与Apache Hadoop项目的发起。Hado...

    susheng 评论0 收藏0
  • hadoop+hive使用中遇到的问题汇总

    摘要:错误将添加到路径代码动态分区异常代码进程超内存限制添加代码代码文件数限制代码连接超时代码解决方案代码代码参数列表过长参数列表过长解决方案升级内核或减少分区数代码问题排查代码代码拒绝连接。。。 问题排查方式 一般的错误,查看错误输出,按照关键字google 异常错误(如namenode、datanode莫名其妙挂了):查看Hadoop($HADOOP_HOME/logs)或hive日志 ...

    alin 评论0 收藏0
  • 打赢数据安全攻坚战,从Hadoop-security治理说起!

    摘要:整个集群的所有数据,或者至少是公司级的敏感数据,需要加密应该有统一的密钥管理中心管理着每一类数据的访问密钥。全数据中心的所有数据都是加密的,而且密钥管理中心做到了高可用。服务器端网络不安全,被攻破,被拖库。 作者介绍汪涉洋,来自美国视频网站hulu的工程师,毕业于北京理工大学计算机专业,目前从事大数据基础架构方面的工作,个人知乎专栏大数据SRE的总结:http://dwz.cn/7ygSgc...

    CoXie 评论0 收藏0
  • Hadoop,还是不用Hadoop

    摘要:,是由创建的另外一个实时流数据处理的分布式系统,详见。是推出的商业产品,是可一个支持横向扩展的内存数据库解决方案,可以支持实时的大数据分析和计算。 Hadoop通常被认定是能够帮助你解决所有问题的方案。 当人们提到大数据或是数据分析等相关问题的时候,会听到脱口而出的回答:Hadoop!实际上Hadoop被设计和建造出来,是用来解决一系列特 定问题的。对某些问题来说,Hadoop至多算是一个...

    XUI 评论0 收藏0
  • 为什么Hadoop将一定会是分布式计算的未来?

    摘要:后来结局可能大家也猜到了,投入了很多钱,招了不少牛人,确实也做出了还算不错的云计算至少在国内是数一数二的。虽然我前公司这个云计算项目是否会成功,这里没办法预测,但是前途终究还是比较黯淡的。 写在前面的话:   今天听同事分享了一篇很有意思的讲座,叫做Why Map-Reduce Is Not The Solution To Your Big-Data Problem(为什么Map-Redu...

    baishancloud 评论0 收藏0
  • 淘宝双11数据分析与预测--“坑点”汇总

    摘要:国庆假期留在学校做了一下林子雨博士的大数据实验淘宝双数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助。 国庆假期留在学校做了一下林子雨博士的大数据实验--淘宝双11数据分析与预测,虽然教程写得很详细,但自己还是踩了很多坑,现在记录下来,希望给别人一点帮助。 淘宝双11数据分析与预测实验连接:点击这里 问题一:安装Hadoop时报错 报错内容: ...

    luoyibu 评论0 收藏0

发表评论

0条评论

flybywind

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<