栏目导航

热点推荐

百度大数据工程师面试经验总结

面试岗位:百度大数据工程师 面试结果及点评: 求职者#1: 面试结果:通过 面试点评: 面试研发实习生,大数据部 1、快排算法写一下2、排序算法哪个是稳定的,哪个不是。3、linux命令 awk sort4、hadoop你了解多少还有很多很杂的东西 求职者#2: 面试结果:...
推荐于:05-24
浏览:124 / 喜欢:124

Hadoop面试题,你都会吗?

单项选择题 1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与 NameNode 在一个节点启动? a)Secondary...
推荐于:05-24
浏览:149 / 喜欢:149

大数据面试题整理

1.简述大数据的生态组件 参考链接: http://wenku.baidu.com/link?url=OYTVLe1e5zvBn8CBy4TSmoRkg4See5GEoX8h8bHcwGBsMKeJCiet7Pr7G_hrc6Q-SHZwMWU0fDrcufpatVgIPfsYgsX3FS1doMI0G4iJoE50A9rJmh2wSc3BYcx_6SBJ 2.简要描述如何配置一个apache的hadoop分布式 h...
推荐于:05-24
浏览:195 / 喜欢:195

大数据工程师面试题

1. 选择题 1.1. 下面哪个程序负责 HDFS 数据存储。 c)Datanode 答案 C datanode 1.2. HDfS 中的 block 默认保存几份? a)3 份 答案 A 默认 3 份 1.3. 下列哪个程序通常与 NameNode 在一个节点启动? d)Jobtracker 答案 D 1.4. HDFS 默认 Block Size c)128MB...
推荐于:05-24
浏览:177 / 喜欢:177

必看的十个大数据面试题

1 海量日志数据,提取出某日访问百度次数最多的那个IP 解法1: (1)海量日志,文件太大,IP地址最多有2^32=4G,无法装入内存,,将这个大文件(hash映射:可以取模00)分成多个小文件(如1000)。 (2)对每个小文件进行hash统计,hash_map(ip,value), 得到...
推荐于:05-24
浏览:125 / 喜欢:125

大数据面试题及答案完整版

1 .给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 假如每个url大小为10bytes,那么可以估计每个文件的大小为50G64=320G,远远大于内存限制的4G,所以不可能将其完全加载到内存中处理,可以采用分治的思...
推荐于:05-24
浏览:58 / 喜欢:58

大数据常见面试题

【某公司笔试面试题】 1\使用mr,spark ,spark sql编写word count程序 【Spark 版本】 val conf=new SparkConf().setAppName(wd).setMaster(local[1]) val sc=new SparkContext(conf,2) //加载 val lines=sc.textFile(tructField(name,DataTypes.StringType,...
推荐于:05-24
浏览:182 / 喜欢:182

十道大数据面试题

1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每...
推荐于:05-24
浏览:131 / 喜欢:131

大数据技术—Hadoop笔试题目

单项选择题 1. 下面哪个程序负责 HDFS 数据存储。 a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 2. HDfS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 3. 下列哪个程序通常与 NameNode 在一个节点启动? a)SecondaryNa...
推荐于:05-24
浏览:74 / 喜欢:74

45个Hadoop面试题目(含答案)

1.Hadoop集群可以运行的3个模式? 单机(本地)模式 伪分布式模式 全分布式模式 2. 单机(本地)模式中的注意点? 在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程...
推荐于:05-24
浏览:126 / 喜欢:126

猜你喜欢

微信
公众号

微信扫码,即可关注

反馈
意见
回到
顶部