review

唯品会

一面

  1. hive的join执行过程?

    之前看过也做过笔记,但是答得不好。//www.greatytc.com/p/09e3a8f75492

  2. hive中为什么要使用bucket?

    之前没关注。//www.greatytc.com/p/276439b71e72

  3. Spark的shuffle阶段怎么做的?

    感觉有必要再看一下hadoop的过程和spark的过程,不是只停留在使用的层次,http://blog.csdn.net/zhumr/article/details/52540994

  4. spark join出现数据倾斜怎么做?

    解决办法:http://blog.csdn.net/lw_ghy/article/details/51419877

  5. spark partition 怎么实现的?

  6. spark cogroup怎么用,原理。

  7. java onepair做什么用的?(貌似是这个问题,没见过,一脸懵逼)

二面

  1. 介绍项目
  2. java map concurrenthashmap;包括扩容等
  3. java 线程池
  4. lock volite syc
  5. java 内存模型
  6. hive 优化
  7. 实时处理的了解

三面

  1. hr面,没什么说的,聊聊薪资什么的?
  2. 怎么学习?offer怎么选
  3. 觉得一个实时开发工程师具备的素养是什么
  4. 自己的优缺点

小米

面试官给人最糟糕体验,不想多说,一生黑。

只记录一下问题。

  1. 任务调度依赖怎么配置?
  2. 简单介绍些spring,用过么?
  3. 写spark mr 什么的有过优化么?
  4. 一棵二叉树秋两个节点的公共父节点。
  5. 一个大数据下求topk
  6. 一个数组求连续递增序列最大长度
  7. 一个数组求连续递增再连续递减的最大长度
  8. 一个数组两个值相加等于k的所有组合
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容