常见算法面试题摘选

更新时间浏览

TIP

本文主要是介绍常见算法面试题摘选，面试题和相关解答来自网络，难免有纰漏和疏忽，阅读的时候，发现有疑问的地方，建议多方求证，也可以关注原文评论区，也欢迎在本站【问题反馈页面】 (opens new window)留言反馈。

什么是数据结构? 什么是算法?
常用数据结构
数据结构和算法知识树图例
【----------------------------】
数据结构算法常见面试考题
（1）红黑树的了解（平衡树，二叉搜索树），使用场景
- 1.AVLtree
- 2.二叉搜索树
- 3.红黑树的定义
- 4.B树定义
- 5.B+树
- 6.Trie树（字典树）
（2）红黑树在STL上的应用
（3）了解并查集吗？（低频）
（4）贪心算法和动态规划的区别
（5）判断一个链表是否有环，如何找到这个环的起点
（6）实现一个strcpy函数（或者memcpy），如果内存可能重叠呢
（7）快排存在的问题，如何优化
（8） Top K问题（可以采取的方法有哪些，各自优点？）
（9） Bitmap的使用，存储和插入方法
- BitMap从字面的意思
- bitmap应用
- bitmap排序复杂度分析
- BitMap算法流程
- BitMap算法评价
（10）字典树的理解以及在统计上的应用
（11） N个骰子出现和为m的概率
（19）海量数据问题（可参考左神的书）
（20）一致性哈希
- 说明
- 优点
【----------------------------】
经典算法面试题
1. 10亿个数中取前1000大的数
2. 合并k个有序（假设升序）数组
3. 给定一个正整数 N,需要把它分解成至少两个不同的整数和，问有多少种不同的分解方案
4. 一个数组怎么输出前K大的值、时间复杂度。
5. 查找数组中出现次数超过一半的数字
6.二维数组查找（剑指offer）
7.数组中插入数字
8. 合并两个无序链表成一个有序链表，只能用常数空间。
9. 斐波那契数列高效计算
10. 26进制转10进制
11. 输出一个整数二进制表示中1的个数
12. 最小方差划分
13. 波兰式和逆波兰式相关问题
14. 给定一个整数序列，你可以删去其中的连续一段（可以不删），求删去后数组的最大连续子段和。（招商银行M-Geeker竞赛）
15.小明做饼问题
16. O(1)时间删除链表指定节点（给定单向链表的头指针和一个节点指针）
参考文章

# 什么是数据结构? 什么是算法?

从广义上讲，数据结构就是指一组数据的存储结构。算法就是操作数据的一组方法。

从狭义上讲，就是指某些著名的数据结构和算法，比如队列、栈、堆、二分查找、动态规划等。这些都是前人智慧的结晶，我们可以直接拿来用。

# 常用数据结构

1. 数组

2. 栈

3. 队列

4. 链表

5. 图

6. 树

# 数据结构和算法知识树图例

# 【----------------------------】

# 数据结构算法常见面试考题

# （1）红黑树的了解（平衡树，二叉搜索树），使用场景

把数据结构上几种树集中的讨论一下：

# 1.AVLtree

定义：最先发明的自平衡二叉查找树。在AVL树中任何节点的两个子树的高度最大差别为一，所以它也被称为高度平衡树。查找、插入和删除在平均和最坏情况下都是O（log n）。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。

节点的平衡因子是它的左子树的高度减去它的右子树的高度（有时相反）。带有平衡因子1、0或 -1的节点被认为是平衡的。带有平衡因子 -2或2的节点被认为是不平衡的，并需要重新平衡这个树。平衡因子可以直接存储在每个节点中，或从可能存储在节点中的子树高度计算出来。一般我们所看见的都是排序平衡二叉树。

AVLtree使用场景：AVL树适合用于插入删除次数比较少，但查找多的情况。插入删除导致很多的旋转，旋转是非常耗时的。AVL 在linux内核的vm area中使用。

# 2.二叉搜索树

二叉搜索树也是一种树，适用与一般二叉树的全部操作，但二叉搜索树能够实现数据的快速查找。

二叉搜索树满足的条件：

1.非空左子树的所有键值小于其根节点的键值
2.非空右子树的所有键值大于其根节点的键值
3.左右子树都是二叉搜索树

二叉搜索树的应用场景：如果是没有退化称为链表的二叉树，查找效率就是lgn，效率不错，但是一旦退换称为链表了，要么使用平衡二叉树，或者之后的RB树，因为链表就是线性的查找效率。

# 3.红黑树的定义

红黑树是一种二叉查找树，但在每个结点上增加了一个存储位表示结点的颜色，可以是RED或者BLACK。通过对任何一条从根到叶子的路径上各个着色方式的限制，红黑树确保没有一条路径会比其他路径长出两倍，因而是接近平衡的。

当二叉查找树的高度较低时，这些操作执行的比较快，但是当树的高度较高时，这些操作的性能可能不比用链表好。红黑树（red-black tree）是一种平衡的二叉查找树，它能保证在最坏情况下，基本的动态操作集合运行时间为O(lgn)。

红黑树必须要满足的五条性质：

性质一：节点是红色或者是黑色；在树里面的节点不是红色的就是黑色的，没有其他颜色，要不怎么叫红黑树呢，是吧。
性质二：根节点是黑色；根节点总是黑色的。它不能为红。
性质三：每个叶节点（NIL或空节点）是黑色；
性质四：每个红色节点的两个子节点都是黑色的（也就是说不存在两个连续的红色节点）；就是连续的两个节点不能是连续的红色，连续的两个节点的意思就是父节点与子节点不能是连续的红色。
性质五：从任一节点到其每个叶节点的所有路径都包含相同数目的黑色节点。从根节点到每一个NIL节点的路径中，都包含了相同数量的黑色节点。

红黑树的应用场景：红黑树是一种不是非常严格的平衡二叉树，没有AVLtree那么严格的平衡要求，所以它的平均查找，增添删除效率都还不错。广泛用在C++的STL中。如map和set都是用红黑树实现的。

# 4.B树定义

B树和平衡二叉树稍有不同的是B树属于多叉树又名平衡多路查找树（查找路径不只两个），不属于二叉搜索树的范畴，因为它不止两路，存在多路。

B树满足的条件：

（1）树种的每个节点最多拥有m个子节点且m>=2,空树除外（注：m阶代表一个树节点最多有多少个查找路径，m阶=m路,当m=2则是2叉树,m=3则是3叉）；
（2）除根节点外每个节点的关键字数量大于等于ceil(m/2)-1个小于等于m-1个，非根节点关键字数必须>=2;（注：ceil()是个朝正无穷方向取整的函数如ceil(1.1)结果为2)
（3）所有叶子节点均在同一层、叶子节点除了包含了关键字和关键字记录的指针外也有指向其子节点的指针只不过其指针地址都为null对应下图最后一层节点的空格子
（4）如果一个非叶节点有N个子节点，则该节点的关键字数等于N-1;
（5）所有节点关键字是按递增次序排列，并遵循左小右大原则；

B树的应用场景：构造一个多阶的B类树，然后在尽量多的在结点上存储相关的信息，保证层数尽量的少，以便后面我们可以更快的找到信息，磁盘的I/O操作也少一些，而且B类树是平衡树，每个结点到叶子结点的高度都是相同，这也保证了每个查询是稳定的。

# 5.B+树

B+树是B树的一个升级版，B+树是B树的变种树，有n棵子树的节点中含有n个关键字，每个关键字不保存数据，只用来索引，数据都保存在叶子节点。是为文件系统而生的。

相对于B树来说B+树更充分的利用了节点的空间，让查询速度更加稳定，其速度完全接近于二分法查找。为什么说B+树查找的效率要比B树更高、更稳定；我们先看看两者的区别

（1）B+跟B树不同，B+树的非叶子节点不保存关键字记录的指针，这样使得B+树每个节点所能保存的关键字大大增加；
（2）B+树叶子节点保存了父节点的所有关键字和关键字记录的指针，每个叶子节点的关键字从小到大链接；
（3）B+树的根节点关键字数量和其子节点个数相等;
（4）B+的非叶子节点只进行数据索引，不会存实际的关键字记录的指针，所有数据地址必须要到叶子节点才能获取到，所以每次数据查询的次数都一样；

特点：

在B树的基础上每个节点存储的关键字数更多，树的层级更少所以查询数据更快，所有指关键字指针都存在叶子节点，所以每次查找的次数都相同所以查询速度更稳定;

应用场景：用在磁盘文件组织数据索引和数据库索引。

# 6.Trie树（字典树）

trie，又称前缀树，是一种有序树，用于保存关联数组，其中的键通常是字符串。与二叉查找树不同，键不是直接保存在节点中，而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀，也就是这个节点对应的字符串，而根节点对应空字符串。一般情况下，不是所有的节点都有对应的值，只有叶子节点和部分内部节点所对应的键才有相关的值。

在图示中，键标注在节点中，值标注在节点之下。每一个完整的英文单词对应一个特定的整数。Trie 可以看作是一个确定有限状态自动机，尽管边上的符号一般是隐含在分支的顺序中的。键不需要被显式地保存在节点中。图示中标注出完整的单词，只是为了演示 trie 的原理。

trie树的优点：利用字符串的公共前缀来节约存储空间，最大限度地减少无谓的字符串比较，查询效率比哈希表高。缺点：Trie树是一种比较简单的数据结构.理解起来比较简单,正所谓简单的东西也得付出代价.故Trie树也有它的缺点,Trie树的内存消耗非常大.

其基本性质可以归纳为：

1. 根节点不包含字符，除根节点外每一个节点都只包含一个字符。
1. 从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。
1. 每个节点的所有子节点包含的字符都不相同。

典型应用是用于统计，排序和保存大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。字典树与字典很相似,当你要查一个单词是不是在字典树中,首先看单词的第一个字母是不是在字典的第一层,如果不在,说明字典树里没有该单词,如果在就在该字母的孩子节点里找是不是有单词的第二个字母,没有说明没有该单词,有的话用同样的方法继续查找.字典树不仅可以用来储存字母,也可以储存数字等其它数据。

# （2）红黑树在STL上的应用

STL中set、multiset、map、multimap底层是红黑树实现的，而unordered_map、unordered_set 底层是哈希表实现的。

multiset、multimap：插入相同的key的时候，我们将后插入的key放在相等的key的右边，之后不管怎么进行插入或删除操作，后加入的key始终被认为比之前的大。

# （3）了解并查集吗？（低频）

什么是合并查找问题呢？

顾名思义，就是既有合并又有查找操作的问题。举个例子，有一群人，他们之间有若干好友关系。如果两个人有直接或者间接好友关系，那么我们就说他们在同一个朋友圈中，这里解释下，如果Alice是Bob好友的好友，或者好友的好友的好友等等，即通过若干好友可以认识，那么我们说Alice和Bob是间接好友。随着时间的变化，这群人中有可能会有新的朋友关系，这时候我们会对当中某些人是否在同一朋友圈进行询问。这就是一个典型的合并－查找操作问题，既包含了合并操作，又包含了查找操作。

并查集，在一些有N个元素的集合应用问题中，我们通常是在开始时让每个元素构成一个单元素的集合，然后按一定顺序将属于同一组的元素所在的集合合并，其间要反复查找一个元素在哪个集合中。

并查集是一种树型的数据结构，用于处理一些不相交集合（Disjoint Sets）的合并及查询问题。

并查集也是使用树形结构实现。不过，不是二叉树。每个元素对应一个节点，每个组对应一棵树。在并查集中，哪个节点是哪个节点的父亲以及树的形状等信息无需多加关注，整体组成一个树形结构才是重要的。类似森林

# （4）贪心算法和动态规划的区别

贪心算法：局部最优，划分的每个子问题都最优，得到全局最优，但是不能保证是全局最优解，所以对于贪心算法来说，解是从上到下的，一步一步最优，直到最后。

动态规划：将问题分解成重复的子问题，每次都寻找左右子问题解中最优的解，一步步得到全局的最优解.重复的子问题可以通过记录的方式，避免多次计算。所以对于动态规划来说，解是从小到上，从底层所有可能性中找到最优解，再一步步向上。

分治法：和动态规划类似，将大问题分解成小问题，但是这些小问题是独立的，没有重复的问题。独立问题取得解，再合并成大问题的解。

例子：比如钱币分为1元3元4元，要拿6元钱，贪心的话，先拿4，再拿两个1，一共3张钱；实际最优却是两张3元就够了。

# （5）判断一个链表是否有环，如何找到这个环的起点

给定一个单链表，只给出头指针h：

1、如何判断是否存在环？
2、如何知道环的长度？
3、如何找出环的连接点在哪里？
4、带环链表的长度是多少？

解法：

1、对于问题1，使用追赶的方法，设定两个指针slow、fast，从头指针开始，每次分别前进1步、2步。如存在环，则两者相遇；如不存在环，fast遇到NULL退出。
2、对于问题2，记录下问题1的碰撞点p，slow、fast从该点开始，再次碰撞所走过的操作数就是环的长度s。
3、问题3：有定理：碰撞点p到连接点的距离=头指针到连接点的距离，因此，分别从碰撞点、头指针开始走，相遇的那个点就是连接点。(证明在后面附注)
4、问题3中已经求出连接点距离头指针的长度，加上问题2中求出的环的长度，二者之和就是带环单链表的长度 http://blog.sina.com.cn/s/blog_725dd1010100tqwp.html

# （6）实现一个strcpy函数（或者memcpy），如果内存可能重叠呢

——大家一般认为名不见经传strcpy函数实现不是很难，流行的strcpy函数写法是：

  1. char *my_strcpy(char *dst,const char *src)  
  2. {  
  3.     assert(dst != NULL);  
  4.     assert(src != NULL);  
  5.     char *ret = dst;  
  6.     while((* dst++ = * src++) != '\0')   
  7.         ;  
  8.     return ret;  
  9. }

如果注意到：

1，检查指针有效性；
2，返回目的指针des；
3，源字符串的末尾 ‘\0’ 需要拷贝。

# 内存重叠

内存重叠：拷贝的目的地址在源地址范围内。所谓内存重叠就是拷贝的目的地址和源地址有重叠。

在函数strcpy和函数memcpy都没有对内存重叠做处理的，使用这两个函数的时候只有程序员自己保证源地址和目标地址不重叠，或者使用memmove函数进行内存拷贝。

memmove函数对内存重叠做了处理。

strcpy的正确实现应为：

  1. char *my_strcpy(char *dst,const char *src)  
  2. {  
  3.     assert(dst != NULL);  
  4.     assert(src != NULL);  
  5.     char *ret = dst;  
  6.     memmove(dst,src,strlen(src)+1);  
  7.     return ret;  
  8. }

memmove函数实现时考虑到了内存重叠的情况，可以完成指定大小的内存拷贝

# （7）快排存在的问题，如何优化

# 快排的时间复杂度

时间复杂度最快平均是O（nlogn）,最慢的时候是O(n2);辅助空间也是O(logn)；最开始学快排时最疑惑的就是这个东西不知道怎么得来的，一种是通过数学运算可以的出来，还有一种是通过递归树来理解就容易多了

这张图片别人博客那里弄过来的，所谓时间复杂度最理想的就是取到中位数情况，那么递归树就是一个完全二叉树，那么树的深度也就是最低为Logn，这个时候每一次又需要n次比较，所以时间复杂度nlogn，当快排为顺序或者逆序时，这个数为一个斜二叉树，深度为n，同样每次需要n次比较，那那么最坏需要n2的时间

# 优化：

1.当整个序列有序时退出算法；
2.当序列长度很小时（根据经验是大概小于 8），应该使用常数更小的算法，比如插入排序等；
3.随机选取分割位置；
4.当分割位置不理想时，考虑是否重新选取分割位置；
5.分割成两个序列时，只对其中一个递归进去，另一个序列仍可以在这一函数内继续划分，可以显著减小栈的大小（尾递归）：
6.将单向扫描改成双向扫描，可以减少划分过程中的交换次数

优化1：当待排序序列的长度分割到一定大小后，使用插入排序原因：对于很小和部分有序的数组，快排不如插排好。当待排序序列的长度分割到一定大小后，继续分割的效率比插入排序要差，此时可以使用插排而不是快排

优化2：在一次分割结束后，可以把与Key相等的元素聚在一起，继续下次分割时，不用再对与key相等元素分割

优化3：优化递归操作快排函数在函数尾部有两次递归操作，我们可以对其使用尾递归优化

优点：如果待排序的序列划分极端不平衡，递归的深度将趋近于n，而栈的大小是很有限的，每次递归调用都会耗费一定的栈空间，函数的参数越多，每次递归耗费的空间也越多。优化后，可以缩减堆栈深度，由原来的O(n)缩减为O(logn)，将会提高性能。

# （8） Top K问题（可以采取的方法有哪些，各自优点？）

1.将输入内容（假设用数组存放）进行完全排序，从中选出排在前K的元素即为所求。有了这个思路，我们可以选择相应的排序算法进行处理，目前来看快速排序，堆排序和归并排序都能达到O(nlogn)的时间复杂度。

2.对输入内容进行部分排序，即只对前K大的元素进行排序（这K个元素即为所求）。此时我们可以选择冒泡排序或选择排序进行处理，即每次冒泡（选择）都能找到所求的一个元素。这类策略的时间复杂度是O(Kn)。

3.对输入内容不进行排序，显而易见，这种策略将会有更好的性能开销。我们此时可以选择两种策略进行处理：

用一个桶来装前k个数，桶里面可以按照最小堆来维护 a)利用最小堆维护一个大小为K的数组，目前该小根堆中的元素是排名前K的数，其中根是最小的数。此后，每次从原数组中取一个元素与根进行比较，如大于根的元素，则将根元素替换并进行堆调整（下沉），即保证小根堆中的元素仍然是排名前K的数，且根元素仍然最小；否则不予处理，取下一个数组元素继续该过程。该算法的时间复杂度是O(nlogK)，一般来说企业中都采用该策略处理top-K问题，因为该算法不需要一次将原数组中的内容全部加载到内存中，而这正是海量数据处理必然会面临的一个关卡。

b)利用快速排序的分划函数找到分划位置K，则其前面的内容即为所求。该算法是一种非常有效的处理方式，时间复杂度是O(n)（证明可以参考算法导论书籍）。对于能一次加载到内存中的数组，该策略非常优秀。

# （9） Bitmap的使用，存储和插入方法

# BitMap从字面的意思

很多人认为是位图，其实准确的来说，翻译成基于位的映射。在所有具有性能优化的数据结构中，大家使用最多的就是hash表，是的，在具有定位查找上具有O(1)的常量时间，多么的简洁优美。但是数据量大了，内存就不够了。当然也可以使用类似外排序来解决问题的，由于要走IO所以时间上又不行。所谓的Bit-map就是用一个bit位来标记某个元素对应的Value，而Key即是该元素。由于采用了Bit为单位来存储数据，因此在存储空间方面，可以大大节省。其实如果你知道计数排序的话（算法导论中有一节讲过），你就会发现这个和计数排序很像。

# bitmap应用

   1）可进行数据的快速查找，判重，删除，一般来说数据范围是int的10倍以下。
   2）去重数据而达到压缩数据

还可以用于爬虫系统中url去重、解决全组合问题。

BitMap应用：排序示例

假设我们要对0-7内的5个元素(4,7,2,5,3)排序（这里假设这些元素没有重复）。那么我们就可以采用Bit-map的方法来达到排序的目的。要表示8个数，我们就只需要8个Bit（1Bytes），首先我们开辟1Byte的空间，将这些空间的所有Bit位都置为0(如下图：)

然后遍历这5个元素，首先第一个元素是4，那么就把4对应的位置为1（可以这样操作 p+(i/8)|(0×01<<(i%8)) 当然了这里的操作涉及到Big-ending和Little-ending的情况，这里默认为Big-ending。不过计算机一般是小端存储的，如intel。小端的话就是将倒数第5位置1）,因为是从零开始的，所以要把第五位置为一（如下图）：

然后再处理第二个元素7，将第八位置为1,，接着再处理第三个元素，一直到最后处理完所有的元素，将相应的位置为1，这时候的内存的Bit位的状态如下：

然后我们现在遍历一遍Bit区域，将该位是一的位的编号输出（2，3，4，5，7），这样就达到了排序的目的。

# bitmap排序复杂度分析

Bitmap排序需要的时间复杂度和空间复杂度依赖于数据中最大的数字。 bitmap排序的时间复杂度不是O(N)的，而是取决于待排序数组中的最大值MAX，在实际应用上关系也不大，比如我开10个线程去读byte数组，那么复杂度为:O(Max/10)。也就是要是读取的，可以用多线程的方式去读取。时间复杂度方面也是O(Max/n)，其中Max为byte[]数组的大小，n为线程大小。空间复杂度应该就是O(Max/8)bytes吧

# BitMap算法流程

假设需要排序或者查找的最大数MAX=10000000（lz:这里MAX应该是最大的数而不是int数据的总数！），那么我们需要申请内存空间的大小为int a[1 + MAX/32]。其中：a[0]在内存中占32为可以对应十进制数0-31，依次类推：

bitmap表为：
a[0]--------->0-31
a[1]--------->32-63
a[2]--------->64-95
a[3]--------->96-127
…

我们要把一个整数N映射到Bit-Map中去，首先要确定把这个N Mapping到哪一个数组元素中去，即确定映射元素的index。我们用int类型的数组作为map的元素，这样我们就知道了一个元素能够表示的数字个数(这里是32)。于是N/32就可以知道我们需要映射的key了。所以余下来的那个N%32就是要映射到的位数。

# 1.求十进制数对应在数组a中的下标：

先由十进制数n转换为与32的余可转化为对应在数组a中的下标。如十进制数0-31，都应该对应在a[0]中，比如n=24,那么 n/32=0，则24对应在数组a中的下标为0。又比如n=60,那么n/32=1，则60对应在数组a中的下标为1，同理可以计算0-N在数组a中的下标。

i = N>>K % 结果就是N/(2^K)

Note: map的范围是[0, 原数组最大的数对应的2的整次方数-1]。

# 2.求十进制数对应数组元素a[i]在0-31中的位m：

十进制数0-31就对应0-31，而32-63则对应也是0-31，即给定一个数n可以通过模32求得对应0-31中的数。 m = n & ((1 << K) - 1) %结果就是n%(2^K)

# 3.利用移位0-31使得对应第m个bit位为1

如a[i]的第m位置1：a[i] = a[i] | (1<<m) 如：将当前4对应的bit位置1的话，只需要1左移4位与B[0] | 即可。

Note:

1 p+(i/8)|(0×01<<(i%8))这样也可以？
2 同理将int型变量a的第k位清0，即a=a&~(1<<k)

# BitMap算法评价

优点：

1. 运算效率高，不进行比较和移位；
1. 占用内存少，比如最大的数MAX=10000000；只需占用内存为MAX/8=1250000Byte=1.25M。

缺点：

1. 所有的数据不能重复，即不可对重复的数据进行排序。（少量重复数据查找还是可以的，用2-bitmap）。
1. 当数据类似（1，1000，10万）只有3个数据的时候，用bitmap时间复杂度和空间复杂度相当大，只有当数据比较密集时才有优势。 http://blog.csdn.net/pipisorry/article/details/62443757

# （10）字典树的理解以及在统计上的应用

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。Trie树也有它的缺点,Trie树的内存消耗非常大.当然,或许用左儿子右兄弟的方法建树的话,可能会好点.

就是在海量数据中找出某一个数，比如2亿QQ号中查找出某一个特定的QQ号。。

# （11） N个骰子出现和为m的概率

典型的可以用动态规划的思想来完成

1.现在变量有：骰子个数，点数和。当有k个骰子，点数和为n时，出现次数记为f(k,n)。那与k-1个骰子阶段之间的关系是怎样的？

2.当我有k-1个骰子时，再增加一个骰子，这个骰子的点数只可能为1、2、3、4、5或6。那k个骰子得到点数和为n的情况有：

(k-1,n-1)：第k个骰子投了点数1
(k-1,n-2)：第k个骰子投了点数2
(k-1,n-3)：第k个骰子投了点数3
…
(k-1,n-6)：第k个骰子投了点数6

在k-1个骰子的基础上，再增加一个骰子出现点数和为n的结果只有这6种情况！

所以：f(k,n)=f(k-1,n-1)+f(k-1,n-2)+f(k-1,n-3)+f(k-1,n-4)+f(k-1,n-5)+f(k-1,n-6)

3.有1个骰子，f(1,1)=f(1,2)=f(1,3)=f(1,4)=f(1,5)=f(1,6)=1。

用递归就可以解决这个问题：

用迭代来完成

# （19）海量数据问题（可参考左神的书）

目前关于海量数据想到的解决办法：

1.bitmap
2.桶排序，外部排序，将需要排序的放到外存上，不用全部放到内存上

# （20）一致性哈希

# 说明

http://www.zsythink.net/archives/1182

# 优点

1.当后端是缓存服务器时，经常使用一致性哈希算法来进行负载均衡。使用一致性哈希的好处在于，增减集群的缓存服务器时，只有少量的缓存会失效，回源量较小。
2.尽量减少数据丢失问题，减少移动数据的风险

# 【----------------------------】

# 经典算法面试题

# 1. 10亿个数中取前1000大的数

维护一个1000个节点的小顶堆。

时间复杂度O(nlogk)

# 2. 合并k个有序（假设升序）数组

具体步骤：（1）将k个数组的第一个元素取出来，维护一个小顶堆。

（2）弹出堆顶元素存入结果数组中，并把该元素所在数组的下一个元素取出来压入队中。

（3）调整堆的结构，使其满足小顶堆的定义。

（4）重复（2）（3）直到合并完成。

# 3. 给定一个正整数 N,需要把它分解成至少两个不同的整数和，问有多少种不同的分解方案

动态规划：dp[n][m]表示n被分解为最大为m的数的方案数

# 4. 一个数组怎么输出前K大的值、时间复杂度。

借助快排partition的思想，平均时间复杂度是O(n)

# 5. 查找数组中出现次数超过一半的数字

等价于求数组中第n/2大的数，和4中思想一样，平均时间复杂度O(n)

# 6.二维数组查找（剑指offer）

在一个二维数组中（每个一维数组的长度相同），每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。请完成一个函数，输入这样的一个二维数组和一个整数，判断数组中是否含有该整数。

思路分析：我们注意到这个二维数组的行和列都是升序的，也就是说最上面的一行和最右边的一列在整体上也是升序的，在一个排序数组上查找某个我们会很自然的想起二分法。这样我们每次都把要查找的数和当前剩下的二维数组的右上角数字比较，这样每次我们都可以排除掉一行或一列。算法的时间复杂度是O(n+m)，也就是行数加列数。

# 7.数组中插入数字

题一：替换空格（剑指offer）

请实现一个函数，将一个字符串中的每个空格替换成“%20”。例如，当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。

题二：两个排序数组A1和A2，现在想把A2插入A1中并仍保持有序。

思路分析：数组是个顺序表，我们往数组中插入某个数的话必须要移动当前位置后面所有的数。常规的思路是每次插入一个数并移动后面的数，这样多次插入后会导致数组中有的数被移动了多次，极大浪费了效率。我们希望每个数移动一次就到达它最终的位置，所以我们往往会反向移动数组，这样做的好处是移动当前数时后面的数已经到达了最终位置，我们移动当前数不会影响到后面的数，这样就确保了每个数只被移动一次。

# 8. 合并两个无序链表成一个有序链表，只能用常数空间。

归并排序的思想，用快慢指针不断二分链表。

# 9. 斐波那契数列高效计算

斐波那契数列：f(0) = 0, f(1) = 1, f(n) = f(n - 1) + f(n - 2)

方法一：递归，效率低

方法二：循环，正着推

方法三：矩阵运算

# 10. 26进制转10进制

用A表示1第一列，B表示2第二列，。。。，Z表示26，AA表示27，AB表示28。。。以此类推。请写出一个函数，输入用字母表示的列号编码，输出它是第几列。

解题思路：26进制转10进制。

# 11. 输出一个整数二进制表示中1的个数

解法1：右移原数判断，如果输入是负数可能陷入死循环。

解法2：左移1

解法3：把一个整数-1后与原数做与运算会消去原数最左边的1

# 12. 最小方差划分

把一个数组划分成两部分，使其方差和最小。

D(X) = E(x^2) - [E(X)]^2

迭代求和。

# 13. 波兰式和逆波兰式相关问题

计算(1+((2+3)(45)))，leetcode224

# 14. 给定一个整数序列，你可以删去其中的连续一段（可以不删），求删去后数组的最大连续子段和。（招商银行M-Geeker竞赛）

解题思路：最大连续子序列的变种题，从前往后遍历一遍求最大连续子序列和，然后从后往前遍历一遍求最大连续子序列和。

思路拓展：对于删去中间一段不好直接操作的话，可以先从前往后遍历，在从后往前遍历。

# 15.小明做饼问题

小明要在t分钟之内做l张饼，有n个锅，但只能选其中k个锅，每个锅每分钟能做vi个饼，最多能做mi个饼，问能不能做完l张饼，如果能，输出最少需要多少分钟；如果不能，输出最多能做几张饼。

解法：先讨论能不能做完：每个锅在t分钟内能做的饼数为min(mi,vi*t), 降序排列，前k个锅能做出来的饼>l就能；如果不能做完：直接输出前k个锅能做饼的和；如果能：二分最短时间，然后判断在mid分钟内能不能做完饼，判断方法同t分钟的情况。

思路：查询时先想一下二分。

# 16. O(1)时间删除链表指定节点（给定单向链表的头指针和一个节点指针）

解题思路：把该节点下个节点的值复制到该节点，删除下个节点（注意该节点是尾节点和链表只有一个节点的特殊情况）

# 参考文章

https://blog.csdn.net/u012414189/article/details/83832161
https://www.cnblogs.com/songgj/p/12994157.html
https://www.cnblogs.com/xumaomao/p/11129815.html

← 常见互联网公司算法概览 30道经典算法面试题摘选 →

# 什么是数据结构? 什么是算法?

# 常用数据结构

# 数据结构和算法知识树图例

# 【----------------------------】

# 数据结构算法常见面试考题

# （1） 红黑树的了解（平衡树，二叉搜索树），使用场景

# 1.AVLtree

# 2.二叉搜索树

# 3.红黑树的定义

# 4.B树定义

# 5.B+树

# 6.Trie树（字典树）

# （2） 红黑树在STL上的应用

# （3） 了解并查集吗？（低频）

# （4） 贪心算法和动态规划的区别

# （5） 判断一个链表是否有环，如何找到这个环的起点

# （6） 实现一个strcpy函数（或者memcpy），如果内存可能重叠呢

# 内存重叠

# （7） 快排存在的问题，如何优化

# 快排的时间复杂度

# 优化：

# （8） Top K问题（可以采取的方法有哪些，各自优点？）

# （9） Bitmap的使用，存储和插入方法

# BitMap从字面的意思

# bitmap应用

# bitmap排序复杂度分析

# BitMap算法流程

# 1.求十进制数对应在数组a中的下标：

# 2.求十进制数对应数组元素a[i]在0-31中的位m：

# 3.利用移位0-31使得对应第m个bit位为1

# BitMap算法评价

# （10） 字典树的理解以及在统计上的应用

# （11） N个骰子出现和为m的概率

# （19） 海量数据问题（可参考左神的书）

# （20） 一致性哈希

# 说明

# 优点

# 【----------------------------】

# 经典算法面试题

# 1. 10亿个数中取前1000大的数

# 2. 合并k个有序（假设升序）数组

# 3. 给定一个正整数 N,需要把它分解成至少两个不同的整数和，问有多少种不同的分解方案

# 4. 一个数组怎么输出前K大的值、时间复杂度。

# 5. 查找数组中出现次数超过一半的数字

# 6.二维数组查找（剑指offer）

# 7.数组中插入数字

# 8. 合并两个无序链表成一个有序链表，只能用常数空间。

# 9. 斐波那契数列高效计算

# 10. 26进制转10进制

# 11. 输出一个整数二进制表示中1的个数

# 12. 最小方差划分

# 13. 波兰式和逆波兰式相关问题

# 14. 给定一个整数序列，你可以删去其中的连续一段（可以不删），求删去后数组的最大连续子段和。（招商银行M-Geeker竞赛）

# 15.小明做饼问题

# 16. O(1)时间删除链表指定节点（给定单向链表的头指针和一个节点指针）

# 参考文章

可分享给好友和朋友圈

公众号:智能后端和架构

PS 备注:智能后端和架构

# （1）红黑树的了解（平衡树，二叉搜索树），使用场景

# （2）红黑树在STL上的应用

# （3）了解并查集吗？（低频）

# （4）贪心算法和动态规划的区别

# （5）判断一个链表是否有环，如何找到这个环的起点

# （6）实现一个strcpy函数（或者memcpy），如果内存可能重叠呢

# （7）快排存在的问题，如何优化

# （10）字典树的理解以及在统计上的应用

# （19）海量数据问题（可参考左神的书）

# （20）一致性哈希