1亿个手机号如何排序？

之前有朋友问了一个问题，说

10

$10$

万个手机号怎么排序。我说

10

$10$

万个太少了，读到数组中，直接排就行了。

今天突然想到一个问题，如果是1亿个手机号怎么排序呢？

先来理清一下需求：

有1亿个不重复的手机号，按行存放在一个大文件
mobiles_in.txt
中，要求将手机号由小到大排好序的结果输出到另一个文件
mobiles_sorted.txt
中。

1个手机号11位数字，再加上换行符(\r\n)，一行是13个byte，1亿个手机号的文件大小是13亿byte，大概是1.2G。其实也不算多大个文件。

处理“大”问题的基本思路：分治。

本问题中，可以借鉴

归并排序

的思路，将大文件拆成100个小文件，小文件内部排好序，然后进行100路的归并操作。