各含专题

从两个文件(各含50亿个url)中找出共同的url、不同的url

问题:          给定a、b两个文件,各存放50亿个url,每个url各占用64字节,内存限制是4G,如何找出a、b文件共同的url?   算法思路:          方法一、          可以估计每个文件的大小为5G*64=300G (50亿是5000000000,即5G),远大于4G。          所以不可能将其完全加载到内存中处理,考虑采取分而治