如题:有List list1和List list2,两个集合各有上万个元素,怎样取出两个集合中不同的元素?
方法1:遍历两个集合:
packagecom.czp.test;importjava.util.ArrayList;importjava.util.List;public classTestList {public static voidmain(String[] args) {
List list1 = new ArrayList();
List list2 = new ArrayList();for (int i = 0; i < 10000; i++) {
list1.add(“test”+i);
list2.add(“test”+i*2);
}
getDiffrent(list1,list2);//输出:total times 2566454675
}/*** 获取两个List的不同元素
*@paramlist1
*@paramlist2
*@return
*/
private static List getDiffrent(List list1, Listlist2) {long st =System.nanoTime();
List diff = new ArrayList();for(String str:list1)
{if(!list2.contains(str))
{
diff.add(str);
}
}
System.out.println(“total times “+(System.nanoTime()-st));returndiff;
}
}
千万不要采用这种方法,总共要循环的次数是两个List的size相乘的积,从输出看耗时也是比较长的,那么我们有没有其他的方法呢?当然有.
方法2:采用List提供的retainAll()方法:
packagecom.czp.test;importjava.util.ArrayList;importjava.util.List;public classTestList {public static voidmain(String[] args) {
List list1 = new ArrayList();
List list2 = new ArrayList();for (int i = 0; i < 10000; i++) {
list1.add(“test”+i);
list2.add(“test”+i*2);
}
getDiffrent(list1,list2);//输出:total times 2566454675
getDiffrent2(list1,list2);//输出:getDiffrent2 total times 2787800964
}/*** 获取连个List的不同元素
*@paramlist1
*@paramlist2
*@return
*/
private static List getDiffrent2(List list1, Listlist2) {long st =System.nanoTime();
list1.retainAll(list2);
System.out.println(“getDiffrent2 total times “+(System.nanoTime()-st));returnlist1;
}/*** 获取两个List的不同元素
*@paramlist1
*@paramlist2
*@return
*/
private static List getDiffrent(List list1, Listlist2) {long st =System.nanoTime();
List diff = new ArrayList();for(String str:list1)
{if(!list2.contains(str))
{
diff.add(str);
}
}
System.out.println(“getDiffrent total times “+(System.nanoTime()-st));returndiff;
}
}
很遗憾,这种方式虽然只要几行代码就搞定,但是这个却更耗时,查看retainAll()的源码:
public boolean retainAll(Collection>c) {boolean modified = false;
Iterator e =iterator();while(e.hasNext()) {if (!c.contains(e.next())) {
e.remove();
modified= true;
}
}returnmodified;
}
无需解释这个耗时是必然的,那么我们还有没有更好的办法呢?仔细分析以上两个方法中我都做了mXn次循环,其实完全没有必要循环这么多次,我们的需求是找出两个List中的不同元素,那么我可以这样考虑:用一个map存放lsit的所有元素,其中的key为lsit1的各个元素,value为该元素出现的次数,接着把list2的所有元素也放到map里,如果已经存在则va