前言
上周负责的模块中需要逐行读取文件内容, 写完之后对程序执行效率不太满意, 索性上网查了一下 Java 逐行读取文件内容的各种方法, 并且简单地比对了一下执行效率. 在此记录, 希望能够帮到有需要的人.
注意: 本文比对的项目为 逐行读取文本内容, 并不能代表其他方式的文件读取效率优劣!!!
文末有完整代码.
先放结果
1000000 行文本读取结果比对:
BufferedReader 耗时: 49ms
Scanner 耗时: 653ms
Apache Commons IO 耗时: 44ms
InputStreamReader 耗时: 191ms
FileInputStream 耗时: 3171ms
BufferedInputStream 耗时: 70ms
FileUtils 耗时: 46ms
Files 耗时: 99ms
24488656 行文本读取结果比对:
BufferedReader 耗时: 989ms
Scanner 耗时: 11899ms
Apache Commons IO 耗时: 568ms
InputStreamReader 耗时: 3377ms
FileInputStream 耗时: 78903ms
BufferedInputStream 耗时: 1480ms
FileUtils 耗时: 16569ms
Files 耗时: 25162ms
可见, 当文件较小时:
ApacheCommonsIO 流 表现最佳;
FileUtils, BufferedReader 居其二;
BufferedInputStream, Files 随其后;
InputStreamReader, Scanner, FileInputStream 略慢.
当文件较大时, Apache Commons IO 流, BufferedReader 依然出色, Files, FileUtils 速度开始变慢.
简要分析
使用到的工具类包括:
java.io.BufferedReader
java.util.Scanner
org.apache.commons.io.FileUtils
java.io.InputStreamReader
java.io.FileInputStream
java.io.BufferedInputStream
com.google.common.io.Files
其中:
Apache Commons IO 流 和 BufferedReader 使用到了缓冲区, 所以在不消耗大量内存的情况下提高了处理速度;
FileUtils 和 Files 是先把文件内容全部读入内存, 然后在进行操作, 是典型的空间换时间案例. 这种方法可能会大量消耗内存, 建议酌情使用;
其他几个工具类本来就不擅长逐行读取, 效率底下也是情理之中.
建议
在逐行读取文本内容的需求下, 建议使用 Apache Commons IO 流, 或者 BufferedReader, 既不会过多地占用内存, 也保证了优异的处理速度.
参考文献:
[Java]读取文件方法大全 — lovebread
java读取文件API速度对比 — fengxingzhe001
Java高效读取大文件 — Eugen Paraschiv[文] / ImportNew – 进林[译]
附录-源代码:
import com.google.common.io.Files;
import org.apache.commons.io.Charsets;
import org.apache.commons.io.FileUtils;
import org.apache.commons.io.LineIterator;
import java.io.*;
import java.util.List;
import java.util.Random;
import java.util.Scanner;
/**
* @Description: 逐行读取文件性能对比
* @Author: Seven-Steven
* @Date: 19-1-25
**/
public class ReadByLineFromFileTest {
public static void main(String[] args) {
ReadByLineFromFileTest test = new ReadByLineFromFileTest();
String filePath = “./testFile.txt”;
File file = new File(filePath);
if (!file.exists()) {
// 随机写入 1000000 行内容
test.writeRandom(filePath, 1000000);
}
long before, after, time;
// 使用 BufferedReader 逐行读取文件
before = System.currentTimeMillis();
test.bufferedReader(filePath);
after = System.currentTimeMillis();
time = after – before;
System.out.println(“BufferedReader 耗时: ” + time + “ms”);
// 使用 Scanner 逐行读取文件
before = System.currentTimeMillis();
t