java 读取文件 效率_Java 逐行读取文本文件的几种方式以及效率对比

  • Post author:
  • Post category:java


前言

上周负责的模块中需要逐行读取文件内容, 写完之后对程序执行效率不太满意, 索性上网查了一下 Java 逐行读取文件内容的各种方法, 并且简单地比对了一下执行效率. 在此记录, 希望能够帮到有需要的人.

注意: 本文比对的项目为 逐行读取文本内容, 并不能代表其他方式的文件读取效率优劣!!!

文末有完整代码.

先放结果

1000000 行文本读取结果比对:

BufferedReader 耗时: 49ms

Scanner 耗时: 653ms

Apache Commons IO 耗时: 44ms

InputStreamReader 耗时: 191ms

FileInputStream 耗时: 3171ms

BufferedInputStream 耗时: 70ms

FileUtils 耗时: 46ms

Files 耗时: 99ms

24488656 行文本读取结果比对:

BufferedReader 耗时: 989ms

Scanner 耗时: 11899ms

Apache Commons IO 耗时: 568ms

InputStreamReader 耗时: 3377ms

FileInputStream 耗时: 78903ms

BufferedInputStream 耗时: 1480ms

FileUtils 耗时: 16569ms

Files 耗时: 25162ms

可见, 当文件较小时:

ApacheCommonsIO 流 表现最佳;

FileUtils, BufferedReader 居其二;

BufferedInputStream, Files 随其后;

InputStreamReader, Scanner, FileInputStream 略慢.

当文件较大时, Apache Commons IO 流, BufferedReader 依然出色, Files, FileUtils 速度开始变慢.

简要分析

使用到的工具类包括:

java.io.BufferedReader

java.util.Scanner

org.apache.commons.io.FileUtils

java.io.InputStreamReader

java.io.FileInputStream

java.io.BufferedInputStream

com.google.common.io.Files

其中:

Apache Commons IO 流 和 BufferedReader 使用到了缓冲区, 所以在不消耗大量内存的情况下提高了处理速度;

FileUtils 和 Files 是先把文件内容全部读入内存, 然后在进行操作, 是典型的空间换时间案例. 这种方法可能会大量消耗内存, 建议酌情使用;

其他几个工具类本来就不擅长逐行读取, 效率底下也是情理之中.

建议

在逐行读取文本内容的需求下, 建议使用 Apache Commons IO 流, 或者 BufferedReader, 既不会过多地占用内存, 也保证了优异的处理速度.

参考文献:

[Java]读取文件方法大全 — lovebread

java读取文件API速度对比 — fengxingzhe001

Java高效读取大文件 — Eugen Paraschiv[文] / ImportNew – 进林[译]

附录-源代码:

import com.google.common.io.Files;

import org.apache.commons.io.Charsets;

import org.apache.commons.io.FileUtils;

import org.apache.commons.io.LineIterator;

import java.io.*;

import java.util.List;

import java.util.Random;

import java.util.Scanner;

/**

* @Description: 逐行读取文件性能对比

* @Author: Seven-Steven

* @Date: 19-1-25

**/

public class ReadByLineFromFileTest {

public static void main(String[] args) {

ReadByLineFromFileTest test = new ReadByLineFromFileTest();

String filePath = “./testFile.txt”;

File file = new File(filePath);

if (!file.exists()) {

// 随机写入 1000000 行内容

test.writeRandom(filePath, 1000000);

}

long before, after, time;

// 使用 BufferedReader 逐行读取文件

before = System.currentTimeMillis();

test.bufferedReader(filePath);

after = System.currentTimeMillis();

time = after – before;

System.out.println(“BufferedReader 耗时: ” + time + “ms”);

// 使用 Scanner 逐行读取文件

before = System.currentTimeMillis();

t



版权声明:本文为weixin_42500963原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。