Python读取大文件-白红宇

Python读取大文件

阅读量：648 次

发布时间：2019-03-15

本文共 890 字，大约阅读时间需要 2 分钟。

Python读取大文件的高效方法

当你试图用Python读取2GB或更大的文件时，使用普通的方法（如read和readlines）可能会抛出MemoryError，说明内存不足以加载整个文件。这通常发生在文件太大，无法完全读取时。

逐行读取方法

采用逐行读取的方式，可以有效减少内存占用。具体实现如下：

with open('filename.txt', 'r', encoding='utf-8') as f:    while True:        line = f.readline()        if not line:            break        print(line)

这种方法每次只读取一行内容，适合处理大文件。循环终止条件为文件结束。

指定长度读取方法

如果需要灵活控制读取长度，可以采用每次读取固定字节数的方式：

with open('filename.txt', 'r', encoding='utf-8') as f:    while True:        data = f.read(1024)        if not data:            break        print(data)

这种方式每次读取1024字节，从而分批处理大文件。

自动管理优化方法

更高效的方式是利用Python的内置文件处理功能，结合with语句和生成器。使用for循环遍历文件：

with open('filename.txt', 'r', encoding='utf-8') as f:    for line in f:        # 对每行内容进行处理        do_something(line)

这种方法利用了效率高的IO缓存机制，自动处理大文件，无需担心内存不足。

注意事项

使用with语句来确保文件在错误或正常结束时被自动关闭。

生成器方法for line in f自动管理内存，适合大文件处理，避免一次性读取过大文件内容。

通过以上方法，可以高效且安全地读取大文件，合理分配内存，避免内存错误。

转载地址：http://nmrlz.baihongyu.com/

你可能感兴趣的文章

Objective-C实现heap堆算法(附完整源码)

查看>>

Objective-C实现Heap堆算法(附完整源码)

查看>>

Objective-C实现hexagonal numbers六边形数算法(附完整源码)

查看>>

Objective-C实现hidden layers neural network浅层神经网络算法(附完整源码)

查看>>

Objective-C实现highest response ratio next高响应比优先调度算法(附完整源码)

查看>>

Objective-C实现hill climbing爬山法用来寻找函数的最大值算法(附完整源码)

查看>>

Objective-C实现histogram stretch直方图拉伸算法(附完整源码)

查看>>

Objective-C实现Hopcroft算法(附完整源码)

查看>>

Objective-C实现horizontal projectile motion平抛运动算法(附完整源码)

查看>>

Objective-C实现hornerMethod霍纳法算法（附完整源码）

查看>>

Objective-C实现Horn–Schunck光流算法(附完整源码)

查看>>

Objective-C实现Http Post请求(附完整源码)

查看>>

Objective-C实现http下载文件 (附完整源码)

查看>>

Objective-C实现Http协议下载文件(附完整源码)

查看>>

Objective-C实现huffman哈夫曼编码算法(附完整源码)

查看>>

Objective-C实现ID3贪心算法(附完整源码)

查看>>

Objective-C实现IIR 滤波器算法(附完整源码)

查看>>

Objective-C实现IIR数字滤波器（附完整源码）

查看>>

Objective-C实现insertion sort插入排序算法(附完整源码)

查看>>

Objective-C实现integer partition整数分区算法(附完整源码)

查看>>