博客
关于我
Python读取大文件
阅读量:648 次
发布时间:2019-03-15

本文共 890 字,大约阅读时间需要 2 分钟。

Python读取大文件的高效方法

当你试图用Python读取2GB或更大的文件时,使用普通的方法(如read和readlines)可能会抛出MemoryError,说明内存不足以加载整个文件。这通常发生在文件太大,无法完全读取时。

逐行读取方法

采用逐行读取的方式,可以有效减少内存占用。具体实现如下:

with open('filename.txt', 'r', encoding='utf-8') as f:    while True:        line = f.readline()        if not line:            break        print(line)

这种方法每次只读取一行内容,适合处理大文件。循环终止条件为文件结束。

指定长度读取方法

如果需要灵活控制读取长度,可以采用每次读取固定字节数的方式:

with open('filename.txt', 'r', encoding='utf-8') as f:    while True:        data = f.read(1024)        if not data:            break        print(data)

这种方式每次读取1024字节,从而分批处理大文件。

自动管理优化方法

更高效的方式是利用Python的内置文件处理功能,结合with语句和生成器。使用for循环遍历文件:

with open('filename.txt', 'r', encoding='utf-8') as f:    for line in f:        # 对每行内容进行处理        do_something(line)

这种方法利用了效率高的IO缓存机制,自动处理大文件,无需担心内存不足。

注意事项

  • 使用with语句来确保文件在错误或正常结束时被自动关闭。
  • 生成器方法for line in f自动管理内存,适合大文件处理,避免一次性读取过大文件内容。

通过以上方法,可以高效且安全地读取大文件,合理分配内存,避免内存错误。

转载地址:http://nmrlz.baihongyu.com/

你可能感兴趣的文章
No Datastore Session bound to thread, and configuration does not allow creation of non-transactional
查看>>
No fallbackFactory instance of type class com.ruoyi---SpringCloud Alibaba_若依微服务框架改造---工作笔记005
查看>>
No Feign Client for loadBalancing defined. Did you forget to include spring-cloud-starter-loadbalanc
查看>>
No mapping found for HTTP request with URI [/...] in DispatcherServlet with name ...的解决方法
查看>>
No mapping found for HTTP request with URI [/logout.do] in DispatcherServlet with name 'springmvc'
查看>>
No module named 'crispy_forms'等使用pycharm开发
查看>>
No module named cv2
查看>>
No module named tensorboard.main在安装tensorboardX的时候遇到的问题
查看>>
No module named ‘MySQLdb‘错误解决No module named ‘MySQLdb‘错误解决
查看>>
No new migrations found. Your system is up-to-date.
查看>>
No qualifying bean of type XXX found for dependency XXX.
查看>>
No resource identifier found for attribute 'srcCompat' in package的解决办法
查看>>
no session found for current thread
查看>>
No toolchains found in the NDK toolchains folder for ABI with prefix: mips64el-linux-android
查看>>
NO.23 ZenTaoPHP目录结构
查看>>
no1
查看>>
NO32 网络层次及OSI7层模型--TCP三次握手四次断开--子网划分
查看>>
NoClassDefFoundError: org/springframework/boot/context/properties/ConfigurationBeanFactoryMetadata
查看>>
Node JS: < 一> 初识Node JS
查看>>
Node Sass does not yet support your current environment: Windows 64-bit with Unsupported runtime(72)
查看>>