今天利用pandas导入csv大文件,在网上查了一下,需要用到
import dask.dataframe as dd
用的时候发现自己的pandas版本太低,需要1.0.0以上的版本,于是重新安装pandas。
start = time.time()
df = dd.read_csv("Data.csv")
end = time.time()
print(end - start)
Data = df.values
但是安装pandas失败,发现问题是socket.timeout: The read operation timed out,安装超时,于是断网重连。
还是安装失败,于是继续查,发现还是网速问题。
继续重装,问题解决。
版权声明:本文为qq_40244048原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。