先说此过程遇到的错误都有哪些?
第一个错误:
forbidden 403
第二个错误:
明明路径是正确的,但是报这个错
No such file or directory
第三个错误:
EOFError: Compressed file ended before the end-of-stream marker was reached
这个是因为第一次直接从外网下载时那个压缩包内容不完全导致的。
如何解决
第一步
,手动下载正确的安装包,很多文章给的链接已经失效,最终重新找到一个可以用的链接
https://ndownloader.figshare.com/files/5975967
第二步
,在我的电脑 C:\Users(你的user_name)\scikit_learn_data\20news_home 目录下,将下载好的压缩包拖进去(如果之前没有的需要自己手动创建)
第三步
,通过D:你的项目下\venv\Lib\site-packages\sklearn\datasets找到其中的
twenty_newsgroups.py
,打开进行如下的修改
将红框的地方内容注释掉,并且添加
archive_path = "C:/Users/Judy/scikit_learn_data/20news_home/20newsbydate.tar.gz"
logger.debug("Decompressing %s", archive_path)
tarfile.open(archive_path, "r:gz").extractall(path=target_dir)
os.remove(archive_path)
注意:archive_path是刚才放那个压缩包的路径
至此,便可以再次运行程序,可以成功运行
压缩文件变成了
查看输出内容
版权声明:本文为weixin_48862936原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。