sklearn.datasets.fetch_20newsgroups下载报错的问题

  • Post author:
  • Post category:其他



先说此过程遇到的错误都有哪些?


第一个错误:

forbidden 403

第二个错误:

明明路径是正确的,但是报这个错

No such file or directory

第三个错误:

EOFError: Compressed file ended before the end-of-stream marker was reached

这个是因为第一次直接从外网下载时那个压缩包内容不完全导致的。


如何解决



第一步

,手动下载正确的安装包,很多文章给的链接已经失效,最终重新找到一个可以用的链接

https://ndownloader.figshare.com/files/5975967


第二步

,在我的电脑 C:\Users(你的user_name)\scikit_learn_data\20news_home 目录下,将下载好的压缩包拖进去(如果之前没有的需要自己手动创建)


第三步

,通过D:你的项目下\venv\Lib\site-packages\sklearn\datasets找到其中的

twenty_newsgroups.py

,打开进行如下的修改

在这里插入图片描述

将红框的地方内容注释掉,并且添加

    archive_path = "C:/Users/Judy/scikit_learn_data/20news_home/20newsbydate.tar.gz"
    logger.debug("Decompressing %s", archive_path)
    tarfile.open(archive_path, "r:gz").extractall(path=target_dir)
    os.remove(archive_path)

注意:archive_path是刚才放那个压缩包的路径

至此,便可以再次运行程序,可以成功运行

压缩文件变成了
在这里插入图片描述

查看输出内容

在这里插入图片描述



版权声明:本文为weixin_48862936原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。