如何读取csv文件并将其转化为tsv文件

  • Post author:
  • Post category:其他


csv:逗号分隔符文件

tsv:制表分隔符文件

二者本质上都属于类文本文件,一般用excel和文本编辑器均可打开。

如果是在程序中读取,并进行相互转化,可以用pandas这个python库。

以下给出一个代码示例:



csv-tsv.py

import pandas as pd
from sklearn.utils import shuffle  # 用于数据的随机排列,也可不用


if __name__ == '__main__':
    # 此处是读取中文数据,如果是英文数据,编码可能是'ISO 8859-1'
    pd_all = pd.read_csv("./Test_Data.csv", sep=',', encoding='utf-8') 
    # 打乱数据    
    pd_all = shuffle(pd_all)
    # 保存为tsv文件,当然也可以保存为csv文件,二者区别在于sep为'\t'还是','
    pd_all.to_csv("./Test_Data.tsv", index=False, sep='\t', encoding='utf-8')

最后建议大家多了解一下pandas这个数据清洗的python库,很好用,能省不少事,我也是最近才用到的。



版权声明:本文为qq_42278138原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。