R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法:
    
     
      1. 读UTF-8文件,例如UTF-8格式的csv:
     
    
   
    
     最好的处理办法就是:
    
   
a1=read.table('C:\\test11.csv',sep=',',fileEncoding = 'UTF-8',header = F)
    
     如果使用如下方法可能会出错(全是血泪教训啊):
    
   
a2=read.csv('C:\\test11.csv',fileEncoding = 'UTF-8',header = F)
a2=read.csv('C:\\test11.csv',encoding = 'UTF-8',header = F)
    
     
      2.  如何在R里把一个数据转化为UTF-8格式:
     
    
   
    
     
      
     
    
   
因为我在R里写了一段程序,需要把数据转化为JSON格式,通过上面的方法读进来的数据是没有问题,但是数据再R里并不是utf-8格式存储的,所以toJSON()时报了如下错误:
unable to escape string. String is not utf8
    后来发现R里有一个函数可以把数据转为utf8格式:
    
     
      enc2utf8()
     
    
   
> a='小源'
> Encoding(a)#查看a的编码格式
[1] "unknown"
> b=enc2utf8(a)
> Encoding(b)
[1] "UTF-8"
   
    
     3.  如何SOURCE一个UTF-8格式的R文件:
    
   
   
    source一个utf8编码保存的R脚本,在windows下(linux由于默认编码就是utf8,直接source就可以)
    
   
source('test.R',encoding = 'UTF-8')
 
版权声明:本文为snowdroptulip原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
