fgetcsv读取中文的问题

  • Post author:
  • Post category:其他


在使用fgetcsv读取文件内容,但是中文部分总是无法显示,如果一段文字中夹杂着字母和中文,则字母前的中文无法读取,但字母后的中文却能够保留。

第一种解决办法:

上PHP官網翻了一下,原來加上setlocale即可解決。

原本用PHP4沒出現這問題,大概是PHP5才會這樣吧…

注释:setlocale() 函数仅针对当前脚本改变地区信息。

提示:可以通过 setlocale(LC_ALL,NULL) 把地区信息设置为系统默认。

// utf-8




setlocale



(LC_ALL, ‘en_US.UTF-8’);

// 简体






setlocale



(LC_ALL, ‘zh_CN’);

//设置回系统默认

        setlocale(LC_ALL,NULL);

以下是常用的地区标识

zh_CN GB2312

en_US.UTF-8 UTF-8

zh_TW BIG5

zh_HK BIG5-HKSCS

zh_TW.EUC-TW EUC-TW

zh_TW.UTF-8 UTF-8

zh_HK.UTF-8 UTF-8

zh_CN.GBK GBK

第二种解决办法:(替代函数, 执行效率低)

php自带的fgetcsv函数对中文支持总出问题,处理中文文档时,经常出现中文字符串丢字或乱码的情况。但找了个替代函数:

function fgetcsv_reg(& $handle, $length = null, $d = ‘,’, $e = ‘”‘) {


$d = preg_quote($d);

$e = preg_quote($e);

$_line = “”;

$eof=false;

while ($eof != true) {


$_line .= (empty ($length) ? fgets($handle) : fgets($handle, $length));

$itemcnt = preg_match_all(‘/’ . $e . ‘/’, $_line, $dummy);

if ($itemcnt % 2 == 0)

$eof = true;

}

$_csv_line = preg_replace(‘/(?: |[ ])?$/’, $d, trim($_line));

$_csv_pattern = ‘/(‘ . $e . ‘[^’ . $e . ‘]*(?:’ . $e . $e . ‘[^’ . $e . ‘]*)*’ . $e . ‘|[^’ . $d . ‘]*)’ . $d . ‘/’;

preg_match_all($_csv_pattern, $_csv_line, $_csv_matches);

$_csv_data = $_csv_matches[1];

for ($_csv_i = 0; $_csv_i < count($_csv_data); $_csv_i++) {


$_csv_data[$_csv_i] = preg_replace(‘/^’ . $e . ‘(.*)’ . $e . ‘$/s’, ‘$1’, $_csv_data[$_csv_i]);

$_csv_data[$_csv_i] = str_replace($e . $e, $e, $_csv_data[$_csv_i]);

}

return empty ($_line) ? false : $_csv_data;

}

转载于:https://www.cnblogs.com/ybbqg/archive/2012/03/16/2399659.html