中文匹配汉字多次失败：报错_问答-阿里云开发者社区

[^\u4e00-\u9fa5]

这是一段匹配除了中文以外的字符串

http://regexpal.com/ 测试

http://unicodelookup.com (资料)

######

function str_cut($string, $length, $dot = '...')
{
    $strlen = strlen($string);
    if($strlen <= $length) return $string;
    $string = str_replace(array(' ', '&', '"', ''', '“', '”', '—', '<', '>', '·', '…'), array(' ', '&', '"', "'", '“', '”', '—', '<', '>', '·', '…'), $string);
    $strcut = '';
    if(strtolower(CHARSET) == 'utf-8')
    {
        $n = $tn = $noc = 0;
        while($n < $strlen)
        {
            $t = ord($string[$n]);
            if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {
                $tn = 1; $n++; $noc++;
            } elseif(194 <= $t && $t <= 223) {
                $tn = 2; $n += 2; $noc += 2;
            } elseif(224 <= $t && $t < 239) {
                $tn = 3; $n += 3; $noc += 2;
            } elseif(240 <= $t && $t <= 247) {
                $tn = 4; $n += 4; $noc += 2;
            } elseif(248 <= $t && $t <= 251) {
                $tn = 5; $n += 5; $noc += 2;
            } elseif($t == 252 || $t == 253) {
                $tn = 6; $n += 6; $noc += 2;
            } else {
                $n++;
            }
            if($noc >= $length) break;
        }
        if($noc > $length) $n -= $tn;
        $strcut = substr($string, 0, $n);
    }
    else
    {
        $dotlen = strlen($dot);
        $maxi = $length - $dotlen - 1;
        for($i = 0; $i < $maxi; $i++)
        {
            $strcut .= ord($string[$i]) > 127 ? $string[$i].$string[++$i] : $string[$i];
        }
    }
    $strcut = str_replace(array('&', '"', "'", '<', '>'), array('&', '"', ''', '<', '>'), $strcut);
    return $strcut.$dot;

}

这个函数是phpcms 2008 中的截取字符串的函数，写的有点多，所以我希望要找个正则匹配的，简单好维护，呵呵

######

$str ='中国';
$result = preg_match("/[\x{4e00}-\x{9fa5}]/u",$str); 
print_r($result);

php里面是这样的######

这个我已经解决了，还是感谢下，哈～

我后来查了下，相关版本比如： [\u4e00-\u9fa5] [\x{4e00}-\x{9fa5}]/u ，关于正则匹配的问题涉及到编码问题，还是需要细细考虑下。

over。

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

中文匹配汉字多次失败：报错