正则表达式:排除中文加冒号格式字符串

匹配 html 代码中两个

标签之间内容时,遇到中文加冒号的格式(如:“张无忌:”),传统正则表达式会把这些内容也匹配到,导致结果不符合预期。

为了排除中文加冒号格式字符串,我们可以使用负向前瞻断言,即:preg_match_all('/

(?!.*[x{4e00}-x{9fa5}:]).*/u', $input, $matches);
  • : 匹配 标签开始符
  • (?!.*[x{4e00}-x{9fa5}:]).*: 负向前瞻断言,确保其后没有中文加冒号的子串
  • : 匹配 标签结束符

    示例:

    立即学习“前端免费学习笔记(深入)”;

    $input = '我是张三分
    张无忌: 你真的是张三分?';
    
    preg_match_all('/(?!.*[x{4e00}-x{9fa5}:]).*/u', $input, $matches);
    
    print_r($matches[0]);
    登录后复制

    输出:

    Array
    (
        [0] => 我是张三分
    )
    登录后复制

    如你所见,符合条件的只有没有中文加冒号的字符串。

以上就是如何用正则表达式排除HTML代码中中文加冒号的字符串?的详细内容,更多请关注慧达安全导航其它相关文章!

点赞(0)

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部