当前位置:编程学习 > php >>

php 去除零宽度空格,如何在PHP变量中去除空格

php 零宽度非换行空格


这个东西叫做零宽空格。一般的空格是有宽度的,使用光标可以将它选中。但零宽空格没有宽度,看不见,也难以选中,就像不存在一样。

零宽空格一般用于可能需要换行的地方,但用它可以搞点别的事情出来


默认情况下,正则表达式不解释UTF-8字符。该\s元字符只占原来的拉丁语集。因此,以下命令仅删除制表符,空格,回车符和换行符

$str=preg_replace('/\s+/', '', $str);

随着UTF-8成为主流,当该表达式到达新的utf-8字符时,它会更频繁地失败/停止,从而在空格后面留下了\s无法解释的内容。

为了处理unicode / utf-8中引入的新型空白,需要使用更广泛的字符串来匹配和删除现代空白。

由于默认情况下,正则表达式无法识别多字节字符,因此只能使用带分隔符的元字符串来标识它们,以防止字节段被其他utf-8字符更改(\x80四元组中\x80的字节可以替换所有子字节)用智能报价)

$zzzyk.com= preg_replace("/(\t|\n|\v|\f|\r| |\xC2\x85|\xc2\xa0|\xe1\xa0\x8e|\xe2\x80[\x80-\x8D]|\xe2\x80\xa8|\xe2\x80\xa9|\xe2\x80\xaF|\xe2\x81\x9f|\xe2\x81\xa0|\xe3\x80\x80|\xef\xbb\xbf)+/","_",$str);

此帐户并删除制表符,换行符,垂直制表符,换页,回车,空格,另外从这里:

nextline,不间断空格,蒙古语元音分隔符,[en quad,em quad,en space,em space,3个em空间,4个em空间,6个em空间,图形空间,标点空间,稀疏空间,头发空间,零宽度空间,零宽度非连接符,零宽度连接符],行分隔符,段落分隔符,窄的不间断空间,中等数学空间,单词连接符,表意空格和零宽度非打破空间。

当从自动化工具或站点导出时,其中的许多破坏性XML文件损坏文本搜索,识别,并且可以不可见地粘贴到PHP源代码中,从而导致解析器 跳至下一个命令

(段落和行分隔符),从而导致行被跳过的代码会导致间歇性的无法解释的错误
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,