字符串处理机制修改

一、含有十六进制字符的字符串不再视为数字

含有十六进制字符的字符串不再视为数字,也不再区别对待。比如下面的代码:

  1. var_dump("0x123" == "291"); // bool(false) (previously true)
  2. var_dump(is_numeric("0x123")); // bool(false) (previously true)
  3. var_dump("0xe" + "0x1"); // int(0) (previously 16)
  4. var_dump(substr("foo", "0x1")); // string(3) "foo" (previously "oo")
  5. // Notice: A non well formed numeric value encountered

可以使用filter_var函数来检查一个字符串是否包含十六进制字符或者是否可以转成一个整型

  1. $str = "0xffff";
  2. $int = filter_var($str, FILTER_VALIDATE_INT, FILTER_FLAG_ALLOW_HEX);
  3. if (false === $int) {
  4. throw new Exception("Invalid integer!");
  5. }
  6. var_dump($int); // int(65535)

二、\u{后面如果包含非法字符会报错

双引号和heredocs语法里面增加了unicode 码点转义语法,“\u{”后面必须是utf-8字符。如果是非utf-8字符,会报错:

  1. $str = "\u{xyz}"; // Fatal error: Invalid UTF-8 codepoint escape sequence

可以通过对第一个\进行转义来避免这种错误。

  1. $str = "\\u{xyz}"; // Works fine

“\u”后面如果没有{,则没有影响:

  1. $str = "\u202e"; // Works fine

PHP IntlChar()

PHP 7 通过 intl 扩展来支持国际化 (i18n) 和本地化 (l10n) 。此扩展仅仅是对 ICU 库的基础包装,并提供了和 ICU 库类似的方法和特性。

PHP 7 通过新的 IntlChar 类暴露出 ICU 中的 Unicode 字符特性。这个类自身定义了许多静态方法用于操作多字符集的 unicode 字符。

实例

  1. <?php
  2. printf('%x', IntlChar::CODEPOINT_MAX);
  3. echo IntlChar::charName('@');
  4. var_dump(IntlChar::ispunct('!'));
  5. ?>

以上程序执行输出结果为:

  1. 10ffff
  2. COMMERCIAL AT
  3. bool(true)