绿色风's Blog
专注AutoIT(Au3)
  • 首页
  • 流●年
  • 笔●记
    • 学习随记
    • 源码示例
  • 脚●本
    • UDF(收集)
    • 工作室UDF
    • 工具●教程
    • 教程之GDI
  • 作●品
  • 下●载
  • 情怀ExcelTip
3月302016

au3 正则参考 -46-匹配 Unicode

作者:绿色风   发布:2016-3-30 11:25 Wednesday   分类:工具●教程   阅读:3812次   评论:0条  

<!DOCTYPE html> RegExp

Unicode 类别属性(UCP)支持

AutoIt 使用 PCRE 引擎(Perl 兼容的正则表达式), 是最全面的开源引擎. 这个引擎包括 Unicode 类别属性(UCP)支持, 它允许大多数人类语言的细致处理. 然而, 为了维持与以前版本的兼容性, 并保持在其最佳的匹配速度, 默认不启用 UCP 支持. 您可以通过在表达式前添加选项 (UCP) 启用它. 启用时, UCP 设置将更改正则表达式元素的匹配扩展.

默认正则表达式模式与输入文本匹配时, 正则表达式引擎会采用规范行为. 但是可以指示正则表达式引擎通过指定 (UCP) 选项使用 UCP 匹配行为.

注意: (UCP) 与\p{} 同属 Unicode 类别属性支持, 但使用方法是不一样的!

 

下面示例规范行为和 UCP 匹配行为对同一输入字符串的不同品牌结果, 定义规范匹配和 UCP 匹配的 2 个表达式, 该表达式与后跟空白字符的单词匹配. 输入由两个字符串组成的输入, 其中一个字符串使用拉丁字符集, 另一个则使用西里尔字符集:

字符串: целый мир , the whole world

规范匹配表达式: \b(\w+\s)+

匹配结果(标志 4): 仅匹配由拉丁字符组成的语句.
[0]=> [0]the whole world

 

UCP 匹配表达式: (UCP)\b(\w+\s)+

匹配结果(标志 4)
[0]=> [0]целый мир
[1]=> [0]the whole world
同时匹配西里尔字符和拉丁字符组成的语句.

 






本文固定链接: http://www.jianyiit.com/post-207.html

blogger
该日志由 绿色风 于2016-3-30 11:25 Wednesday发表在 工具●教程 分类下。
版权所有:《绿色风's Blog》 → 《au3 正则参考 -46-匹配 Unicode》;
除特别标注,本博客很多文章均为原创. 互联分享,尊重版权,转载请以链接形式标明本文地址;
本文标签:

扫描二维码,在手机上阅读
上一篇::au3 正则参考 -50-分组子表达式
下一篇:au3 正则参考 -45-表达式注释

热门文章

相关文章

  • au3 正则参考 -43-多行模式
  • au3 正则参考 -32-加号限定符
  • au3 正则参考 -08-Unicode 类-块
  • au3 正则参考 -35-量词限定符
  • au3 正则参考 -57-反向引用
取消回复

发表评论

亲,头像对么?

54 + 68 =

提交中,请稍候……


木有头像就木JJ啦!还木有头像吗?点这里申请属于你的个性Gravatar头像吧!


    站点统计
    • 运行时间: 20254 天
    • 日志总数: 365 篇
    • 评论数量: 7237 条
    • 微语数量: 6 条
    • 附件总量: 388 件
  • 逝出的青春

  • 打赏"绿色风"



      扫码关注本站公众号 可搜本站内容

  • Autoit V3 脚本交流群

      常驻群1:905774875
      常驻群2:40672266


  • 链接

    • AU3中文论坛
    • Excel资料库
    • 完美者博客
    • 顺网小哥'S Blog
    • 猛牛哥的博客
    • 网吧系统下载
  • 分类

    • 流●年(66)
    • 笔●记(0)
    • 脚●本(0)
    • 作品(21)
    • 学习随记(51)
    • 源码示例(68)
    • UDF(收集)(26)
    • 工作室UDF(30)
    • 工具●教程(62)
    • 教程之GDI(24)
Copyright © 2013 绿色风's Blog. Powered by emlog. Theme by 射雕天龙. 鄂ICP备2021011689号-1 鄂公网安备42102302000078号 sitemap