为了账号安全,请及时绑定邮箱和手机立即绑定

Java regex是否支持Unicode?

Java regex是否支持Unicode?

紫衣仙女 2019-11-13 13:04:32
为了使A与Z匹配,我们将使用正则表达式:[A-Za-z]如何允许正则表达式匹配用户输入的utf8字符?例如环保部等中文单词
查看完整描述

3 回答

?
GCT1015

TA贡献1827条经验 获得超4个赞

Java正则表达式API适用于该char类型

该char类型隐式为UTF-16

如果您有UTF-8数据,则需要在输入时将其转码为UTF-16

Unicode是通用的字符集,而UTF-8可以描述所有字符(包括控制字符,标点符号,符号,字母等)。您将必须更加明确地确定要包含的内容和要排除的内容。Java正则表达式使用\p{category}语法按类别匹配代码点。请参阅Unicode标准的列表类别。


如果要在表意文字序列中识别和分隔单词,则需要查看更复杂的API。我将从BreakIterator类型开始。


查看完整回答
反对 回复 2019-11-13
  • 3 回答
  • 0 关注
  • 807 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信