在处理字符串时,特别是处理 HTML 字符串时,常常需要用到正则表达式来处理中文字符。 以下介绍两个非常实用的表达式
> 由网络爬虫展开
1. 仅仅匹配中文字符:([\u4e00-\u9fa5]+)
1 |
|
2. 匹配中文字符以及标点:([^\x00-\xff]+)
此表达式又称为双字节字符匹配
1 | String str = "<img alt=\"甲状腺。\" src= 'd://a.img' > <p>这是第一句话!</p>"; |
在处理字符串时,特别是处理 HTML 字符串时,常常需要用到正则表达式来处理中文字符。 以下介绍两个非常实用的表达式
1 |
|
此表达式又称为双字节字符匹配
1 | String str = "<img alt=\"甲状腺。\" src= 'd://a.img' > <p>这是第一句话!</p>"; |