常用正则表达式总结

Jakarta-ORO正则表达式库API下载地址:http://archive.apache.org/dist/jakarta/oro/

1. 只允许输入汉字和逗字,并且开头和结尾不能是逗号,
   (^[\u4e00-\u9fa5][\u4e00-\u9fa5 ,]*[\u4e00-\u9fa5]$)|^[\u4e00-\u9fa5]$
2. 查找所有的药名+用量+单位
   ((?<![^服|^,])[\u4E00-\u9FA5()]+(?<![至后]))(\d*\.*\d+)(g|枚|包)
3. 获取文件扩展名    ^(.*)(\.)(.{1,8})$
4. 根据关键词来匹配的正则表达式
   ([\s\S]*)医案来源:([\s\S]*)医案作者:([\s\S]*)医案录入:([\s\S]*)症状分类:([\s\S]*)症状名称:([\s\S]*)病患信息:([\s\S]*)医案症状:([\s\S]*)医案辨证:([\s\S]*)医案治法:([\s\S]*)医案处方:([\s\S]*)医案复诊:([\s\S]*)
  .  除\n之外的任意字符
   \s 空字符
   \S 非空字符
   \s\S代表所有字符
5. 校验必须按药物#剂量;药物#剂量格式输入
  比如生姜#0.8;桂枝#1.5;麻黄#2.0
正则表达式为:^(([\u4e00-\u9fa5]+#\d+(.\d+)?);)*([\u4e00-\u9fa5]+#\d+(.\d+)?)$
6. 利用正则表达式获取HTML内容中的图片标签
   1. <img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>
   2. <input[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>
7. 使用正则表达式匹配URL中的域名
   http://.*?/
   " http://.*?/"会匹配" http://msnbc-test:1180/id/3053415"中的" http://msnbc-test:1180/"
8. 匹配古代中药所有计量单位的正则表达式
(([0-9]|半|一|二|三|四|五|六|七|八|九|十)+(两|斤|钱|个|厘|分|斗|升|粒|只|枚|g|合|颗|克)(至|到)([0-9]|半|一|二|三|四|五|六|七|八|九|十)+(两|斤|钱|个|厘|分|斗|升|粒|只|枚|g|合|颗|克))|(([0-9]|半|一|二|三|四|五|六|七|八|九|十)*[-~.]*([0-9]|半|一|二|三|四|五|六|七|八|九|十|多)+(小|大)*(酒(杯|盏)|钱匕|两|斤|钱|匙|个|厘|分|斗|茎|撮|升|寸|粒|只|枚|g|条|团|把|尾|石|挺|梃|片|具|握|合|字|尺|盏|铢|杯|块|根|支|束|匕|株|张|颗|对|朵|帖|石|丸|碗|副|瓢|克|匣|滴|钟|铤)(半|一|二|三|四|五|六|七|八|九|十)*(两|斤|钱|个|厘|分|斗)*) 
中医系统采用下列正则表达式
(([0-9]|半|一|二|三|四|五|六|七|八|九|十)+(两|斤|钱|厘|分)(至|到)([0-9]|半|一|二|三|四|五|六|七|八|九|十)+(两|斤|钱|厘|分))|(([0-9]|半|一|二|三|四|五|六|七|八|九|十)*[-~.、]*([0-9]|半|一|二|三|四|五|六|七|八|九|十)+(两|斤|钱|厘|分)(半|一|二|三|四|五|六|七|八|九|十)*(两|斤|钱|厘|分)*)
药物剂量的表现形式概括起来大概有以下几种:
①“数量+单位”,如“1两”;
②“数量+连词符+数量+单位”,如“2-3钱”;
③“数量+波纹线+数量+单位”,如“2~3钱”;
④“数量+至(或到)+数量+单位”如“4至5钱”、“四到五钱”;
⑤“数量+单位+数量+单位”,如“1钱5分”;
⑥“数量+单位+半(或五)”,如“1两半”、“一两五”;
⑦“数量+单位+至(或到)+数量+单位”,如“5钱至2两”;
⑧“单位+数量”,如“两半”。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值