首先指出,在[]里面不需要转义字符\,所以后面半截是[/],不是[\/]
获取html标签以外的东西很简单,变通一下,你想啊,在<>里面的是HTML标签,那么在<>外面的不就是其他文字了吗?
继续变通,非标签文字都是在<>和>之间的嘛,那样,不是HTML标签的文字部分不就是在>和<里面的东西嘛……
所以匹配规则
>([^<>])*<
这样获取的就是HTML标签外的东西!
很简单,遍历html中所有控件,然后将此正则表达式确定的控件排除。
正则表达式不就是判断个是否符合么?
譬如:
private
bool
IsNumeric(string
str)
{
System.Text.RegularExpressions.Regex
reg1
=
new
System.Text.RegularExpressions.Regex(@"^[-]?\d+[.]?\d*$");
return
reg1.IsMatch(str);
}
这是符合的返回true;取个非就OK了啊。
private
bool
IsNumeric(string
str)
{
System.Text.RegularExpressions.Regex
reg1
=
new
System.Text.RegularExpressions.Regex(@"^[-]?\d+[.]?\d*$");
return
!reg1.IsMatch(str);
}
用正则对象的replace,如:
RegExp对象名.replace(string,"")
匹配就用那个式子。