使用正则表达式,您可以编写表达式来查找字符串中的特定字符序列,然后从较大的字符串中提取出较小的文本字符串。
Content Grabber使用XPath 在网页上选择Web元素,然后从这些Web元素提取内容。您可能只希望提取内容的某些部分,或者可能要对其进行转换。例如,单个Web元素可能包含公司的整个地址,但是您可能希望将内容提取到单独的元素中,例如街道地址,城市,邮政编码和州。您可以使用正则表达式将地址文本拆分为单独的文本字符串。
有许多教程网站教授正则表达式。这是一个例子:
http://www.regular-expressions.info/reference.html