Content Grabber · 2019年11月30号 0

Content Grabber:正则表达式

使用正则表达式,您可以编写表达式来查找字符串中的特定字符序列,然后从较大的字符串中提取出较小的文本字符串。

Content Grabber使用XPath 在网页上选择Web元素,然后从这些Web元素提取内容。您可能只希望提取内容的某些部分,或者可能要对其进行转换。例如,单个Web元素可能包含公司的整个地址,但是您可能希望将内容提取到单独的元素中,例如街道地址,城市,邮政编码和州。您可以使用正则表达式将地址文本拆分为单独的文本字符串。

有许多教程网站教授正则表达式。这是一个例子:

http://www.regular-expressions.info/reference.html