Content Grabber使用嵌入式版本的Internet Explorer作为其Web浏览器。已对Web浏览器进行了很大的修改,以适应Web抓取的目的,但是它的工作方式基本上与您在计算机上安装的Internet Explorer的标准版本相同。如果某个网站在Internet Explorer中无法正常运行,则在Content Grabber中也将无法正常运行。
Web浏览器选择模式
当您在普通的Web浏览器中单击链接和按钮时,通常会执行某种操作,例如加载新的网页。Content Grabber会拦截其Web浏览器中的所有操作,并且当您单击Web元素时,它将元素标记为已选中,而不是执行默认的Web浏览器操作。
当您单击已选择的Web元素时,Content Grabber将为您提供一个选项,以添加对所选Web元素执行操作的代理命令。
可用选项以及可用选项的顺序取决于您选择的Web元素类型。例如,如果您单击了选定的链接元素,则第一个选项将是浏览链接并打开一个新的网页。
Web浏览器导航模式
有时,以与普通Web浏览器相同的方式在Content Grabber Web浏览器中导航非常有用。例如,您可能加载了URL,但是随后想要导航到特定的网页并开始从该页面提取数据。
通过单击应用程序菜单中的“ 在Web浏览器中导航”按钮,可以将Web浏览器从选择模式切换到导航模式。
到达要开始提取数据的网页后,可以通过单击URL地址栏旁边的复选图标来将当前URL设置为起始URL。
重要提示: Content Grabber必须能够直接从起始URL加载起始网页。如果无法通过使用起始URL直接加载起始网页,则必须选择另一个起始网页,然后使用代理命令导航到要开始数据提取的网页。
禁用Web浏览器事件
当Web浏览器中发生某些事件时,例如,当移动移到Web元素上时,或者当输入字段失去焦点时,某些网站会显示或隐藏Web元素。有时可能很难选择这样的动态Web元素,因为在您四处移动鼠标时它们可能会显示和隐藏。
您可以单击应用程序菜单中的“ 禁用Web浏览器事件”按钮以阻止Web浏览器事件,以便例如在移动鼠标时不显示和隐藏动态Web元素。如果要在鼠标悬停在某个Web元素上时“冻结”网页,则可以使用CTRL + D快捷键禁用事件,因此不必将鼠标从Web元素移到单击禁用Web浏览器事件按钮。