将要扒取的网站页面的网址粘贴进去
点击左下方“开始抓取”按钮
等待抓取完毕,自动打开下载好的文件夹
例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:
http://qiye1.wscso.com
http://qiye1.wscso.com/gongsijieshao.html
http://qiye1.wscso.com/xinwenzixun.html
设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。
扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:
可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。
软件左下方有两个按钮: 开始抓取 、 更多设置
点击 更多设置 按钮,即可打开 Cookies 的设置。
Cookies 设置 ,如下图所示:
比如,当您抓取的目标网页需要登陆时,你可以用浏览器登陆目标网页,拿到其Cookies,将其填入此处即可。
比如,cookies有 a、b、c 三个参数,那么填入的格式为:
a=1;b=2;c=3
每个参数中间用 ; 分割。
© 版权声明
本站所发布的全部内容源于互联网搬运,请在下载后24小时内删除。如果有侵权之处请第一时间联系我们E-mail:86512@qq.com删除。敬请谅解!
THE END
暂无评论内容