专利内容由知识产权出版社提供
专利名称:一种数据爬取方法及装置专利类型:发明专利发明人:满悦
申请号:CN201811130421.0申请日:20180927公开号:CN110955813A公开日:20200403
摘要:本发明公开了一种数据爬取方法及装置,涉及爬虫技术领域,主要目的在于设计通用的爬虫拟人操作流程,简化用户的设置过程,提高数据爬取效率。本发明主要的技术方案为:根据用户指定爬取的页面元素类型爬取当前页面中的页面元素,每种页面元素类型对应用户预置的一种元素操作;根据所述页面元素的类型对所述页面元素执行对应的元素操作;爬取所述当前页面中根据所述元素操作更新得到的数据。本发明主要用于爬取页面数据。
申请人:北京国双科技有限公司
地址:100083 北京市海淀区北四环中路229号海泰大厦4层南401号
国籍:CN
代理机构:北京鼎佳达知识产权代理事务所(普通合伙)
更多信息请下载全文后查看