爬取详细情况。 第一,目前Element找到每部分内容所在的标签,标签相同的,通过get_attribute查找属性确定地方。 第二,与json办法一样,将每一个小标签赋予空值,预防找不到该小标签影响整个页面的爬取。
接着,通过find_elements_by_css_selector使用方法,将定位好的内容爬拿下来,并赋值给对应的变量。 最后,将所有变量整理,放进列表ulist1中,便捷后续写入Excel。为便捷后续数据的处置、剖析和研究,将爬拿下来的内容保存到Excel中,对于爬取数据量大的,亦可以保存到MongoDB中。