2734-python+selenium爬蟲按關鍵詞搜索實現自動化抓取淘寶商品寫入mongodb數據庫
使用selenium、webdriver爬取淘寶的圖片、商品、價格等信息。在命令行界面輸入爬取的參數,把參數信息記錄到txt文件中,運行爬蟲程序后,先使用手機掃碼登陸,然后pc端網頁會自動翻淘寶的網頁,知道翻到淘寶的最后一頁,就會停止對商品的爬取
web端功能:
1.下拉框選擇商品搜索
2.點擊圖片放大
3.點擊詳情,查看商品詳情
4.用餅圖查看交易量占比
運行:
1.新建命令行記錄文件。命令行記錄文件是記錄爬蟲時,你輸入的商品名字和數據庫名字(具體位置是E:\a\cmd.txt) 2.pip安裝selenium,然后查看你的chrome版本,根據你的版本安裝webdriver.exe。具體教程: 3.啟動爬蟲(商品名字是要在淘寶搜索的商品,數據庫名字是爬取的商品要存在哪個數據庫里面,數據庫名字最好是拼音或者英文) python crawl_taobao.py -k 商品名字 -d 數據庫名字 4.啟動web: python runserver.py
運行環境
python+pycharm
項目技術
python+selenium+mongodb+layui
數據庫文件
mongodb
依賴包文件
>pip install pyquery
>pip install pymongo




本源碼地址:http://m.bmm520.net/vip/python/2020/0626/21300.html