博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python采集第一步
阅读量:5818 次
发布时间:2019-06-18

本文共 633 字,大约阅读时间需要 2 分钟。

hot3.png

上次说要做一个http://www.m4493.com/的美女站点,需要使用python进行数据采集

接下来我们就开始采集数据了,使用pythn采集第一步

安装python

这个简单,直接到python官方网站下载python,我这里下载的是2,7.3版本

(找时间把安装过程放出来)

然后安装pip

python ../window/get-pip.py  这里需要去下载pip.py

最后安装一列模块,如下

pip install grab --timeout 600
pip install requests --timeout 600
pip install lxml --timeout 600
pip install selenium --timeout 600
pip install bs4 --timeout 600
pip install pycurl --timeout 600
pip install redis --timeout 600
pip install pycurl --timeout 600
pip install html5lib --timeout 600
 

对了,记得安装下python的开发工具,我这里使用的是JetBrains PyCharm 2017.1.4 ,这个是需要收费工具,如果没钱破解吧:)

与君共勉:——)

转载于:https://my.oschina.net/u/3717671/blog/1570512

你可能感兴趣的文章
Breaking parallel loops in .NET C# using the Stop method z
查看>>
Android Content Provider Guides
查看>>
修改故障转移群集心跳时间
查看>>
[轉]redis;mongodb;memcache三者的性能比較
查看>>
微软职位内部推荐-Sr DEV
查看>>
用计算器计算“异或CRC”
查看>>
LINK:fatal error LNK1123: 转换到 COFF 期间失败: 文件无效或损坏 (转)
查看>>
让你的WPF程序在Win7下呈现Win8风格主题
查看>>
深刻理解C#的传值调用和传引用调用
查看>>
Windows环境配置Apache+Mysql+PHP
查看>>
JDBC二查询(web基础学习笔记八)
查看>>
监听器(web基础学习笔记二十二)
查看>>
802.11 学习笔记
查看>>
Leetcode-Database-176-Second Highest Salary-Easy(转)
查看>>
Ubuntu12.04LTS安装好后是空白桌面的解决步骤(更新显卡驱动)
查看>>
poj-3696 The Luckiest number
查看>>
[Dynamic Language] Python定时任务框架
查看>>
Furure的简单介绍和使用
查看>>
CSS3 网格布局(grid layout)基础知识 - 隐式网格自己主动布局(grid-auto-rows/grid-auto-columns/grid-auto-flow)...
查看>>
构建Docker Compose服务堆栈
查看>>