最新公告
  • 欢迎您光临知事网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • python爬虫怎么伪装?爬虫伪装方法

    大家都只知道爬取内容,但是内容也不是没有防御的,随随便便让我们去爬取的,往往有1必有2,因此绝大多数内容,他们都有反侦察,避免信息被一些人给获取了,因此,如果非要去爬取这些信息,在python语言里是怎么做的呢?对于基础的,一些信息,我们给大家提供以下工具,供大家使用。

    fake_useragent是一个模拟真实浏览器ua的工具,可以随机产生ua。以下简单介绍其常见用法。

    fake_useragent的安装

    cmd窗口中输入:

    pip install fake-useragent

    常见用法举例

    1、使用前先引入UserAgent:

    from fake_useragent import UserAgent
    ua = UserAgent()

    2、想随机产生一个ua,则

    ua.random

    运行结果:

    'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.17 Safari/537.36'

    3、利用for循环运行5次,产生5个ua:

    for i in range(5):
     print(ua.random)
    运行后,产生5个随机的ua:
    Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.93 Safari/537.36
    Mozilla/5.0 (Windows NT 6.2; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1667.0 Safari/537.36
    Opera/9.80 (Windows NT 6.1; U; cs) Presto/2.7.62 Version/11.01
    Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.93 Safari/537.36
    Mozilla/5.0 (Windows NT 6.2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1467.0 Safari/537.36

    4、可以产生特定浏览器的ua:

    IE浏览器:

    ua.ie

    运行结果:

    'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Zune 4.0; InfoPath.3; MS-RTC LM 8; .NET4.0C; .NET4.0E)'

    以上都是干货内容,实际操作起来都是非常好用的,大家如果在遇到这种问题情况,可以来看下这个内容,就可以继续操作编程代码了哈~

    猜你在找

    找互联网优质资源,上知事网!
    知事网 » python爬虫怎么伪装?爬虫伪装方法

    常见问题FAQ

    网盘提取密码在哪里?
    在网站右侧有个“文件密码”,点击复制即可!
    网站的积分如何获得?
    注册登录后,每天签到可获得2个积分,每天可签到一次!

    发表评论

    • 1248会员总数(位)
    • 665资源总数(个)
    • 3本周发布(个)
    • 1 今日发布(个)
    • 3458稳定运行(天)

    提供最优质的资源集合

    Mac软件 Dedecms源码
    升级SVIP尊享更多特权立即升级