python子域名收集器

news/2024/7/24 11:29:05 标签: python

 

今天心血来潮做了一个子域名收集器。过程是蛋疼啊!这里先感谢一下qpython群的咸鱼大佬,在换页的时候出了点毛病,讲到后面我们就知道了。

思路:

 

 

代码开始:

我们要用到的模块是

Requests

Bs4模块里的BeautifulSoup

 

Time模块

如果BeautifulSoup没有

安装方法:

LINUXsudo pip install bs4

WINDOWS:pip install bs4

 

Import requests

From bs4 import BeautifulSoup

Import time

For i in range(48):

  I=i*10#48*10=50我们爬50

Heads={'User-Agent': 'Mozilla/5.0(Windows NT 6.1; Win64; x64; rv:56.0) Gecko/20100101 Firefox/56.0'

}#将自己伪装成浏览器

Url=”https://cn.bing.com/search?q=site%3adgjy.net&qs=n&sp=-1&pq=site%3adgjy.net&sc=2-11&sk=&cvid=C1A7FC61462345B1A71F431E60467C43&toHttps=1&redig=3FEC4F2BE86247E8AE3BB965A62CD454&pn=2&first={}&FORM=PERE”.format(i)#占位符会报错

#解析:q=你要搜索的东西 first=页数

First=1为第一页

First=10为第二页

以此类推

Html=request.urlopen(url,headers=heads)

soup=BeautifulSoup(html.content,'html.parser')

Job=soup.findAll(‘h2’)#列出h2标签

For i in job:

  Time.sleep(3)#延迟3,防止被必应发现

  Print(i.a.get(‘href’))

运行结果:

 

总结:

 

 

 

 脚本代码:

python">import requests
from bs4 import BeautifulSoup
import time
for i in range(48):
    i=i*10
    heads={
      'User-Agent': 'Mozilla/5.0(Windows NT 6.1; Win64; x64; rv:56.0) Gecko/20100101 Firefox/56.0'
  }
    url='https://cn.bing.com/search?q=site%3Adgjy.net&qs=n&form=QBRE&sp=-1&pq=site%3Adgjy.net&sc=2-11&sk=&cvid=C1A7FC61462345B1A71F431E60467C43&toHttps=1&redig=3FEC4F2BE86247E8AE3BB965A62CD454&pn=2&first={}&FROM=PERE'.format(i)
    html=requests.get(url,headers=heads)
    soup=BeautifulSoup(html.content,'html.parser')
    job_bt=soup.findAll('h2')
    for i in job_bt:
      time.sleep(3)
      print(i.a.get('href'))

  

转载于:https://www.cnblogs.com/haq5201314/p/8158162.html


http://www.niftyadmin.cn/n/799313.html

相关文章

小散量化炒股记|手把手教你转换通达信公式,盘整后均线粘合突破

前言通达信的公式编写功能非常流行,很多高手都是在通达信上编写公式来分析股票的。作为过来人,建议大家在初期的策略研究阶段,选一个通用的平台进行策略研究,因为有现成的功能模块可以调用,这样就能把精力聚焦在设计策…

冲刺第二周第二天

任务板 站立会议 燃尽图 转载于:https://www.cnblogs.com/wangyisong/p/8161656.html

选出底部均线粘合,长阳突破的牛股!股票量化分析工具QTYX-V2.5.0

前言大牛股在上涨初期往往会有一些特征信号,根据这些特点过滤出可能成为牛股的标的,然后重点跟踪它们,这无疑是非常有效的选股方式。我们来看下欢瑞世纪这只票上涨初期的特征。股价在区间内上下波动,20日、30日、60日、120日均线逐…

C++ shut down a computer

前阵子有朋友问我&#xff0c;怎么用C语言写一个小程序&#xff0c;控制电脑关机。这个我真的不懂&#xff0c;这几天闲着&#xff0c;就上网搜了搜&#xff0c;整理一下。 IDE: Code::Blocks 16.01 操作系统&#xff1a;Windows 7 x64 1 #include <windows.h>2 3 int ma…

QTYX量化系统实战案例分享|双底形态叠加业绩报表选股之202209

前言 我突然觉得非常有必要和大家分享一些QTYX在实战中的应用案例&#xff08;包括失败的案例&#xff09;&#xff0c;这样能够帮助大家更好地去理解QTYX中的功能设计&#xff0c;也能更好地帮助大家搭建出属于自己的量化交易系统。 首先要声明几点&#xff1a; QTYX量化系统推…

mysql 备份恢复

备份/恢复数据库: D:\wamp\bin\mysql\mysql5.6.12\bin\mysqldump -hlocalhost -uroot -proot db > d:/db.sql D:\wamp\bin\mysql\mysql5.6.12\bin\mysql -hlocalhost -uroot -proot db --default-character-setutf8 < d:/db.sql备份/恢复单表: D:\wamp\bin\mysql\mysql5.…

spark安装_「大数据」(七十三)Spark之开发环境配置

【导读&#xff1a;数据是二十一世纪的石油&#xff0c;蕴含巨大价值&#xff0c;这是情报通大数据技术系列第[73]篇文章&#xff0c;欢迎阅读和收藏】1 基本概念无论 Windows 或 Linux 操作系统&#xff0c;构建 Spark 开发环境的思路一致&#xff0c;基于 Eclipse 或 Idea &a…

慕课笔记-Java入门第三季

1.自定义异常 自定义异常必须继承Exception类或者其子类。 2.字符串 String对象创建后则不能被修改&#xff0c;是不可变的&#xff0c;所谓的修改其实是创建了新的对象。 多次创建的字符常量&#xff0c;Java编译程序只创建一个。 使用比较两个字符串&#xff0c;是比较其内存…