python 域名分析工具实现代码

所属分类：脚本专栏 / python 阅读数： 1689

收藏 0赞 0分享

代码如下：

import sys, urllib 
import datetime,time 
def getDate(): 
strday=datetime.datetime.now().__str__() 
strday=strday.split()[0] 
return strday 
#url = "http://www.kingnic.com/list/2009-06-16.txt" 
def getUrl(dateStr=None): 
baseUrl ="http://www.kingnic.com/list/" 
if dateStr: 
return baseUrl+dateStr+".txt" 
thisDate = getDate(); 
if not thisDate: 
print "Error Date!" 
return None; 
url = baseUrl+thisDate+".txt" 
return url 
def getSource(url): 
source = urllib.urlopen(url).read() 
return source 

def save(source,filename="domains.txt"): 
fp = open(filename,"w") 
fp.write(source) 
fp.close() 
return True; 
def loadList(fileName="domains.txt"): 
fp = open("domains.txt","r") 
source = fp.readlines() 
fp.close() 
return source; 
def getPrefix(domain): 
return domain.split('.')[0] 
def getPostfix(domain): 
return domain.split('.')[1] 
def hasMidLine(domain): 
if '-' in domain: 
return True 
else: 
return False 
def parser(domains): 
max =4 
min =0 
keyword =('sky','see','job') 
result=[] 

len_num =0; 
mid_line_num =0; 

for domain in domains: 
prefix = getPrefix(domain) 
postfix = getPostfix(domain) 
domainlen = len(prefix) 
if (domainlen < min) or (domainlen > max): 
len_num +=1 
continue 
if hasMidLine(prefix): 
mid_line_num +=1 
continue 
result.append(domain) 

print " log : \n" 
print "all: \t",len(domains) 
print "len not in [%s,%s] \t: %s"%(max,min,len_num) 
print "contain '-' :\t",mid_line_num 
print "remain:\t",len(result) 
return result; 

if __name__ == "__main__": 
url = getUrl() 
source = getSource(url) 
save(source) 
domains =loadList() 
result = parser(domains) 
save("".join(result),"result.txt") 
print("\n\n\nfinished!!")

输出文件：
domains.txt ： kingnic.com 据当天释放的域名；
result.txt ：符合过滤条件的域名；
log输出：

复制代码代码如下:

 
all: 55500 
len not in [4,0] : 55019 
contain '-' : 32 
remain: 449 
finished!! 

对后缀、长度和有无“-”过滤，过滤条件有点少，其它以后如有需要再加。

更多精彩内容其他人还在看

Python调用C/C++的方法解析

这篇文章主要介绍了Python调用C/C++的方法解析，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

收藏 0赞 0分享

学习Python爬虫的几点建议

这篇文章主要介绍了学习Python爬虫的几点建议，对新手学习爬虫有很大的帮助，感兴趣的朋友可以了解下

收藏 0赞 0分享

Python创建临时文件和文件夹

这篇文章主要介绍了Python如何创建临时文件和文件夹，文中讲解非常细致，代码帮助大家更好的理解和学习，感兴趣的朋友可以了解下

收藏 0赞 0分享

浅析Python 序列化与反序列化

这篇文章主要介绍了Python 序列化与反序列化的相关资料，文中讲解非常细致，代码帮助大家更好的理解和学习，感兴趣的朋友可以了解下

收藏 0赞 0分享

8种常用的Python工具

这篇文章主要介绍了8种常用的Python工具，帮助大家更好的学习Python，感兴趣的朋友可以了解下

收藏 0赞 0分享

python爬虫使用requests发送post请求示例详解

这篇文章主要介绍了python爬虫使用requests发送post请求示例详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

收藏 0赞 0分享

Python结合Window计划任务监测邮件的示例代码

这篇文章主要介绍了Python结合Window计划任务监测邮件的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

收藏 0赞 0分享

Python用来做Web开发的优势有哪些

这篇文章主要介绍了Python用来做Web开发的优势有哪些，文中讲解非常细致，帮助大家更好的理解和学习Python，感兴趣的朋友可以了解下

收藏 0赞 0分享

如何解决pycharm调试报错的问题

在本篇内容里小编给大家整理的是一篇关于如何解决pycharm调试报错的问题文章，需要的朋友们可以学习参考下。

收藏 0赞 0分享

基于logstash实现日志文件同步elasticsearch

这篇文章主要介绍了基于logstash实现日志文件同步elasticsearch,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

收藏 0赞 0分享

python 域名分析工具实现代码

Python调用C/C++的方法解析

学习Python爬虫的几点建议

Python创建临时文件和文件夹

浅析Python 序列化与反序列化

8种常用的Python工具

python爬虫使用requests发送post请求示例详解

Python结合Window计划任务监测邮件的示例代码

Python用来做Web开发的优势有哪些

如何解决pycharm调试报错的问题

基于logstash实现日志文件同步elasticsearch

网络赚钱

站长故事