1、python如何去除字符串后面的日期,只留下域名?
你好,由于日期长度固定,或者说格式固定,因此可以利用一些已有函数删除每个字符串内后面的指定容长度的字符或者格式。可以了解一下re正则表达式和python提供的String库或者其他库。找到两篇文章,希望对你有所帮助。
python删除字符串中指定字符的方法
python 字符串 去除 特定位置字符
如果有帮助的话,希望给个采纳,谢谢啦。
2、如何用python优雅地扫描可用域名
用python-2.7.3\python是对的,但是你的hello.py放在那里?你需要先用“cd 目录名”转换当前目录到存放hello.py的地方,然后执行python-2.7.3\python hello.py。
3、有没有可以像百度爬虫一样的python程序。把中国所有域名都采集保存下来。希望有大哥可以给我一份,
你表达的不是很清楚!
采集域名有啥用?
你是说采集每个正常运行的域名下的网站内容吗?
但我得告诉,这个程序很多,搜索引擎很多人都写过!但你得有硬件成本才行啊!中国啊,多少个网站!你如果你用单台电脑采集,估计你的从现在开始到你老死还采集不完!百度的服务器数量已经数以万计,懂吗?
如果你只采集几个特定的网站,还可以搞的定啊
4、python3.5的怎么通过域名知道网站所有者
一、域名查询
万网提供了域名查询接口,接口采用HTTP协议:
接口URL:
接口参数:area_domain,接口参数值为标准域名,例:52bong.com
调用举例:
返回:<?xml version="1.0" encoding="gb2312"?>
<property>
<returncode>200</returncode>
<key>52bong.com</key>
<original>211 : Domain exists</original>
</property>
返回结果说明:200 返回码,200表示返回成功
52bong.com 表示当前查询的域名
211 : Domain exists 返回结果的原始信息,主要有以下几种
original=210 : Domain name is available 表示域名可以注册
original=211 : Domain exists 表示域名已经注册
original=212 : Domain name is invalid 表示查询的域名无效
original=213 : Time out 查询超时
Python实现
1.1 查询已经被注册的域名>>> import urllib2
[quote]>> req=urllib2.urlopen('h')
>>> print (req.read().decode())
返回结果:不可用,已经被注册
1.2 查询没有被注册的域名>>> req2=urllib2.urlopen('')
>>> print (req2.read().decode())
返回结果:可用,未被注册
1.3 查询不加后缀的域名>>> req3=urllib2.urlopen('')
>>> print (req3.read().decode())
返回结果:超时
二、whois查询
由于没有找到像域名查询接口那样好的API,这里直接抓取站长之家的whois查询页面)>>> whois = urllib2.urlopen('')
>>> print (whois.read().decode())
在返回的结果中有这样一段html代码,这段信息就是查询的whois信息
5、Python 将域名取出并进行计数排序
用生成器是否好点:
from urllib import parse
from collections import Counter
def parse_domain():
with open("c:\\a.txt",'rt') as f:
for l in f.readlines():
yield parse.urlparse(l)[1]
for k,v in Counter(parse_domain()).most_common():
print(v,k)
6、python如何从网页中提取列表中字典中的域名
假设那个字典叫dict:
if dict.has_key( line[0] ):
print dict[ line[0] ]
和列表一样,用[ ]即可
7、python怎么判断某个域名是顶级域名还是二级域名
比如:baidu.com 这是百度的顶级域名
.baidu.com 这是二级域名
www.baidu.com这也是二级域名
..baidu.com 这是三级域名
*.baidu.com 这是泛域名
习惯上这样区分,一般不称谓一级域名。个别人说指的一级域名就是顶级域名。
8、python怎么批量查询域名备案信息
1.把要反查的ip地址写在c:\ip.txt里面,每个ip或者域名一行
2.python reverse_ip.py
3.用Excel打开c:\result.csv,结果就都在里面了!