获取主站，并且去重

a = [] 
#----------------------------------------------------------------------
def ceshi_url(url_file):
    """"""
    with open(url_file) as w:
        urls = w.readlines()
        for i in urls:
            i = i.strip('\n').strip('\r')
            try:
                url = tld.get_tld(i)
                list_url = 'http://' + url
                a.append(list_url)
                
            except Exception,e:
                print str(e)
    
ceshi_url('formal_url.txt')
g = open('url.txt','w+')
a = list(set(a))
print len(a)
for i in a:
    print i
    g.writelines(i)
    g.writelines('\n')

最后编辑于：2017.12.10 02:40:31

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

21.只有竞争普遍发生时，也就是说只有在个别生产者必得调整自己的活动以适应价格的变化但不能控制...
1.当代种种事件不同于历史之处，在于我们不知道它们会产生什么后果。 2.经验和利益的偶然结合，往往会向人们揭示...
湘江隐士阅读 2,993评论 2赞 11
2月28日随手写
第二天开车上班。不得不说，我真的比想象的更勇敢，更能干。单位门前的巷子那么窄，那么挤，人那么多，我居然开进去了。（...
罗湘其阅读 125评论 0赞 0
我怎么如此幸运（简书版61）——灵魂有她喜欢的衣服耶！
时间：2017-2-19（周日）地点：海南省海口市修习者小豆丁：小俊娟 1/我怎么如此幸运，观察1：小俊娟今...
余俊娟阅读 198评论 0赞 1
180斤奶爸如何变型男
周围有过许多奶爸，他们从来都是来者不拒，只要是老婆孩子吃剩下的，通通吃光、喝净！加上没有规律的睡眠，所以,通常他们...
永远的mark阅读 225评论 0赞 0

赞1赞

赞赏

手机看全文