要统计网址个数,你可以使用Python中的正则表达式和`collections`模块中的`Counter`类。以下是一个简单的步骤和示例代码:
1. 导入必要的模块:
from collections import Counterimport re
2. 定义一个函数来读取文件并提取网址:
def read_file(file_name):url_list = []with open(file_name, 'r') as f:for line in f:if re.match(r'^https?:\/\//', line): 正则匹配http或https开头的行url_list.append(line.strip()) 去除行尾的换行符return url_list
3. 使用`Counter`来统计每个网址出现的次数:
def count_urls(url_list):return Counter(url_list)
4. 排序并打印结果:
def print_sorted_urls(counter):for url, count in counter.most_common():print(f'{url}: {count}')
5. 将以上函数组合使用:
def main(file_name):urls = read_file(file_name)url_counts = count_urls(urls)print_sorted_urls(url_counts)
6. 调用`main`函数并传入包含网址的文件名:
if __name__ == '__main__':file_name = 'url.txt' 假设你的网址列表保存在这个文件中main(file_name)
以上代码会读取指定文件中的网址,统计它们出现的次数,并按次数降序排序输出结果。请确保你的文件路径正确,并且文件中的网址格式正确。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://sigusoft.com/bj/115789.html