以下是使用Python语言解决该问题的示例代码:
import os
import requests
def traverse_directory(url):
# 发送GET请求获取目录索引列表
response = requests.get(url)
if response.status_code == 200:
# 解析HTML内容,提取链接
links = response.text.split('')[0]
# 构建文件的完整URL
file_url = url + '/' + filename
# 判断是否是目录
if filename.endswith('/'):
# 递归遍历子目录
traverse_directory(file_url)
else:
# 发送GET请求获取文件内容
file_content = requests.get(file_url).text
# 处理文件内容,例如打印或保存到本地
print(file_content)
# 设置目录索引URL
directory_url = 'http://example.com/directory'
# 开始遍历目录
traverse_directory(directory_url)
以上代码使用requests
库发送HTTP请求获取目录索引的HTML内容,并使用字符串处理方法解析HTML内容提取文件名和链接。如果遇到目录,则递归调用traverse_directory
函数继续遍历子目录;如果遇到文件,则发送HTTP请求获取文件内容,并可以根据需求进行处理,例如打印文件内容或保存到本地。请根据实际情况修改directory_url
变量为你要遍历的目录索引URL。
上一篇:遍历索引并将每个范围定义为一天
下一篇:遍历所有 DOM 元素不起作用