Selenium自动化工具集 - 完整指南和使用教程

简介: Selenium自动化工具集 - 完整指南和使用教程

Selenium 的概述:


Selenium 是一个用于自动化浏览器操作的工具集。它通过模拟用户在浏览器中的行为,如点击、输入、表单提交等,来实现自动化测试和网页数据抓取等功能。Selenium 针对不同的浏览器提供了不同的 WebDriver 接口,如 ChromeDriver、GeckoDriver(Firefox)、WebDriver(Safari)等。


Selenium 的安装与环境配置:


以下是基本的安装和环境配置步骤:

  • 安装 Python 和 pip:确保已经安装了 Python,并使用以下命令验证安装是否成功:
python --version
• 1
  • 安装 Selenium:使用 pip 命令安装 Selenium,运行以下命令:
pip install selenium
• 1
  • 下载浏览器驱动程序:根据你所使用的浏览器类型和版本,下载相应的浏览器驱动程序。常见的浏览器驱动程序有 ChromeDriver、GeckoDriver(Firefox)、WebDriver(Safari)等。
  • 将驱动程序添加到环境变量:将下载的驱动程序所在的路径添加到系统的环境变量中,这样 Selenium 才能找到并使用该驱动程序。


Selenium WebDriver 的基本概念:


Selenium WebDriver 是 Selenium 的核心组件,它提供了一系列 API 接口,用于与浏览器进行交互。在使用 WebDriver 之前,需要实例化一个 WebDriver 对象,并指定要使用的浏览器和驱动程序。以下是示例代码:

from selenium import webdriver
# Chrome 浏览器示例
driver = webdriver.Chrome("path/to/chromedriver.exe")
# Firefox 浏览器示例
driver = webdriver.Firefox("path/to/geckodriver.exe")

定位元素的方法:


Selenium 提供多种方式来定位页面上的元素。常见的定位方法包括:

  • 通过 ID 定位元素:
element = driver.find_element_by_id("element_id")
• 1
  • 通过 XPath 定位元素:
element = driver.find_element_by_xpath("//tag[@attribute='value']")
• 1
  • 通过 CSS 选择器定位元素:
element = driver.find_element_by_css_selector("tag[attribute='value']")
• 1
  • 通过链接文本定位元素:
element = driver.find_element_by_link_text("link_text")
• 1
  • 通过部分链接文本定位元素:
element = driver.find_element_by_partial_link_text("partial_link_text")
• 1
  • 通过标签名定位元素:
element = driver.find_element_by_tag_name("tag_name")
• 1
  • 通过类名定位元素:
element = driver.find_element_by_class_name("class_name")
• 1
  • 通过名称定位元素:
element = driver.find_element_by_name("name")
• 1

常用操作方法:


获取所有的 cookie:

cookies = driver.get_cookies()
• 1

该方法返回一个列表,包含当前页面的所有 cookie。每个 cookie 都以字典的形式表示,包括名称、值、域名、路径等信息。


获取指定名称的 cookie:


cookie = driver.get_cookie("cookie_name")
• 1

使用该方法可以获取指定名称的 cookie。返回的结果是一个字典,包含 cookie 的各个属性。

添加 cookie:

cookie = {"name": "cookie_name", "value": "cookie_value"}
driver.add_cookie(cookie)
• 1
• 2

使用该方法可以添加一个新的 cookie。需要提供一个包含 cookie 名称和值的字典对象。


删除指定名称的 cookie:


driver.delete_cookie("cookie_name")
• 1

该方法用于删除指定名称的 cookie。


删除所有的 cookie:


driver.delete_all_cookies()
• 1

使用该方法可以删除当前页面的所有 cookie。


设置 cookie 的有效期:


driver.add_cookie({"name": "cookie_name", "value": "cookie_value", "expires": "expiry_date"})
• 1

可以通过给 cookie 字典对象添加 "expires" 属性,并指定有效期来设置 cookie 的过期时间。"expiry_date" 的格式可以是时间戳或日期字符串。


Selenium常用的操作方法


  • 输入文本:
element.send_keys("text")
• 1
  • 单击元素:
element.click()
• 1
  • 获取元素属性:
attribute_value = element.get_attribute("attribute")
• 1
  • 页面导航:
# 打开指定 URL
driver.get("https://www.example.com")
# 返回上一个页面
driver.back()
# 前进到下一个页面
driver.forward()

处理浏览器窗口和弹出框:


在 Selenium 中,可以使用以下方法处理浏览器窗口切换和处理弹出框:

  • 窗口切换:

# 切换到指定窗口
driver.switch_to.window("window_handle")
  • 弹出框处理:
# 切换到弹出框
alert = driver.switch_to.alert
# 接受弹出框
alert.accept()
# 关闭弹出框
alert.dismiss()

处理表单和下拉列表:


Selenium 提供了相应的方法来处理表单字段和下拉列表:

  • 输入文本到表单字段:
element.send_keys("text")
• 1
  • 选择下拉列表选项:
from selenium.webdriver.support.ui import Select
select = Select(driver.find_element_by_id("select_id"))
# 通过可见文本选择选项
select.select_by_visible_text("option_text")
# 通过值选择选项
select.select_by_value("option_value")

高级技巧与解决方案:


  • 等待页面加载:使用显示等待或隐式等待来等待页面加载完成。以下是示例代码:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 显示等待,等待元素可见
element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.ID, "element_id"))
)
# 隐式等待,全局等待
driver.implicitly_wait(10)
  • 处理多窗口切换:使用 window_handles 属性获取所有窗口句柄,并使用 switch_to.window() 方法切换窗口。以下是示例代码:


# 获取当前窗口句柄
current_handle = driver.current_window_handle
# 获取所有窗口句柄
all_handles = driver.window_handles
# 切换到新窗口
for handle in all_handles:
    if handle != current_handle:
        driver.switch_to.window(handle)
        break
  • 处理文件上传和下载:使用 send_keys() 方法指定文件路径来上传文件,或使用浏览器设置来配置文件下载。以下是示例代码:
# 文件上传
driver.find_element_by_id("file_input").send_keys("path/to/file")
# 文件下载
# 可以将浏览器的下载目录设置为指定路径
  • 处理页面滚动:使用 JavaScript 执行滚动操作。以下是示例代码:
# 滚动到页面底部
driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")

浏览器操作和页面处理:


  • 最大化浏览器窗口:
driver.maximize_window()
• 1

这个方法用于将浏览器窗口最大化,以便更好地查看网页内容。

  • 截取屏幕截图:
driver.save_screenshot("path/to/screenshot.png")
• 1

使用这个方法可以将整个浏览器窗口的屏幕截图保存为指定路径的图像文件。

  • 刷新页面:
driver.refresh()
• 1

该方法用于刷新当前页面,相当于点击浏览器的刷新按钮。

  • 获取当前页面的标题:
title = driver.title
• 1

使用该方法可以获取当前页面的标题,并将其存储在变量 title 中。

  • 获取当前页面的 URL:
url = driver.current_url
• 1

这个方法返回当前页面的 URL,并将其存储在变量 url 中。

  • 在文本框中清除文本:
text_field.clear()
• 1

该方法用于清除文本框中的文本内容,适用于 <input><textarea> 元素。

  • 获取元素的文本内容:
text = element.text
• 1

使用该方法可以获取特定元素的文本内容,并将其存储在变量 text 中。这对于提取网页上的文本信息非常有用。

  • 获取元素的 CSS 属性:
css_property = element.value_of_css_property("property")
• 1

这个方法允许你获取特定元素的 CSS 属性值。你需要将 "property" 替换为要获取的具体属性名称,比如 "color""font-size" 等。获取到的属性值将存储在变量 css_property 中。


完结


相关文章
|
9月前
|
运维 Prometheus 监控
3 年部署经验总结:用自动化工具轻松管理 300+ 服务器开源软件
三年前接手公司IT部门时,我满怀信心,却发现部署效率低下。尽管使用了GitLab、Jenkins、Zabbix等100+开源工具,部署仍耗时费力。文档厚重如百科,却难解实际困境。一次凌晨三点的加班让我下定决心改变现状。偶然看到一篇国外博客,介绍了自动化部署的高效方式,我深受启发。
361 0
|
8月前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
716 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
7月前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
9月前
|
人工智能 数据可视化 数据挖掘
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
本文深入分析了传统手动日报在数据孤岛、格式混乱和时效性差三大痛点,并探讨了自动化日报带来的效率提升、决策优化等四大核心价值。通过对板栗看板、SmartBrief、n8n 等六款主流工具的功能、适用场景及实战效果进行测评,为企业提供科学的选型建议与实施路径。
团队日报不用愁!自动化生成工具亲测:任务进度实时同步
|
8月前
|
Java 测试技术 API
自动化测试工具集成及实践
自动化测试用例的覆盖度及关键点最佳实践、自动化测试工具、集成方法、自动化脚本编写等(兼容多语言(Java、Python、Go、C++、C#等)、多框架(Spring、React、Vue等))
695 6
|
9月前
|
人工智能 供应链 数据可视化
工作流梳理工具实战教程:手把手教你绘制第一张自动化流程图
本文剖析了团队因流程混乱导致重复劳动和效率低下的问题,提出通过工作流梳理提升协作效率的解决方案。总结了流程梳理的六大核心需求,并深度测评了6款主流工具,国内有板栗看板那,国外有kiss flow结合团队规模与需求提供选型建议,助力企业高效落地流程优化。
|
7月前
|
人工智能 缓存 自然语言处理
86_自动化提示:AutoPrompt工具
在当今人工智能领域,提示工程(Prompt Engineering)已成为释放大语言模型(LLM)潜能的关键技术。随着LLM规模和能力的不断增长,如何设计高效、精确的提示词成为研究和应用的焦点。然而,传统的手工提示工程面临着巨大挑战
556 0
|
8月前
|
安全 搜索推荐 机器人
风险规则引擎-RPA 作为自动化依赖业务决策流程的强大工具
机器人流程自动化(RPA)是一种通过软件“机器人”自动执行重复性任务的技术,能大幅提升工作效率。它适用于财务、电商等领域的标准化流程,如账单处理和退货管理。然而,RPA在复杂决策场景中存在局限,需结合决策模型(DMN)和业务规则管理系统(BRMS)实现流程与决策的协同自动化,从而增强灵活性与业务价值。
|
8月前
|
监控 测试技术 API
n8n自动化测试教程 (1):环境搭建与初识n8n
n8n是一款开源、可视化的工作流自动化工具,测试工程师可通过拖拽节点快速构建API测试流程,实现测试编排、数据管理、自动化监控与告警等功能,提升测试效率与覆盖率。
|
8月前
|
安全 Shell 持续交付
Debian Apache 自动化部署教程:4 种方法,从个人到企业批量装机
本文介绍在 Debian 系统中实现 Apache 自动化部署的 4 种实用方法,涵盖个人单机与企业批量部署场景。内容包括使用 Bash 脚本一键安装、通过 PXE 实现网络批量部署、借助 Ansible/Puppet 进行多机统一配置管理,以及利用 Preseed 文件自动完成安装配置。文章还提供操作示例与避坑建议,帮助用户提升部署效率,降低人为错误。
253 0