Midscene.js - AI 驱动,带来愉悦的 UI 自动化体验
视觉模型驱动,支持全平台的 UI 自动化 SDK
📣 v1.0 正式发布公告
我们已发布 v1.0 版本。 目前已在 npm 发布。
最新文档与代码请查看 https://midscenejs.com/ 以及main分支。
历史文档请访问 https://v0.midscenejs.com/。
v1.0 变更记录: https://midscenejs.com/zh/changelog
功能特性
用自然语言编写自动化脚本
- 描述你的目标和步骤,Midscene 会为你规划和操作用户界面。
- 使用 JavaScript SDK 或 YAML 格式编写自动化脚本。
Web & Mobile App & 任意 界面
- 网页自动化:可以与 Puppeteer 集成,与 Playwright 集成或使用桥接模式来控制桌面浏览器。
- Android 自动化:使用 JavaScript SDK 配合 adb 来控制本地 Android 设备。
- iOS 自动化:使用 JavaScript SDK 配合 WebDriverAgent 来控制本地 iOS 设备与模拟器。
- 任意界面自动化:使用 JavaScript SDK 来控制你自己的界面。
面向开发者
- 三种类型的 API:
- MCP: Midscene 提供 MCP 服务,将 Midscene Agent 的原子操作暴露为 MCP 工具,上层 Agent 可以用自然语言检查和操作界面。文档
- 使用缓存,提高执行效率: 使用缓存能力重放脚本,提高执行效率。
- 调试体验: Midscene.js 提供可 视化回放报告、内置 Playground 和 Chrome 插件,帮助开发者更高效地定位与排障。
演示案例
在 Web 浏览器中自主注册 Github 表单,通过所有字段校验:
此外还有这些实战案例:
- iOS 自动化 - 美团下单咖啡
- iOS 自动化 - Twitter 自动点赞 @midscene_ai 首条推文
- Android 自动化 - 懂车帝查看小米 SU7 参数
- Android 自动化 - Booking 预订东京圣诞酒店
- MCP 集成 - Midscene MCP 操作界面发布 prepatch 版本
零代码快速体验
- Chrome 插件:通过 Chrome 插件 立即开始浏览器内体验,无需编写任何代码。
- Android Playground:使用 Android playground 来控制你的本地 Android 设备。
- iOS Playground:使用 iOS playground 来控制你的本地 iOS 设备。

