会看见、会行动、会协作的桌面 AI 伙伴

让电脑从工具 变成与你并肩工作的同窗

CoView 围绕“观察屏幕 -> 理解任务 -> 执行一步 -> 再次观察”的视觉控制循环运行,能在浏览器、编辑器、文档和桌面应用里持续推进真实任务,而不只是停留在聊天框。

Observe 看懂当前屏幕、前台应用与多显示器环境
Operate 执行点击、滚动、快捷键、输入与网页文档读取
Collaborate 文字、语音、唤醒词与后台 Code Agent 在一个入口中协同工作
CoView 截图
👁️
真实桌面理解
屏幕、前台应用、多显示器
🧠
反馈驱动执行
做一步、看一步、继续规划

这不是概念演示,而是在真实桌面里持续工作的 CoView

从叫醒同窗、理解当前界面,到实际点击输入、推进任务、实时反馈,下面这段演示展示了 CoView 如何把“看见”和“行动”真正连起来。

真实工作流 直接发生在桌面应用里,而不是独立沙盒或静态脚本演示。
持续推进任务 每一步都会重新观察环境,再决定下一步动作,不是一次性回答。
可说、可看、可操作 把悬浮面板、语音协作和后台 Agent 协同串在一个体验中。
GIF 循环演示 真实软件操作录屏

CoView 的亮点,在于它真的参与工作

它把视觉理解、桌面操作、语音交互和后台 Agent 串成一条连续工作流,让 AI 不再只是回答你,而是帮你把事情做下去。

🖥️

看见真实桌面

通过截图观察、前台应用感知和多显示器理解,直接进入你当前正在处理的真实界面。

⌨️

直接操作电脑

支持点击、拖拽、滚动、快捷键、文本输入,以及网页和文档读取,不用手动来回切换。

🪟

一个同窗完成协作

任务输入、停止控制、实时日志、推荐提示和结果回报都在一个悬浮工作窗中完成。

🔁

反馈驱动的执行循环

CoView 的核心不是“一次回答”,而是“观察屏幕 -> 理解任务 -> 执行一步 -> 再次观察”的循环。遇到加载、界面变化或任务中断时,它会继续判断是推进、暂停确认,还是切换策略。

CoView 核心工作流

它如何在真实软件环境里把任务做下去

不是先让你写一大段提示词,而是先看懂当前环境,再用一步一步的桌面动作持续推进任务。

1

观察当前环境

理解当前屏幕、前台应用与上下文,不要求你从头解释。

2

理解任务意图

结合模型、历史上下文和安全边界,决定下一步最合适的动作。

3

执行一步操作

执行点击、输入、滚动、快捷键或内容读取,真正让任务往前走。

4

反馈并重规划

根据界面变化决定继续执行、暂停确认,还是切换新的动作路径。

CoView 任务执行流程图

覆盖从桌面操作到 Agent 分流的完整能力

CoView 同时提供 GUI、语音入口、后台 Code Agent,以及 CLI / Python API 等接入方式,适合从个人使用到业务集成的不同场景。

🧭

桌面级上下文理解

结合当前屏幕、前台应用和任务历史,减少你重复描述“我现在在哪、要做什么”。

🪄

任务输入与状态控制

输入任务、查看进度、暂停执行、接受建议,都能在悬浮同窗中直接完成。

📄

网页与文档读取

读取当前页面和文档内容,提炼关键信息并直接转化成下一步动作依据。

阶段性结果回报

不是黑盒执行,而是持续回报当前进展、已完成动作和最终结果。

🖱️

点击、拖拽与滚动

直接在真实桌面应用里完成鼠标级操作,不需要你手动接管每一步。

⌨️

快捷键与文本输入

支持组合键、文本输入和表单推进,更适合连续办公任务。

🖥️

跨软件流程推进

能在浏览器、编辑器、文档工具和桌面应用之间衔接完整操作链。

🛰️

多屏环境适配

理解多个显示器的屏幕元数据,更适合真实办公桌面环境。

🎙️

本地唤醒词

支持“你好小彤 / hey Lucy”等本地唤醒词,进入自然桌面协作流程。

🧹

实时 ASR 与 VAD

语音输入经过 VAD、可选回声消除和实时转写,适合边说边做的场景。

🗣️

执行中插话

任务执行和语音播报过程中也能识别 stop、new_task、ignore 等插话意图。

🔊

TTS 结果播报

阶段进度和最终结果都能通过语音反馈,让电脑更像真正的工作伙伴。

🤖

后台 Code Agent

复杂任务可自动分流到后台 Agent,前台继续工作而不被长任务阻塞。

🌐

多模型接入

支持 OpenAI-compatible 模型服务,并可按任务类型灵活选择 provider。

🧩

GUI、CLI 与 Python API

既能直接使用图形界面,也能接入命令行和 Python 工作流中。

🛡️

可控的安全边界

通过确认策略、日志追踪与权限边界,降低桌面自动化带来的风险。

CoView 语音流程图
🔔

唤醒即协作

命中本地唤醒词后,悬浮同窗立即出现并显示当前语音状态,直接进入任务上下文。

🧠

实时理解说话意图

空闲时可直接把转写作为新任务;执行中则能识别 stop、new_task、ignore 等插话控制。

🧭

可打断、可继续、可播报

支持继续聆听、停止当前工作、退出程序,并通过 TTS 播报进度和最终结果。

默认唤醒词与控制口令

你好小彤 hey Lucy 停止当前工作 退出程序

把长任务交给后台 Agent,前台继续你的桌面工作

当任务不适合阻塞前台时,CoView 可以把代码分析、仓库扫描、脚本生成、批处理等工作交给后台 Code Agent,并持续回传阶段日志与最终结果。

OpenAI Anthropic Qwen Gemini
$ coview run "整理会议纪要并生成周报"
[observe] 当前应用: 文档编辑器 / 浏览器
[plan] 识别任务拆分: 提取要点 -> 分类 -> 产出模板
[agent] 已创建后台任务: Agent-1024
[done] 周报草案已写入并附操作日志
4
视觉控制循环:观察、理解、执行、反馈
3
交互入口:文字、语音、快捷键
2
桌面平台:macOS 与 Windows
3
接入方式:GUI、CLI、Python API

立即开始使用 CoView

选择你的系统下载安装包,点击按钮即可直接下载;首次使用前建议先阅读使用说明。

Windows 图标

Windows 安装包

适用于 Windows 设备,点击后直接下载 `CoView-2.0.0-Windows-Setup.exe`。

下载 Windows 版
macOS 图标

macOS 安装包

适用于 macOS 设备,点击后直接下载 `CoView-2.0.0-macOS.dmg`。

下载 macOS 版
📘

使用说明文档

从安装、权限配置到参数说明,完整了解 CoView 的使用方式。

阅读说明