
概念太多,大家根本学不过来,而现在 AI 的趋势就是,不再满足于“写一段文案”“总结一篇文章”,而是要的更现实,我就要为结果付费,直接给我交付结果最好就直接呆在我电脑上,给我干活,所以桌面Agent又火了起来,而今天,叠加了Gemini + Claude 顶级模型的 Windows 版的 Cowork 终于来了!

昆仑天工刚刚发布了他们最新的天工Skywork桌面版。(之后统一就叫Skywork)

一键安装,不用像OpenClaw那样一步步部署了..就是一个普通的安装包,安装完成直接跟本地电脑打通,然后AI就可以接管你的电脑,直接变成生产力,本地的优势就在于它能直接进入到真实文件系统,读文件夹结构、读文件内容、看图片、读表格等等。所以我对桌面 Agent 的评测标准也很简单:交付。Skywork 的定位也很清楚,它就是奔着“桌面同事”去的。我们直接看场景。刚需:系统级整理与项目归档2025年年初DeepSeek爆火的时候,当时很多人在群里传了一堆资料,然后一解压,maybe like this,

看的我血压都上来了,内容杂,版本多,图片多,格式多。资料散落,命名混乱,版本冲突,这都是日常工作中经常遇到的问题。“整理文件夹”这件事看起来不性感,却是所有生产力工具的基础盘。然后打开Skywork,选中对应需要处理的文件夹。

我就直接输入我的需求:请把该文件夹下的所有文件内容整理成一个“可交付”的项目目录结构,方便团队协作查找。这里面有各种DeepSeek的教程相关内容,你的分类逻辑要可解释,比如:按主题、按工作流阶段、按内容类型,任选其一并说明原因。
之后帮我按照重命名规则进行统一命名,可读,建议格式:主题_简短说明.ext
我确认“操作清单”后再开始移动和重命名。
最终在【_output】里输出:
- 【目录结构.txt】整理后的树状目录
- 【变更日志.md】old → new 逐条记录
- 【README.md】说明分类逻辑、命名规则、重复文件处理方法
要注意:
1) 全程不得删除任何文件,不得覆盖原文件。所有输出放到【_output】文件夹。
2) 执行完成后输出【变更日志.md】:逐条记录 old path → new path;以及重命名规则。
3) 若发现重复文件或版本冲突,全部保留,统一放到【_output/duplicates_review】并解释你判定重复的依据。
4) 遇到信息缺失或不确定时,集中列出“待确认问题清单”,不要擅自补全。
我们来看下过程:
它会基于我们的场景任务,自动规划并输出一个“操作清单”,等我们确认之后开始执行。

等一两分钟处理完成之后,直接输出最终结果。


不是按“扩展名”粗暴分类。它会按内容把东西归到更合理的结构里。它会重命名,生成目录树,同时给你一份变更日志,告诉你旧路径到新路径发生了什么。你盯着屏幕看,会有一种错觉:像一个非常懂规矩的同事,在帮你做项目归档。除了能够完成任务,我看重的点其实还有一个:先清单后执行。
“真正能在团队里长期跑的桌面 Agent,一定要让人安心。它要像一个谨慎的同事:先把你要做的操作列出来,等你点头再动手。这决定了它能不能进入企业环境。
再进一步,我们有时候经常会对文档里面的图片有提取的需求,一旦涉及到海量的文件,想要找里面的图片,只能人工一步步复制,现在我们就可以用Skywork直接一键获取文档中的所有图片。

之后等待我们确认后,它就开始提取我们文档中的所有图片到文件夹。

一目了然,非常清楚。之前每次找图的时候,都要打开 docx,翻半天,截图,重命名,发群里。现在它能一次性把所有图抽出来,还顺带给你写索引说明。这类效率提升非常扎实。营销SEO落地与竞品调研很多人用 AI 做营销,卡在一个点上:AI 很会写,但经常写着写着就开始“自嗨”,新增卖点,补编案例。而营销交付在企业里是高风险的。你写错一句话,背锅的人不在模型那边。所以我把这个场景当成“结果导向”的硬测:严格引用 brief,不许自由发挥。直接看效果:
我输入的prompt是:请基于文件夹中所有关于平安产品的相关介绍,生成一个单页 SEO 落地页,并输出可直接打开的 HTML。
要求:
1) 只允许使用 brief 介绍中出现过的信息,不要新增卖点,不要补编案例。
2) 页面可以包含以下模块,并按顺序组织:
- Hero(标题+一句话价值主张+CTA按钮)
- 核心优势(3条,每条配一句解释)
- 使用场景(3个场景,每个场景配一个小例子)
- FAQ(至少5条,全部来自 brief 或你从 brief 推导出的“问法”,答案仍然只用 brief 信息)
- 最终 CTA
3) 图片要求:
- 使用文件夹里的 logo 与截图
- 所有截图统一宽高比例,页面排版整洁
4) 输出:
- 【_output/index.html】
- 【_output/assets】存放引用图片
- 【_output/页面说明.md】说明你如何从 brief 映射到页面结构
5) 先给我页面大纲与模块文案草稿,我确认后再生成最终 HTML。
这个任务的关键不在于“它会不会写网页”。真正的关键在于它能不能做到两个字:可审计。在企业里最理想的状态是:每一段文案都能回溯到原始 brief 的哪一页哪一段。每一个模块都能解释“我为什么这么写”。出了问题,能定位来源,能改,能复核。最后生成的这个页面非常牛逼,平安色,外加产品介绍,我文件夹里面的截图和LOGO都安排上了..

有了我们的营销SEO页之后,我们经常会碰到的工作就是市场调研,我们可以直接让它基于平安银行产品资料 → 搜索竞品 → 输出对比表 + 结论报告。请你根据我这个文件下所有关于平安银行的产品信息,从互联网上帮我搜索一下竞品,输出对比表与结论报告。
输出要求:
1) 生成【_output/竞品对比.xlsx】,至少包含 5 个 sheet:
- Overview(竞品概览)
- Features(功能对比)
- Pricing(定价与套餐)
- TargetUsers(目标用户与场景)
- Notes(重要备注与风险)
2) 生成【_output/竞品分析报告.docx】结构固定为:
- 结论摘要(3条以内)
- 竞品分组(按定位或人群分组)
- 核心差异点(用表格呈现)
- 机会点与建议(可执行的 5 条建议)
3) 每条关键信息都要标注来源网址,并尽量给出页面标题或关键信息位置描述,方便复核。
4) 如果某个竞品网站信息抓不到,记录为“信息缺失”,并说明可能原因与替代验证方式。
它会调用web_search从网上搜索相关资料,最终给我们输出一份竞品报告和对比分析的Excel表格,很吊..


知识扩充与二次编辑这个场景看起来偏生活化,但它其实非常适合测桌面 Agent 的“多模态归纳能力”。我给它的输入不再是文本,而是一个按水果类型分文件夹的图片库。

它要做四件事:识别结构、选样本、生成内容、同步输出 docx 与 html请根据文件夹中的水果照片生成一个docx格式的报告,这些照片按水果类型分组织到子文件夹中。
从文件夹中挑选8种水果类型,写一份报告介绍这些水果是什么以及一些关于它们的事实,比如是在热带比较常见还是哪里。使用文件夹中的原始图片并保持其原始尺寸。
最好再生成一个HTML来介绍它们。
然后它就开始了操作
补充了“是什么 + 事实信息”,插入原始图片并保持原始尺寸

这个场景跑通之后,你会发现一个很现实的价值:企业里大量“图像素材驱动的内容生产”,本质上和水果报告是同构的。产品图、培训图、活动图、项目截图,最终都要变成一份能对外讲清楚的材料。其他场景我还测了两个场景,比如我们财务票据分析与对账自动化,感兴趣的直接看视频:
能够直接帮我们完成银行对账单 + 收据截图 → 创建对账 Excel;还把我之前给一些企业培训的教材给到它,让它生成目录和分析我的画像,


完成的都很不错,更多实用场景我还在慢慢摸索..不一样的地方其实在这之前有很多的桌面Agent产品,比如Claude CoWork等等,但 Skywork 支持在 Claude 与 Gemini 之间切换,并提供 Auto 模式,自动推荐更合适的模型。

这点做的很有想法,比如涉及到多模态我们就用Gemini,涉及到Coding就用Claude,嗯,因为用到Gemini和Claude,所以网络环境,大家懂得哈~而且支持 Windows 用户,听到了广大Windows用户的心声啊…运行在本地,安全性非常OK,除此之外还支持 100+ Skills,Skills有多火不用多说了吧,

有NanoBanana Pro,以及X,YouTube,Reddit相关的skill,按需选择。他们精选过了100多个skills,质量过硬,还支持高质量图像和视频生成。而且,这一切在 Windows 上就可以直接使用,只需要$19.99 起的 skywork.ai 月会员,就可以用起来,49.9美元的会员几乎可以有无限额度了。现在就可以在这里体验:https://skywork.ai/desktop结语:下一代 AI Agent 的关键写到这里,其实你会发现,桌面 Agent 这波热度,真不是“又一个新玩具”。它背后对应的是一个很现实的变化。大家对 AI 的期待正在升级,从“帮我想”升级到“帮我做”,从“给我建议”升级到“给我交付”。你甚至不需要再把资料一段段复制到聊天框里,它就能进到你的项目目录里,把文件、表格、截图、网页、素材,按你的规则变成一个能协作、能复盘、能交付的结果。Skywork 让我比较意外的点,恰恰在这些“务实细节”上。先清单后执行,让你敢把电脑交给它。接下来我会继续把更多高频场景跑出来,整理成可复制的提示词模板和验收标准。你也可以从三个最容易出效果的任务开始:整理一个乱文件夹,做一个能上线的落地页,再跑一个图像驱动报告。跑完这三条,你就会明白桌面 Agent 的价值到底落在哪里。最后用一句话收束:桌面 Agent 的未来不在更会说话,在更会交付。以上。

