01数据分析 Agent这个叫DeepAnalyze 的 GitHub 开源项目是清华和人大联合开发的数据分析 Agent。开源 2 周,现在 1000 多 Star。给它一堆原始数据,它能完成从数据准备、分析、可视化、建模、写报告全流程。

可以先看看实操视频:
可以看到无需人工指导,能自我规划并执行完成,对于非专业数据分析人员比较实用,也可以做为专业数据分析师的辅助使用。
开源地址:https://github.com/ruc-datalab/DeepAnalyze
支持数据库、CSV、Excel 等结构化数据,也支持 JSON、XML、YAML 等半结构化数据,还可以是 TXT、Markdown 文档等非结构化数据它可以完成开放式任务,比如说「研究这些数据,找出一些有价值的洞见」,它就会去数据清洗、分析、建模、可视化,最终输出一份专业研究报告。让数据分析像聊天一样简单。

DeepAnalyze 的模型、代码、训练数据全部开源,你可以自己部署或开发你自己的数据分析助手。如何使用克隆此仓库并下载 DeepAnalyze-8B:
gitclonehttps://github.com/ruc-datalab/DeepAnalyze.git下载:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
然后运行下面这些脚本启动 API 和界面,然后能用了。
cddemo/chatnpm installcd..bash start.sh
02一键把文档/代码转成 Claude SkillsClaude 前段时间推出了Agent Skills。这是一种模块化能力扩展机制,本质是包含 SKILL.md 文件的文件夹,这个 md 文件可以写专业知识、指令操作和代码脚本。Claude 处理任务的时候可以动态加载相关 skill,有点像 AI 可调用的静态工具或知识库。

而要介绍的 Skill Seeker 开源项目就很实用了,开源两周就 3K 星了。它可以自动把文档网站、GitHub 仓库、PDF 转换等成 Claude AI Skills,全程无需手动操作,将智能抓取的信息有机整合,最后整理成 Claude 能直接导入的 .zip 技能包。开发者写了一篇从 0 部署这个开源项目的文章,挺详细的,感兴趣的可以去看看。

新手教程:https://github.com/yusufkaraaslan/Skill_Seekers/blob/development/BULLETPROOF_QUICKSTART.md
03谷歌开源的时间序列预测模型这个叫 TimesFM 的开源项目是 Google Research 发布的。专为时间序列预测开发的预训练基础模型,它是基于一个 1000 亿个真实世界时间点的大型时间序列语料库训练出来的。算是一个基座模型。

别被这么高大上的名词唬住哦。简单说,时间序列预测模型就是能根据过去的时间数据,推测未来的趋势。比如你是开网店的,有过去 100 天的销量数据,丢进 TimesFM能直接预测未来 12 天的销量,还能知道销量的波动范围。因为 TimesFM 作为预训练模型,已经提前学会了大量时间序列的规律,不用你从零训练,直接开箱即用。因为是基座模型,有 2 亿参数,你可以直接把你手上不同时间节点的数据丢进去让它预测,也可以基于它进行微调。

开源地址:https://github.com/google-research/timesfm
04点击下方卡片,关注逛逛 GitHub
