分享两个清华大学的黑科技!一个是扫脸查生命特征,另一个是高保真歌曲生成器

AI 知识库3周前发布
723 0 0
熊猫办公
今天分享两个清华大学开发的工具,虽然工具目前用处还不大,但里面有一些功能模块还是可以用到我的实时互动数字人系统中的。
1. 生理采集系统 FacePhys Findings
体验地址:

https://www.facephys.com/

分享两个清华大学的黑科技!一个是扫脸查生命特征,另一个是高保真歌曲生成器

只需一个摄像头或一段视频,零接触、实时、连续输出 100+ 维度生理与行为数据!

FacePhys Findings 彻底干掉传统一堆传感器!
传统方式 vs 扫脸革命:
  • – 戴满身设备、30 分钟穿戴调试 → 开箱即用 <5 分钟
  • – 传感器干扰真实状态 → 完全零接触,最自然数据
  • – 数据乱七八糟不同步 → 统一时钟,全部自动对齐
硬核参数:
  • – 心率误差 ≤2 BPM
  • – 18 项 HRV 指标 + 表情情绪 + 面部动作单元 – 连续采集 8 小时+,本地存储 + 物理打标
  • – 静音设计,轻松部署实验室、驾驶舱、心理咨询室 。让扫脸看健康从科幻变成科研标配!
目前该工具以API付费的形式提供给外面使用。我第一眼看到它就想把它的API接入我的数字人实时互动系统中。这样当客户在大屏前的时候可以实时提供它的健康指数。
另一个学习的地方就是它的付费模式。
分享两个清华大学的黑科技!一个是扫脸查生命特征,另一个是高保真歌曲生成器
它这套系统非常完备,付费方式方面包括按量付费和企业部署,而我的数字人系统一直找不到合适的付费方式,现在正好给自己一个很好的参考思路。下一步按这个付费,提供账单、发票、工单的功能吧。
另外除了付费方式,它还提供了先进的Skills 供变成工具使用。
分享两个清华大学的黑科技!一个是扫脸查生命特征,另一个是高保真歌曲生成器
2. 高保真歌曲生成系统Khala
开源地址:

https://github.com/Khala-Music-AI/Khala/分享两个清华大学的黑科技!一个是扫脸查生命特征,另一个是高保真歌曲生成器

  • 完整歌曲生成
    面向歌曲级别的音乐生成,而不是短音频片段或伴奏循环。
  • 文本与歌词控制
    支持通过自然语言 prompt 和 lyrics 控制风格、情绪、演唱与内容。
  • 整系统实现:提供前端界面、FastAPI 后端调度层、单卡推理 worker、模型加载与音频生成链路,而不是仅提供离散推理脚本。
为什么我要持续关注这个音乐生成呢。目前利用周末时间我们正在做一款适合自己的音乐工具,让用户自己上传乐谱,AI负责正确唱出来,解决目前很多人拿到乐谱不会唱歌的问题。目前实现的效果周末文章已经详细介绍过。
关于作者
做一只爬的最久的乌龟,保持学习保持好奇,即使慢一点,遇到一点困难,只要最后能到达终点,又有什么关系呢。
毕竟人生没有白走的路,每一步都算数。
© 版权声明

相关文章