NVIDIA NIM是NIVIDA推出的 AI 推理微服务平台,用于快速部署和调用各种大模型最近上线了一批新的免费大模型。40 RPM速率限制:当然,天下没有免费的午餐。NVIDIA设定了“每分鐘40次请求”的速率限制,这一限制主要出于平台稳定性的考量。对个人开发者来说,这个限制相当于每1.5秒可以发起一次请求,日常开发测试绰绰有余。

实际跑通了将免费的模型配置到Claude Code上使用,这波免费羊毛挺香的,废话不多说进入主题。一、申请账号1. 直接打开build.nvidia.com

2. 使用邮箱注册账号,然后用手机号收取验证码,国内手机号可以收到


二、使用配置登录成功后点击网页右上角进入账号,点击 Generate API Key输入Key Name,如my_cust_key。选择过期时间,默认12个月,可以修改为永不过期。

注意:生成key之后要复制保存,因为只出现一次,一旦忘记就要重新生成了。三、集成到客户端这里以Claude Code为例,为了方便切换使用CC-Swith工具进行配置。1.查看可用免费模型

建议:确定使用模型前,点进去测试下,有的模型响应很慢,实际使用的时候基本没法用。2.模型选择
- 请求量大:直接提示

- 可用的模型,能正常返回,且效率还可以的再使用。

3.查看API配置信息点击右上角的View Code查看,提供python、LangChain、Node、Shell几种方式。


我们此处是配置到CC-Swich中,主要用到base_url和Api_key以及model。4.CC-Swith配置新增加供应商,配置以下信息:
- 供应商名称:方便在列表中识别。
- API Key:保存好的Key
- 请求地址:https://integrate.api.nvidia.com/v1


注意:使用的是Open AI的模式,需要开启代理才可以正常使用。

5.实际效果可以正常使用。

四、可能遇到的问题手机号验证无法通过

遇到这种情况要么换手机号,要么等等再重试,我是重试了很多次,但也有人一次性就成功了。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
