中国AI初创公司 DeepSeek于周三上午通过微信宣布,其在开发者平台 Hugging Face上发布了其R1 推理 AI 模型的更新版本。
根据 DeepSeek 的微信公告,更新后的 R1 版本采用宽松的 MIT 许可证,这意味着它可以用于商业用途,这是一个“小”升级。
Hugging Face 代码库不包含该模型的描述,只有配置文件和权重,即指导模型行为的内部组件。
升级版 R1 的参数量高达 6850 亿,规模相当庞大,如果不进行修改,该模型很可能无法在消费级硬件上运行。
今年早些时候,DeepSeek发布 R1 模型后声名鹊起,其模型与 OpenAI 的模型形成了鲜明对比。但这家初创公司也引发了美国一些监管机构的关注,他们认为 DeepSeek 的技术构成了国家安全风险。