关于我们  |

琼ICP备07002053号

| 友情链接

全域旅行

基于DeepSeek R1 开源大模型

DeepSeek-R1 是基于强化学习的智能推理模型,采用两阶段训练架构:先通过冷启动数据优化基础能力,再结合动态奖励机制解决逻辑重复与表述晦涩问题。该模型在数学、编程及推理任务中达到与OpenAI-o1相当的水平,通过创新训练方法显著提升了生成内容的连贯性和复杂问题解决能力。

基于DeepSeek V3 开源大模型

DeepSeek-V3 是基于混合专家(MoE)架构的 6710 亿参数语言模型,创新融合多头潜在注意力(MLA)和自研DeepSeekMoE技术,通过无辅助损失负载平衡策略实现高效推理。模型经14.8万亿token多领域数据预训练,结合监督微调与强化学习,在常识推理、代码生成等任务中性能超越主流开源模型,关键指标接近GPT-4等闭源系统。

问一下

星际坐标

知识如星海,坐标即答案