欢迎光临北京软件和信息服务业协会官方网站
有道子曰-o1推理模型正式发布!消费级显卡即可部署
发布日期:2025-01-24    来源:网易有道    分享到:

讲件大事。

今天,我们正式推出国内输出分步式讲解的推理模型“子曰-o1”(点击蓝字即可下载体验),并正式开源!

作为14B轻量级单模型,子曰-o1支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。

2025开年,AI行业掀起大模型“推理潮”,主要技术思路为以更长的思维链路实现更强的逻辑及推理能力;在此引导下,特性不同的模型层出不穷。但在这其中,可供应用的开源模型不多,且参数规模较大,无法在低显存的消费级显卡上运行,即使是采用了低比特量化技术,使其能够在单卡上部署,但相应也为长思维链的运行带来了不稳定性。

针对这一问题,子曰-o1开源模型选择了较小参数规模的基础模型,能够进行单卡部署并具备更强的数学能力。在此基础上,子曰-o1开源模型进一步实现了轻量化,能够在消费级显卡上运行,提供与云端部署质量相媲美的模型质量。

1737681019789.jpg

在规模“压缩”的同时,子曰-o1采用思维链技术,打造了国内输出分步式讲题的思维链模型,以14B小参数规模可复现OpenAI o1的单模型推理能力。

比如,在解题时,子曰-o1会形成较长的思维链条,使其运行思路更接近于人类的思考方式,还会通过“自言自语”、自行纠错的方式,提供分步解题过程及最终结果。

1737681029201.jpg

(思维链技术演示)


作为教育垂类模型,子曰-o1的这一特性也与教育应用产品更为适配,通过清晰呈现有条理的解题过程,以启发式讲解引导学生实现自主思考能力提升。

不仅如此,面向教育领域应用,子曰-o1在长思维链所实现的高准确度上,进一步从数据筛选、训练指令等方面优化。通过应用我们自研的自动化评估方式,子曰-o1不仅对最终答案的正确性进行评估,同时还覆盖了整个讲解过程,确保学习数据的高质量。

而在训练指令选择上,基于有道多年来在教育领域的数据资源积累,子曰-o1使用了大量的教育领域学生试卷习题为训练样本,从而提升教育场景应用的准确性。

当前,子曰-o1已在“有道小P”中落地应用,支持其实现“先提供解析思路、再提供答案”的答疑过程,引导学生用户主动思考、调用知识储备自主解决问题,从而实现真正把知识学透。

在轻量化、输出分步式讲解、中文逻辑推理等多元优势的加持下,子曰-o1能够以更低的落地门槛撬动更高的应用价值,并能为相关开发者们提供更具实效的工具。

坚持“场景为先”,作为教育垂类大模型,子曰已经拥有较通用大模型更为专业的预训练语料,可以依据用户在学习场景下的需求,帮助用户答疑解惑。而伴随着推理模型的赛道持续扩大,我们也将以子曰-o1为起点,持续释放推理模型在教育领域内的应用价值!

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.