挑衅DeepSeeK 「AI教母」打造AI模子练习本钱没有到_HG6686平台

挑衅DeepSeeK 「AI教母」打造AI模子练习本钱没有到

发布时间：2025-02-09 08:34

DeepSeek劲敌来了！被誉为「AI教母」的著名华侨美籍迷信家李飞飞引导的团队，以低于50美元的云盘算本钱，胜利练习闻名为「s1」的人工智能推理模子。此模子在数学跟编码才能考试中的表示，据称媲美OpenAI o1跟DeepSeek R1等尖端推理模子。本文援用地点：科创板日报、新浪科技报道，李飞飞团队的s1模子并非重新练习，而是树立在阿里巴巴的Qwen2.5 跟 Google DeepMind的Gemini 2.0 Flash Thinking的基本之上。他们收集了1000个经心筛选的成绩及其解答，并经由过程记载 Gemini 2.0 Flash 的思考进程，树立练习材料集，应用这些材料，微调了Qwen2.5-32B-Instruct模子，发明出s1。年夜陆某著名年夜模子公司CEO表现，李飞飞团队的成绩现实上是应用从 Google 模子中撷取的 1000 个样原来微调通义千问模子。这种微调的本钱诚然昂贵，但其优良表示仍有赖于既有模子的基本。上海交通年夜学人工智能学院副教学谢伟迪指出，s1以通义千问模子为基本，因而即便应用无限的样本材料，也能发生新的推理模子。但是，假如调换其余基本模子，新模子的效力并不会晋升。因而，真正在背地施展效力的要害是Qwen模子，而非 s1。阿里云证明，李飞飞团队经由过程应用阿里开源的Qwen2.5-32B-Instruct模子停止监视微调，在16个英伟达H100 GPU上仅破费26分钟就练习出s1-32B模子，其数学跟编码才能与OpenAI o1跟DeepSeek R1等尖端推理模子并驾齐驱。

上一篇：昌盛智能AI PC、OPS、MINI PC及嵌入式主板等多款新

下一篇：没有了