挑衅DeepSeeK 「AI教母」打造AI模子练习本钱没有到
发布时间:2025-02-09 08:34
DeepSeek劲敌来了! 被誉为「AI教母」的著名华侨美籍迷信家李飞飞引导的团队,以低于50美元的云盘算本钱,胜利练习闻名为「s1」的人工智能推理模子。 此模子在数学跟编码才能考试中的表示,据称媲美OpenAI o1跟DeepSeek R1等尖端推理模子。本文援用地点:科创板日报、新浪科技报道,李飞飞团队的s1模子并非重新练习,而是树立在阿里巴巴的Qwen2.5 跟 Google DeepMind的Gemini 2.0 Flash Thinking的基本之上。 他们收集了1000个经心筛选的成绩及其解答,并经由过程记载 Gemini 2.0 Flash 的思考进程,树立练习材料集,应用这些材料,微调了Qwen2.5-32B-Instruct模子,发明出s1。年夜陆某著名年夜模子公司CEO表现,李飞飞团队的成绩现实上是应用从 Google 模子中撷取的 1000 个样原来微调通义千问模子。 这种微调的本钱诚然昂贵,但其优良表示仍有赖于既有模子的基本。上海交通年夜学人工智能学院副教学谢伟迪指出,s1以通义千问模子为基本,因而即便应用无限的样本材料,也能发生新的推理模子。 但是,假如调换其余基本模子,新模子的效力并不会晋升。 因而,真正在背地施展效力的要害是Qwen模子,而非 s1。阿里云证明,李飞飞团队经由过程应用阿里开源的Qwen2.5-32B-Instruct模子停止监视微调,在16个英伟达H100 GPU上仅破费26分钟就练习出s1-32B模子,其数学跟编码才能与OpenAI o1跟DeepSeek R1等尖端推理模子并驾齐驱。