复现 - Search News

16h

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文反驳涌现

结果，令人出乎意料的事情发生了：只用不到10美元的成本，他就在一个3B模型上复刻了DeepSeek的顿悟时刻。几乎就像是这个3B模型本身就具备了做出惊人事情的潜力，我们需要的，只是通过正确的方式赋予它一定的自主性而已。

近日，由九坤、微软亚洲研究院及其他独立研究人员共同撰写的一篇学术文章正式发布，标志着在深度强化学习领域的一次重要进展——DeepSeek-R1模型的成功复现。这一成果不仅推动了学术界对强化学习的理解，也为AI应用的普及提供了重要的资源和技术支持。

7hon MSN

九坤：复现 DeepSeek-R1 成果与难点

【九坤联合微软亚洲研究院等复现 DeepSeek-R1】2 月 24 日获悉，近日，九坤、微软亚洲研究院以及其他独立研究人员共同创作的一篇学术文章得以刊发，其核心内容为针对全面深入的类 R1 强化学习模型训练动态过程展开分析，首次实现了 ...

多家百亿量化加入AI战局！九坤携手微软复现，宽德发布AI人才招聘帖

值得注意的是，此前海外出现了一波复现DeepSeek的狂潮。回顾每次的复现过程，多个团队都发现了不同的规律和问题，比如来自清华、CMU和IN.AI的研究团队此前发现，可验证奖励函数对增长CoT至关重要，共同推动开源的DeepSeek不断强大。

全球热潮：九坤与微软亚洲研究院成功复现DeepSeek-R1

近日，科技圈炸开了锅，九坤团队与微软亚洲研究院、独立研究者们联手发表了一篇学术文章，突破性复现了DeepSeek-R1模型。该研究不仅深入探讨了类R1强化学习的训练动态过程，还向全球研究者展示了这一开源模型的强大潜力。DeepSeek的开源策略迅速引发全球业界对复现DeepSeek-R1的热情，成为科研圈的热议话题。

15hon MSN

九坤投资：复现 DeepSeek-R1 成果显著强化学习创新

【2 月 24 日，九坤投资与微软亚洲研究院刊文称首次复现 DeepSeek-R1 及提出技术创新见解】九坤投资在数据、算法、算力方面有强大储备和人才储备，近年持续在 AI ...

复现人手级运动能力！中国科大研发出19自由度假肢灵巧手

在临床测试中，一名60岁的女性截肢患者仅用半天时间便熟练掌握了该假肢灵巧手的使用，并成功完成了多项标准假肢手功能评估实验中的代表性任务，如抓握、操作、翻书、系扣等日常生活常见操作。

腾讯网5d

DeepSeek R1范式复现笔记

作者：yulei丨导语自DeepSeek ...

Hosted on MSN17d

50美元复现DeepSeek R1，李飞飞团队为何也选了阿里Qwen

春节期间，中国AI的技术变革在全世界掀起浪潮。继DeepSeek的低成本推理模型震惊硅谷和华尔街之后，昨日，李飞飞等斯坦福大学和华盛顿大学研究人员发布的最新研究成果再次引发业界热议：基于阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，仅使用16块H100 GPU，通过26分钟的监督微调，便打造出了性能卓越比肩OpenAI的O1和DeepSeek的R1等尖端推理模型的s1-32 ...

完美复现人类手部指令！傲意灵巧手亮相全球开发者先锋大会

2月21日，全球开发者先锋大会在上海徐汇开幕，傲意科技遥操作机器人系统亮相，该系统通过动捕手套捕捉人类手部动作并将其转化为控制指令，以远程操控机器人灵巧手。

Hosted on MSN2d

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤涌现

复刻DeepSeek的神话，还在继续。之前，UC伯克利的博士只用30美元，就复刻了DeepSeek中的顿悟时刻，震惊圈内。这一次，来自荷兰阿姆斯特丹的研究人员Raz，再次打破纪录，把复刻成本降到了史上最低—— ...

腾讯网1d

19自由度假肢灵巧手，复现人手级运动能力！ | 科技前线

人的手具有23个自由度，虽然重量仅约为人体重量的1/150，但是其运动功能占全身运动功能一半以上（54%）。手的灵活度是体现人类以及人形机器人工作能力的关键指标。中国科学技术大学及合作者成功研发了一套具备19自由度的轻质仿生灵巧手。它能复现人手级别的 ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results