moonlight - 搜索 News

27 分钟on MSN

AI日报：DeepSeek开源大模型加速器FlashMLA；海螺AI推I2V-01-Director模型 ...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、DeepSeek开源周首日: ...

2 小时

开源赛道太挤了！月之暗面开源新版Muon优化器

上次是论文，两家几乎前后脚放出改进版的注意力机制，可参考《撞车 DeepSeek NSA，Kimi 杨植麟署名的新注意力架构 MoBA 发布，代码也公开》、《刚刚！DeepSeek 梁文锋亲自挂名，公开新注意力架构 NSA》。

2 小时

LGBTQ+游戏推荐哪个最热LGBTQ+游戏排行

在这篇文章中，读者将发现一份精心挑选的最热门LGBTQ+游戏排行榜。无论是寻找富有深度的角色故事，还是寻求包容性与多样性体验的游戏作品，都能在这里找到惊喜。无论你是游戏爱好者还是对这个群体文化感兴趣，这篇文章都将为你揭示当下最具影响力的 LGBTQ+ 游戏亮点。

腾讯网3 小时

月之暗面开源Moonlight：30亿/160亿参数混合专家模型

公司动态经济观察网讯 ...

4 小时

DeepSeek火爆全球！成huggingface最受欢迎开源大模型，AI行业迎变革？

近期，全球知名开源平台Huggingface上的一则消息引起了广泛关注。该平台联合创始人兼CEO Clement Delangue宣布，中国开源大模型DeepSeek-R1在短短时间内迅速崛起，成为Huggingface平台上最受欢迎的开源大模型之一 ...

5 小时

AI虽快却不准，OpenAI最新研究：当前模型难敌人类程序员

近期，OpenAI的首席执行官萨姆·奥尔特曼发表了一项大胆预测，他声称到今年年底，人工智能模型将超越“入门级”软件工程师的能力。然而，OpenAI内部研究人员的最新研究成果却给出了不同的答案。

头部财经6 小时

realme真我Neo7x手机全球首发第四代骁龙6处理器，2月25日发布

2 月 24 日消息，真我官方今日宣布，真我 Neo7x 将全球首发第四代骁龙 6 处理器，该处理器采用骁龙 8 Gen 3 同款微内核架构，先进 4nm 制程加持。

6 小时

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，训练大型语言模型（LLMs）已成为推动技术进步的重要方向。然而，随着模型规模和数据集的不断扩大，传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战，包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此，迫切需要更高效、更稳定的优化技术来应对这些复杂性。

6 小时on MSN

月之暗面Kimi发布Moonlight模型：参数高达30亿至160亿，性能大幅提升

近期，人工智能领域迎来了一项引人注目的技术创新。知名技术团队月之暗面Kimi发布了一项关于Muon优化器的新技术报告，并随之推出了名为“Moonlight”的混合专家模型（MoE）。这款模型在Muon优化器的基础上进行了训练，拥有30亿至160亿不等 ...

6 小时on MSN

月之暗面Kimi推出Moonlight：30 亿/160 亿参数混合专家模型

IT之家 2 月 24 日消息，月之暗面 Kimi 昨日发布了“Muon 可扩展用于 LLM 训练”的新技术报告，并宣布推出“Moonlight”：一个在 Muon 上训练的 30 亿 / 160 亿参数混合专家模型（MoE）。使用了 5.7 万亿个 ...

8 小时

英伟达确认RTX 5090和5070 Ti存在制造问题；月之暗面发布最新技术报告 ...

近日，英伟达确认发售了一些缺少渲染单元的RTX5090和RTX5070Ti GPU。这些GPU导致了包括启动驱动程序问题和一些电源连接器的熔化。英伟达全球公关总监Ben Berraondo表示，这些GPU的渲染输出单元比规定少一个，受影响的消费者可以联系主板制造商进行更换。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果