IT之家 2 月 24 日消息,月之暗面 Kimi 昨日发布了“Muon 可扩展用于 LLM 训练”的新技术报告,并宣布推出“Moonlight”:一个在 Muon 上训练的 30 亿 / 160 亿参数混合专家模型(MoE)。使用了 5.7 万亿个 ...
6 分钟on MSN
IT之家 2 月 24 日消息,月之暗面 Kimi 昨日发布了“Muon 可扩展用于 LLM 训练”的新技术报告,并宣布推出“Moonlight”:一个在 Muon 上训练的 30 亿 / 160 亿参数混合专家模型(MoE)。使用了 5.7 万亿个 ...
23 小时
来自MSN月之暗面开源MoE模型Moonlight【月之暗面开源MoE模型Moonlight】《科创板日报》23日讯,今天(23日)凌晨,月之暗面发布最新论文《Muon is Scalable for LLM ...
|2025年2月24日星期一|NO.1英伟达确认RTX5090和5070Ti存在制造问题近日,英伟达确认发售了一些缺少渲染单元的RTX5090和RTX5070TiGPU。NO.3OpenAI被曝2027年成本将高达200亿美元近日,据外媒报道,Ope ...
2025年2月24日,全球科技领域又迎来了一波重磅资讯,其中最引人注目的莫过于英伟达确认RTX 5090和5070 ...
月之暗面最新技术报告 —— 《Muon is Scalable for LLM Training》! 推出了一个全新的优化器 Muon,并基于此训练出了 3B/16B 参数的混合专家模型 (MoE)——Moonlight。这个 Moonlight ...
近日,月之暗面团队宣布其开源改进版的Muon优化器在算力需求上相较于传统优化器AdamW锐减48%。这一突破由OpenAI的技术人员提出的训练优化算法Muon演变而来,经过团队深入研究与优化,结果令人振奋。团队通过实验发现,Muon不仅在参数量最高达 ...
日前,卢伟冰开启了一场小米 15 Ultra 的爆料直播。直播中,卢伟冰透露了小米 15 Ultra 内部代号为「夜神」,将配备 1 英寸主摄和 2 亿大底长焦;新机无损焦段将覆盖 14mm 至 400mm。卢伟冰强调,小米 15 Ultra ...
(注:帕累托前沿是一个经济学和管理学中的概念,描述的是在多目标决策问题中所有可能的最优解的集合,这些解在多个目标之间取得了最佳平衡。在帕累托前沿上的每一个点,都意味着一个目标的改善必然以牺牲另一个目标为代价,因此它代表了在多个目标之间实现的最佳权衡。
(注:帕累托前沿是一个经济学和管理学中的概念,描述的是在多目标决策问题中所有可能的最优解的集合,这些解在多个目标之间取得了最佳平衡。在帕累托前沿上的每一个点,都意味着一个目标的改善必然以牺牲另一个目标为代价,因此它代表了在多个目标之间实现的最佳权衡。
日前,卢伟冰开启了一场小米 15 Ultra 的爆料直播。直播中,卢伟冰透露了小米 15 Ultra 内部代号为「夜神」,将配备 1 英寸主摄和 2 亿大底长焦;新机无损焦段将覆盖 14mm 至 400mm。卢伟冰强调,小米 15 Ultra 的目标是用光学解决手机夜拍短板,为此带来了端到端的「超纯光学系统」。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果