Optimization - 搜索 News

嘿，看来美国联邦雇员的周末被“点名”搞得有点热闹！2月22日（周六），他们突然收到一封来自人事管理办公室（OPM）的邮件，要求在周一（2月24日）晚上11:59前，用5个要点列出上周的“丰功伟绩”——别带机密信息哦！这封邮件可是埃隆·马斯克和特朗普政 ...

腾讯网8 小时

DeepSeek究竟创新了什么？

1. DeepSeek大模型采用更高效的模型架构方法、训练框架和算法，是巨大的工程创新，而非颠覆式创新。 2. 尽管DeepSeek在某些方面超越了OpenAI，但整体而言OpenAI仍然领先，尤其在推理模型和多模态方面。 3.

2 天

出人意料！DeepSeek-R1用的GRPO其实没必要？规模化强化学习训练用PPO就 ...

阶跃星辰与清华大学近期的一项研究发现，只需使用带 GAE （λ= 1，γ= 1）的普通 PPO 以及基于规则的简单奖励函数，无需任何 KL 正则化，就足以扩展在推理任务上的响应长度和基准性能，类似于在 DeepSeek-R1-Zero 上观察到的现象 ...

1 天

仅需10美元！研究员通过强化学习复现DeepSeek顿悟时刻

近日，来自荷兰阿姆斯特丹的研究人员Raz成功以仅10美元的成本复现了DeepSeek中的‘顿悟时刻’，这一突破引发了广泛关注。这一成果不仅突破了以往高成本的限制，更为强化学习在小型计算资源环境中的应用提供了新的可能性。

红板报 on MSN3 天

Npj Comput. Mater.: 进化引导的贝叶斯优化：带约束多目标优化

海归学者发起的公益学术平台分享信息，整合资源交流学术，偶尔风月 ...

4 天

佛山智能装备院新突破：机器人领域重磅研究成果录用IEEE国际期刊

2025年2月19日，佛山智能装备技术研究院（下称“智能装备院”）迎来了一个振奋人心的时刻，其研究成果“An Analytical Approach for Dealing with Explicit Physical Constraints in ...

China Economic Net1 天

China launches innovation challenge event to boost computing power infrastructure

BEIJING, Feb. 21 (Xinhua) -- China's Ministry of Industry and Information Technology has launched an innovation challenge activity to accelerate the application of innovative technologies and products ...

中华网2 天

在AI结果中的“软广”？浅谈AI结果优化（AIRO）技术与服务形态

在AI结果优化 ...

什么值得买 on MSN8 天

英特尔IPO技术深度剖析一键解锁电脑性能优化游戏帧率新维度

近年来游戏画质与场景复杂度的飞速提升，使得玩家对硬件性能的需求日益高涨。为应对这一挑战，Intel推出了Performance Optimizati ...

1 天

DeepSeek崛起，如何影响AI技术发展路径与国际竞争格局？

2025年以来，中国人工智能初创企业深度求索（DeepSeek）迅速崛起，引发全球科技界、投资界与政策界热议——DeepSeek于2025年前后分别推出开源通用模型DeepSeek-V3与推理模型DeepSeek-R1，其在数学、编码、推理等方面的表现可以媲美甚至优于OpenAI等科技巨头推出的前沿模型，在硬件条件有限的情况下大幅提高训练效率并成功缩减算力成本。

3 天

VLM-R1引领视觉语言模型新纪元多模态AI迎来新突破

VLM-R1的成功推出不仅证明了 R1方法的通用性，也为多模态模型的训练提供了新思路，预示着一种全新的视觉语言模型训练潮流的到来。更令人振奋的是，该项目完全开源，感兴趣的开发者可以在 GitHub 上找到相关资料。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果