Optimization - 搜索 News

13 小时

近日，来自荷兰阿姆斯特丹的研究人员Raz成功以仅10美元的成本复现了DeepSeek中的‘顿悟时刻’，这一突破引发了广泛关注。这一成果不仅突破了以往高成本的限制，更为强化学习在小型计算资源环境中的应用提供了新的可能性。

出人意料！DeepSeek-R1用的GRPO其实非最优？规模化强化学习训练用PPO就 ...

机器之心报道编辑：PandaDeepSeek-R1 非常热门，而在其公布的训练配方中，GRPO（Group Relative Policy Optimization）非常关键，是 DeepSeek-R1 核心的强化学习算法。PPO 与 GRPO ...

21 小时

微信接入DeepSeek，两大隐秘商机浮现！

微信拥有13.82亿MAU的庞大体量，搜索功能的月活在中国更是首屈一指。然而，用户日均搜索次数却相对较低，如何将流量转化为商业价值成为业界关注的焦点。从短期来看，微信搜索已成为公众号内容的TOP1入口，视频号内容的TOP2入口。数据显示，用户收入阶层 ...

腾讯网14 小时

超频黑科技加持，纯白海景房的不二之选，技嘉Z890M 冰雕体验分享

随着英特尔新一代桌面端处理器酷睿Ultra 200S系列的发布，各大硬件厂商相继发布了使用了全新LGA ...

1 天

出人意料！DeepSeek-R1用的GRPO其实没必要？规模化强化学习训练用PPO就 ...

阶跃星辰与清华大学近期的一项研究发现，只需使用带 GAE （λ= 1，γ= 1）的普通 PPO 以及基于规则的简单奖励函数，无需任何 KL 正则化，就足以扩展在推理任务上的响应长度和基准性能，类似于在 DeepSeek-R1-Zero 上观察到的现象 ...

红板报 on MSN3 天

Npj Comput. Mater.: 进化引导的贝叶斯优化：带约束多目标优化

海归学者发起的公益学术平台分享信息，整合资源交流学术，偶尔风月 ...

China Economic Net23 小时

China launches innovation challenge event to boost computing power infrastructure

BEIJING, Feb. 21 (Xinhua) -- China's Ministry of Industry and Information Technology has launched an innovation challenge activity to accelerate the application of innovative technologies and products ...

腾讯网21 小时

关于微信接入DeepSeek，我们帮你研究了两大隐秘商机

就在这几天，微信开始灰度测试接入DeepSeek-R1模型，提供“深度思考”服务，用户可通过微信对话框顶部的“AI搜索”入口免费使用该功能，整合了微信公众号、视频号等腾讯生态内容及全网优质信息源。

16 小时

DeepSeek崛起，如何影响AI技术发展路径与国际竞争格局？

2025年以来，中国人工智能初创企业深度求索（DeepSeek）迅速崛起，引发全球科技界、投资界与政策界热议——DeepSeek于2025年前后分别推出开源通用模型DeepSeek-V3与推理模型DeepSeek-R1，其在数学、编码、推理等方面的表现可以媲美甚至优于OpenAI等科技巨头推出的前沿模型，在硬件条件有限的情况下大幅提高训练效率并成功缩减算力成本。

中华网1 天

在AI结果中的“软广”？浅谈AI结果优化（AIRO）技术与服务形态

在AI结果优化 ...

什么值得买 on MSN7 天

英特尔IPO技术深度剖析一键解锁电脑性能优化游戏帧率新维度

近年来游戏画质与场景复杂度的飞速提升，使得玩家对硬件性能的需求日益高涨。为应对这一挑战，Intel推出了Performance Optimizati ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果