site:www.51cto.com - Search News

News

奥特曼反击挖走4人！Meta华人科学家在列，马斯克也躺枪

据《连线》杂志消息，OpenAI总裁Brockman在内部Slack当中表示，有4名新员工将加入OpenAI。被一波挖走8人之后，OpenAI对扎克伯格的“反击”来了。

CS专业变文科？18个月重编课程，教师血泪控诉：学生没AI只会发呆

在AI全面渗透教育系统的背景下，美国高校正重塑计算机科学课程，强调AI素养与批判性思维，甚至将CS向文科靠拢；而传统文科课堂也因AI生成内容的泛滥陷入考核危机。火了快30年的CS（计算机科学）专业，可能要被划到「文科专业」了。

还在为AI数据发愁？张文涛和鄂维南院士团队推出Data-centric AI系统

为此，张文涛和鄂维南院士团队提出了以数据为中心的 AI 系统 DataFlow。它系统实现了 100 余个基于规则、本地大模型或大模型 API 的数据治理算子（Operators），并在此基础上构建 8 条预设数据处理流水线（Pipeline），包括 ...

英伟达、港大等发布创新KV缓存，实现扩散模型无训练加速

尽管KV缓存机制显著提升了扩散语言模型的推理速度，但在并行解码时，生成质量往往会下降。这是因为扩散型模型在解码时假设了条件独立性，而实际上，标记之间可能存在复杂的依赖关系。这种依赖关系的破坏会导致生成文本的连贯性和准确性下降。

Transformer死角，只需500步后训练，循环模型突破256k长度泛化极限

本文，来自 CMU、 Cartesia AI 的研究者证明了通过简单的训练干预，循环模型是完全可以实现长度泛化的。只需 500 步后训练（约占预训练预算的 0.1%），就能让模型在高达 256k 长度的序列上实现泛化！

Transformer 为什么能颠覆AI？一文读懂"Attention Is All You Need" 精华

例如，在翻译句子时，当模型处理到句子中的某个动词时，它可以通过自注意力机制同时考虑与这个动词相关的主语、宾语等其他元素，从而更准确地理解句子的语义。自注意力机制的优势在于其能够捕捉长距离依赖关系。

Linux 启动漏洞可绕过现代 Linux 系统的安全启动保护

现代Linux发行版存在一个重大漏洞，攻击者通过短暂物理接触即可利用initramfs（初始内存文件系统）操控绕过安全启动（Secure Boot）保护机制。

12h

数学训练让AI变笨？强化学习与监督学习的差异

最近，研究人员发现了一个令人意外的现象：那些在数学推理任务上表现出色的AI模型，在处理其他类型问题时却频频"翻车"。更让人惊讶的是，不同的训练方法竟然会导致截然不同的结果——同样是数学训练，强化学习训练出来的模型能够"举一反三"，而监督学习训练的模型 ...

22h

开发者遭ChatGPT“赶鸭子上架”！AI编造假功能，结果吸引大量用户，不得不开发出来了

除此之外，早在2005年，他还开发了最早嵌入谷歌地图网站之一的chicagocrime.org（网站已不存在），《纽约时报》将其评为年度最佳创意之一；2004年，他开发了一个浏览器扩展组件，启发了Greasemonkey和“用户脚本”的诞生；2007 ...

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

除了被组织成计算模块外，该推理过程还展现出与句子间依赖关系相关的框架结构（图 6）。其中一个结构特征是包含错误提议、发现矛盾及最终解决的自我纠正模式。具体而言，模型最初提出「20 比特」的错误答案（第 12 句），随后决定重新核验。这导致与通过十进制转换计算得出的「19 比特」答案产生矛盾（第 43-44 句）。在重新核验支持「19 比特」答案的运算后，模型回到该矛盾点（第 65 ...

手握两大前端框架，Vercel 再出手拿下 Nuxt.js，对前端有什么影响？

7 月 8 日，Vercel 宣布收购 Nuxt.js 背后的核心团队 NuxtLabs。这不仅意味着 Vue 生态中最具影响力的全栈框架正式加入 Vercel，也标志着这家以 Next.js 闻名的前端平台，已同时掌握了 React 和 Vue 两大主流框架的服务端渲染解决方案。

22h

毕业7年，身价破亿！清北AI天团血洗硅谷，奥特曼被逼分天价股份

如今，清北复交浙大中科大等国内顶尖名校的毕业生，正纷纷成为硅谷头部AI公司中占据核心地位的一股力量，甚至成为「转会费」动辄上亿的天价「球星」。

Some results have been hidden because they may be inaccessible to you

Show inaccessible results