上下文 - 搜索 News

16 天

前不久，谷歌正式发布了其最新的人工智能模型套件Gemini 2.0。这一新的系列模型以其令人瞩目的速度和极高的上下文处理能力，再次引发了科技界的热议，成为了AI技术发展的一个重要里程碑。Gemini 2.0系列的推出，尤其是2.0Flash模型，其速度竟然比前一代提升了60倍，上下文处理长度增加了16倍，这无疑是在推动人工智能发展方面迈出了重要的一步。 Gemini 2.0包含了多个版本，分别定位 ...

2 天

辉达申请专利：利用扩散模型实现合成图像增强，精准保留上下文信息

近日，金融界爆出一条重磅消息：辉达公司申请了一项名为“使用扩散进行合成图像增强的上下文保留”的专利，公开号为CN119494786A。这项专利的申请日期为2024年8月，专利摘要显示，辉达提出了一种利用扩散模型生成合成图像的方法，旨在逼真地添加增强效 ...

13 天on MSN

Copilot 键引争议，微软拟在Win11 24H2中让其支持打开上下文菜单

IT之家 2 月 11 日消息，微软可能将在未来的 Windows 11 24H2 版本中允许用户重新映射 Copilot 键，这一功能源于部分用户对 Copilot + 笔记本电脑中 Copilot ...

来自MSN4 天

DeepSeek最新论文科普解读：NSA，物美价廉的超长上下文方案

DeepSeek在AI领域的发展一直备受关注，其最新论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse ...

4 天

DeepSeek新注意力机制引热议！梁文锋亲自提交预印本，目标明确降低 ...

实验表明，在解码64k上下文时，基于softmax架构的注意力计算占到总延迟的70%-80%。而在不影响性能的前提下，NSA在64k上下文的解码、前向传播和反向传播中均实现了显著加速。

腾讯网5 天

DeepSeek推出NSA机制提升长上下文训练与推理效率

PANews 2月18日消息， DeepSeek 宣布推出NSA（稀疏注意力机制），该机制与硬件高度一致且支持本机训练，旨在实现超快速的长上下文训练和推理。通过针对现代硬件的优化设计，NSA在加速推理速度的同时显著降低预训练成本，且不会影响模型性能。

5 天

DeepSeek发布最新技术论文，梁文锋是共创之一

2月18日，DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告，论文主要内容是关于NSA（Natively Sparse Attention，原生稀疏注意力），官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

5 天

DeepSeek宣布推出NSA：用于超快速长上下文训练和推理

开播时间 | 2-20 09:00 华夏基金：解盘一刻开播时间 | 2-20 09:00 光大证券雪姐：阳光早参-机器人大爆发！哪些环节有机会？开播时间 | 2-19 20:00 天弘基金：AI+投资新机遇，科技引领财富增长开播时间 | ...

on.cc東網5 天

DeepSeek新推NSA 用于超快速上下文训练及推理

内媒报道，DeepSeek于社交平台表示，推出NSA用于超快速的上下文长度训练和推理。DeepSeek称，NSA是一种与硬件一致且本机可训练的稀疏注意力机制，用于超快速的上下文长度训练和推理。

中华网5 天

DeepSeek发新成果稀疏注意力机制NSA显著提升长上下文处理速度

2月18日，DeepSeek团队发布了一篇新论文，介绍了一种改进的稀疏注意力机制NSA，适用于超快速的长上下文训练与推理。NSA以性价比极高的方式在训练阶段应用稀疏性，在训推场景中均实现速度的明显提升，特别是在解码阶段实现了高达11.6倍的提升。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果