Encoder - 搜索 News

资讯

Meta的Perception Encoder：从“我什么都不是”到“我什么都能做”的AI ...

他们开发的Perception ...

2 天

Google双线出击！T5Gemma重燃encoder-decoder架构战火，性能暴涨12分；MedGemma坚守decoder-only路线，强攻医疗多模态，击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化，打响Google开源反击战。

3 天

ICCV 2025满分论文：一个模型实现空间理解与主动探索大统一

针对这一问题，清华大学、北京通研院、北理工与北航的研究团队联合提出了一种统一空间理解与主动探索的新型模型。该方法使智能体能够在动态探索过程中逐步构建对环境的认知，从而实现更高效的空间感知与自主导航，为智能体在物理世界中的任务执行奠定了基础。

2 天

谷歌T5Gemma架构再创新，医疗AI迎来开源新时代！

在人工智能（AI）领域，谷歌近期推出的T5Gemma架构掀起了一阵波澜，标志着大模型战场的又一次变革。通过双重策略，谷歌不仅重燃了encoder-decoder架构的热情，同时也在医疗多模态领域开辟了新的局面。 T5Gemma：重启Encoder-Decoder架构自2023年以来，decoder-only架构几乎占据了大语言模型（LLM）的主流，从GPT系列到LLaMA、Gemma、Mistr ...

1 天on MSN

微软调整 Win11 24H2 装机策略：6 月起 36 款预装应用改为完整版

IT之家 7 月 16 日消息，微软公司今天（7 月 16 日）发布公告，表示自今年 6 月更新开始，已默认更新 Windows 11 24H2 和 Windows Server 2025 系统中预装应用至最新完整版本。 IT之家注：在 ...

1 天

我靠AI当上了网红

“之前生成式AI怎么变现？靠卖课。”这是行业内一句广为流传的热梗，但周鹏说这已成为过去式。他称今年很少有头部AI主播靠培训变现，因为AI生成的作品已然可以直接实现商业化。

1 天

自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来，文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图，缺乏真正读懂图像与文本、在多模态上下文中推理并创作的能力。能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作，一直是学术界和工业界关注的热门问题。

6 天

编码器-解码器架构的复兴？谷歌一口气发布32个T5Gemma模型

谷歌为此探索了上述的适应技术，其核心思想是使用已预训练的仅解码器模型的权重来初始化编码器-解码器模型的参数，然后通过基于 UL2 或 PrefixLM 的预训练进一步调整这些参数。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果