Encoder - 搜索 News

资讯

Meta的Perception Encoder：从“我什么都不是”到“我什么都能做”的AI ...

他们开发的Perception ...

2 天

Google双线出击！T5Gemma重燃encoder-decoder架构战火，性能暴涨12分；MedGemma坚守decoder-only路线，强攻医疗多模态，击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化，打响Google开源反击战。

3 天

ICCV 2025满分论文：一个模型实现空间理解与主动探索大统一

针对这一问题，清华大学、北京通研院、北理工与北航的研究团队联合提出了一种统一空间理解与主动探索的新型模型。该方法使智能体能够在动态探索过程中逐步构建对环境的认知，从而实现更高效的空间感知与自主导航，为智能体在物理世界中的任务执行奠定了基础。

2 天

谷歌T5Gemma架构再创新，医疗AI迎来开源新时代！

在人工智能（AI）领域，谷歌近期推出的T5Gemma架构掀起了一阵波澜，标志着大模型战场的又一次变革。通过双重策略，谷歌不仅重燃了encoder-decoder架构的热情，同时也在医疗多模态领域开辟了新的局面。 T5Gemma：重启Encoder-Decoder架构自2023年以来，decoder-only架构几乎占据了大语言模型（LLM）的主流，从GPT系列到LLaMA、Gemma、Mistr ...

1 天on MSN

微软调整 Win11 24H2 装机策略：6 月起 36 款预装应用改为完整版

IT之家 7 月 16 日消息，微软公司今天（7 月 16 日）发布公告，表示自今年 6 月更新开始，已默认更新 Windows 11 24H2 和 Windows Server 2025 系统中预装应用至最新完整版本。 IT之家注：在 ...

1 天

我靠AI当上了网红

“之前生成式AI怎么变现？靠卖课。”这是行业内一句广为流传的热梗，但周鹏说这已成为过去式。他称今年很少有头部AI主播靠培训变现，因为AI生成的作品已然可以直接实现商业化。

1 天on MSN

大模型“套壳”争议：自研与借力的边界何在？

在AI领域，一场关于“原研”与“套壳”的辩论再度升温，这次争议的焦点是华为盘古大模型与阿里云Qwen大模型之间的相似性。回溯至大模型兴起的初期，套壳行为还主要停留在对ChatGPT的简单模仿阶段，一些人通过调用ChatGPT的API，配以中文界面，就在微信等平台上售卖会员服务，从而踏上了AI领域的淘金之路。

1 天

自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来，文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图，缺乏真正读懂图像与文本、在多模态上下文中推理并创作的能力。能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作，一直是学术界和工业界关注的热门问题。

9 天

VLA爆发！从美国RT-2到中国FiS-VLA，机器人「即知即行」的终极进化

这构成了VLA动作层面的「自回归到扩散到混合」的演进路径，以及双系统层面的「非端到端到快慢松耦合到快慢紧耦合」的演进路径，不仅展现出VLA模型的强大适应性，也揭示了机器人智能从单一任务到通用能力的进化逻辑。

28 天

阿里云生物基础大模型登上Nature子刊！

19日，阿里云AI for Science研究成果生物大基础大模型LucaOne登上国际顶级期刊《Nature Machine Intelligence》。该模型的训练数据涵盖了超16万个物种12亿条核酸序列和6亿条蛋白序列，同时在训练时还引入了生物领域内基础的标签信息，让模型学习到丰富的生物信息。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果