资讯

Google双线出击!T5Gemma重燃encoder-decoder架构战火,性能暴涨12分;MedGemma坚守decoder-only路线,强攻医疗多模态,击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化,打响Google开源反击战。
针对这一问题,清华大学、北京通研院、北理工与北航的研究团队联合提出了一种 统一空间理解与主动探索的新型模型 。该方法使智能体能够在动态探索过程中逐步构建对环境的认知,从而实现更高效的空间感知与自主导航,为智能体在物理世界中的任务执行奠定了基础。
在人工智能(AI)领域,谷歌近期推出的T5Gemma架构掀起了一阵波澜,标志着大模型战场的又一次变革。通过双重策略,谷歌不仅重燃了encoder-decoder架构的热情,同时也在医疗多模态领域开辟了新的局面。 T5Gemma:重启Encoder-Decoder架构 自2023年以来,decoder-only架构几乎占据了大语言模型(LLM)的主流,从GPT系列到LLaMA、Gemma、Mistr ...
IT之家 7 月 16 日消息,微软公司今天(7 月 16 日)发布公告,表示自今年 6 月更新开始,已默认更新 Windows 11 24H2 和 Windows Server 2025 系统中预装应用至最新完整版本。 IT之家注:在 ...
“之前生成式AI怎么变现?靠卖课。”这是行业内一句广为流传的热梗,但周鹏说这已成为过去式。他称今年很少有头部AI主播靠培训变现,因为AI生成的作品已然可以直接实现商业化。
在AI领域,一场关于“原研”与“套壳”的辩论再度升温,这次争议的焦点是华为盘古大模型与阿里云Qwen大模型之间的相似性。回溯至大模型兴起的初期,套壳行为还主要停留在对ChatGPT的简单模仿阶段,一些人通过调用ChatGPT的API,配以中文界面,就在微信等平台上售卖会员服务,从而踏上了AI领域的淘金之路。
自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图,缺乏真正 读懂图像与文本、在多模 态上下文中推理并创作 的能力。 能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作 ,一直是学术界和工业界关注的热门问题。
这构成了VLA动作层面的「自回归到扩散到混合」的演进路径,以及双系统层面的「非端到端到快慢松耦合到快慢紧耦合」的演进路径,不仅展现出VLA模型的强大适应性,也揭示了机器人智能从单一任务到通用能力的进化逻辑。
19日,阿里云AI for Science研究成果生物大基础大模型LucaOne登上国际顶级期刊《Nature Machine Intelligence》。 该模型的训练数据涵盖了超16万个物种12亿条核酸序列和6亿条蛋白序列,同时在训练时还引入了生物领域内基础的标签信息,让模型学习到丰富的生物信息。