资讯

【新智元导读】Google双线出击!T5Gemma重燃encoder-decoder架构战火,性能暴涨12分;MedGemma坚守decoder-only路线,强攻医疗多模态,击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化,打响Google开 ...
在AI界掀起波澜的最新动态中,谷歌以双重策略震撼了大模型战场。一方面,T5Gemma的横空出世重新点燃了encoder-decoder架构的战火,性能实现了显著提升;另一方面,MedGemma则坚守decoder-only路线,强势进军医疗多模态领域,打破了闭源壁垒。
自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图,缺乏真正 读懂图像与文本、在多模 ...
微软本周宣布推出可在PC机或边缘设备执行的38亿参数推理模型Phi-4-mini-flash-reasoning,以新的混合架构提升性能,低延迟性与推理能力兼备。
作者:田小幺编辑:李宝珠转载请联系本公众号获得授权,并标明来源NVIDIA 的研究团队联合加拿大魁北克人工智能研究所 Mila 提出了 La-Proteina,这是一种基于部分潜在流匹配的原子级蛋白质设计方法。它能够有效结合显式的 backbone ...
中国软件行业协会常务副秘书长陈宝国先生作大会开幕致辞,陈宝国秘书长指出AI技术正加速推动智能终端成为人机交互核心入口,带动移动服务生态从“流量驱动”向“场景驱动”转型。高度肯定了快应用智慧服务生态在AI赋能背景下展现出的生命力,快应用正迈向“主动服务”新阶段,实现更智能、更精准的服务体验。协会将持续支持快应用标准制定、技术创新与生态协同方面发挥桥梁作用,推动产业开放共赢发展。
【飞桨学习赛:遥感影像地块分割】22年7月第一名方案,可提供复现精度66.18分,项目亮点:全程基于PaddleSeg开发,有效的数据增强手段,有效的数据集处理手段,基于SegFormer的Decoder更改。 - lzzzzzm/Classification-RSImage ...
自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图,缺乏真正 读懂图像与文本、在多模 态上下文中推理并创作 的能力。 能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作 ,一直是学术界和工业界关注的热门问题。
一直以来,Nullmax 专注于打造以纯视觉为核心的平台化辅助驾驶方案。在前沿技术引领方面,Nullmax团队研究成果已多次入选国际顶会 CVPR、ECCV 与 ...
一名KAIST副教授承认在一篇即将发表于国际机器学习大会(ICML)的论文中使用了隐藏指令。他表示,该论文将被主动撤稿。KAIST校方称此前对此毫不知情,坚决不容忍此类做法,并将着手制定AI使用规范。
最近,Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务,OpenAI ...
AI领域日新月异,几乎每天都有新模型发布或更新。对于开发者、研究者或是科技爱好者来说,“最新AI模型哪里看”成了高频搜索词。如何高效、全面地追踪这些前沿动态,避免淹没在信息洪流中?1. 官方渠道:源头活水,但需“跑断腿”GitHub Stars & ...