资讯

微软本周宣布推出可在PC机或边缘设备执行的38亿参数推理模型Phi-4-mini-flash-reasoning,以新的混合架构提升性能,低延迟性与推理能力兼备。
自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图,缺乏真正 读懂图像与文本、在多模 ...
自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。但它们往往只能根据精确的文字或图片提示作图,缺乏真正 读懂图像与文本、在多模 态上下文中推理并创作 的能力。 能否让模型像人类一样真正读懂图像与文本、完成多模态推理与创作 ,一直是学术界和工业界关注的热门问题。
在AI界掀起波澜的最新动态中,谷歌以双重策略震撼了大模型战场。一方面,T5Gemma的横空出世重新点燃了encoder-decoder架构的战火,性能实现了显著提升;另一方面,MedGemma则坚守decoder-only路线,强势进军医疗多模态领域 ...
在人工智能(AI)领域,谷歌近期推出的T5Gemma架构掀起了一阵波澜,标志着大模型战场的又一次变革。通过双重策略,谷歌不仅重燃了encoder-decoder架构的热情,同时也在医疗多模态领域开辟了新的局面。 T5Gemma:重启Encoder-Decoder架构 自2023年以来,decoder-only架构几乎占据了大语言模型(LLM)的主流,从GPT系列到LLaMA、Gemma、Mistr ...
Google双线出击!T5Gemma重燃encoder-decoder架构战火,性能暴涨12分;MedGemma坚守decoder-only路线,强攻医疗多模态,击穿闭源壁垒。Gemma体系完成「架构+落地」双重进化,打响Google开源反击战。
一直以来,Nullmax 专注于打造以纯视觉为核心的平台化辅助驾驶方案。在前沿技术引领方面,Nullmax团队研究成果已多次入选国际顶会 CVPR、ECCV 与 ...