资讯

第一视角是机器人在真实运行时唯一能获取的感知流,它决定了模型推理时的输入分布;第三视角则能完整捕捉人类或机器人全身的姿态骨骼和环境关系,为动作意图、路径规划提供清晰标签。
在深度学习的发展历程中,2017 年谷歌团队发表的《Attention Is All You Need》论文具有里程碑意义 —— 该论文提出的 Transformer ...
近期,来自清华大学、上海交通大学、北京华控智加科技有限公司和华北电力大学的研究者联合发布首个多模态工业信号基座模型 ...
阿里巴巴旗下的夸克在WAIC上发布了他们的首款自研AI眼镜。其采用双光机显示设计,镜腿前部相较其他AI眼镜更为纤细,大部分组件被放到了镜腿末端。据了解,这一AI眼镜将与阿里及支付宝生态融合,可使用支付宝“看一下支付”,具备通义千问大模型、夸克最新AI ...
在WAIC 2025大模型论坛上,商汤科技正式迈入具身智能领域,推出了名为“悟能”的具身智能平台。此举标志着商汤科技在AI技术的新一轮布局中,迈出了重要一步。
智东西7月25日消息,今天,前Meta员工沈俊潇(Shawn Shen)在海外社交媒体X上宣布,其和Enmin Zhou联合创立的Memories.ai,正式推出其 首款大型视觉记忆模型(Large Visual Memory Model) 。
研究团队开发了名为ETTIN的模型套件,这个名字来源于北欧神话中的双头巨人,完美象征了这项研究的核心思想。ETTIN套件包含了从1700万参数到10亿参数的五对模型,每对模型都像同卵双胞胎一样,拥有完全相同的"基因"(架构设计)、"营养"(训练数据) ...
Memories.ai联合创始人兼CTO Enmin ...