资讯

近日,重庆市经济和信息化委员会公示2025年重庆市独角兽、潜在独角兽、瞪羚企业认定名单,亲笔签作为国内人工智能笔迹识别领域的领军企业,凭借卓越的技术创新实力、亮眼的市场表现,荣获重庆市瞪羚企业认定。
当 LLM 代码模型在 HumanEval 拿下 80+ 分,却在 LeetCode 真机上连错 40%,我们应该意识到:问题不在模型,而在“尺子”。本文拆解上海 AI Lab & 西交大最新研究 SAGA,看如何用“人机协作”把测试用例做成可度量、可规模化的 AI 产品,让评估从“玄学”变“科学”。