DeepSeek的V3模型的最后一轮训练,仅用557.6万美元的GPU使用成本,就训练出了全球前沿模型,并在后续发布与OpenAI o1推理模型能力不相上下的DeepSeek ...