OpenAI发布了其最新模型：GPT-4o mini-工具盒子

GPT-4o mini，这是其迄今为止最小的AI模型，成本低于其全尺寸模型，性能优于GPT-3.5。

GPT-4o mini 性能如何？

GPT-4o mini 在业界公认的基准测试 MMLU（测量大规模多任务语言理解）中获得了 82% 的分数，该测试包含 57 个学科的 16,000 道多项选择题，旨在衡量推理能力。它的表现优于业界领先的小型 AI 模型 Gemini 1.5 Flash（得分 79%）和 Claude 3 Haiku（得分 75%）。它甚至超过了 OpenAI 的旗舰产品 GPT-3.5（在测试中得分仅为 70%），但没有击败 GPT-4o（得分为 88.7%）（具体来说，谷歌声称其 Gemini Ultra 得分为 90%）。

OpenAI 表示，其最新模型与 Gemini 1.5 Flash 和 Claude 3 Haiku 大小大致相同，但速度更快、成本更低。

据称，它比 GPT-3.5 Turbo 便宜 60%，运行速度快 2 倍，使其成为"包括许多消费者应用在内的速度相关用例的引人注目的产品"，例如自动建议功能和数据分析任务。

OpenAI为什么要发布迷你AI模型？

由于运行更大、更先进的 AI 模型（例如 ChatGPT-4 Omni 或 Claude 3.5 Sonnet）的计算成本高得惊人，因此开发人员正在转向较小的模型，这些模型通常速度更快、更具成本效益，同时仍能够执行大量简单的任务。OpenAI 了解这一点，并发布了 GPT-4o mini，为开发人员提供轻量级且价格低廉的产品，使 AI 更易于访问，这与其更广泛的使命相一致：

"GPT-4o Mini 真正体现了 OpenAI 的使命，即让人工智能更广泛地为人们所用。如果我们希望人工智能惠及世界的每个角落、每个行业、每个应用，我们就必须让人工智能变得更加实惠。"