GPT-4o mini,这是其迄今为止最小的AI模型,成本低于其全尺寸模型,性能优于GPT-3.5。
GPT-4o mini 性能如何?
GPT-4o mini 在业界公认的基准测试 MMLU(测量大规模多任务语言理解)中获得了 82% 的分数,该测试包含 57 个学科的 16,000 道多项选择题,旨在衡量推理能力。它的表现优于业界领先的小型 AI 模型 Gemini 1.5 Flash(得分 79%)和 Claude 3 Haiku(得分 75%)。它甚至超过了 OpenAI 的旗舰产品 GPT-3.5(在测试中得分仅为 70%),但没有击败 GPT-4o(得分为 88.7%)(具体来说,谷歌声称其 Gemini Ultra 得分为 90%)。
OpenAI 表示,其最新模型与 Gemini 1.5 Flash 和 Claude 3 Haiku 大小大致相同,但速度更快、成本更低。
据称,它比 GPT-3.5 Turbo 便宜 60%,运行速度快 2 倍,使其成为"包括许多消费者应用在内的速度相关用例的引人注目的产品",例如自动建议功能和数据分析任务。
OpenAI为什么要发布迷你AI模型?
由于运行更大、更先进的 AI 模型(例如 ChatGPT-4 Omni 或 Claude 3.5 Sonnet)的计算成本高得惊人,因此开发人员正在转向较小的模型,这些模型通常速度更快、更具成本效益,同时仍能够执行大量简单的任务。OpenAI 了解这一点,并发布了 GPT-4o mini,为开发人员提供轻量级且价格低廉的产品,使 AI 更易于访问,这与其更广泛的使命相一致:
"GPT-4o Mini 真正体现了 OpenAI 的使命,即让人工智能更广泛地为人们所用。如果我们希望人工智能惠及世界的每个角落、每个行业、每个应用,我们就必须让人工智能变得更加实惠。"