人工智能

开源新秀 Mistral Small 3：低延迟、高性能、Apache 2.0 许可，赋能 AI 应用

2025-02-03 08:11:53人工智能 IT之家故渊

科技媒体 marktechpost 昨日（1 月 31 日）发布博文，报道称 Mistral AI 发布了 Small 3（全称为 Mistral-Small-24B-Instruct-2501）模型，共有 240 亿参数，实现了先进的推理能力、多语言支持和便捷的应用集成，并在多个基准测试中取得了令人瞩目的成绩。

最新 2 月 1 日消息，科技媒体 marktechpost 昨日（1 月 31 日）发布博文，报道称 Mistral AI 发布了 Small 3（全称为 Mistral-Small-24B-Instruct-2501）模型，共有 240 亿参数，实现了先进的推理能力、多语言支持和便捷的应用集成，并在多个基准测试中取得了令人瞩目的成绩。

该模型基于 Apache 2.0 许可证发布，允许开发者自由修改、部署和集成到各种应用程序中，对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型，官方声称在相同硬件上，提供超过三倍的性能。

Small 3 模型针对本地部署进行高效优化，在 RTX 4090 GPU 或配备 32GB RAM 的笔记本电脑上也能通过量化技术流畅运行。

模型在多样化的指令型任务上进行了微调，实现了高级推理、多语言能力和无缝应用集成，凭借 32k 的上下文窗口，它擅长处理长篇输入，同时保持高响应速度。

该模型还包含 JSON 格式输出和原生函数调用等功能，使其非常适合对话和特定任务的实现。

Mistral-Small 模型在多个基准测试中表现出色，在特定任务中甚至可以媲美或超越 Llama 3.3-70B 和 GPT-4o-mini 等更大规模的模型。

开源新秀 Mistral Small 3：低延迟、高性能、Apache 2.0 许可，赋能 AI 应用