Mistral 推出其首个专业区域语言模型 Saba :专精阿拉伯语和印度起源语言
2025-02-19 06:55:31人工智能 IT之家 溯波(实习)
以 Saba 为代表的专精特定语言的较小模型,更适用于对文化背景、区域限定知识要求更高的场景。
最新 2 月 18 日消息,法国 AI 初创企业 Mistral AI 当地时间昨日宣布推出其首个专业区域语言模型 Saba。该模型在源自中东与南亚的精选数据集上训练,能以相对较小的规模为上述区域用户提供更准确、相关的回应。
Saba 模型参数规模为 32B,支持本地单 GPU 系统部署。Mistral AI 给出的数据显示 Saba 在阿拉伯语的模型基准测试中明显优于同参数规模的 Mistral Small 3 24B,在同更大参数模型的比较里也毫不逊色。
同时,由于中东与南亚持续不断的文化交流,Mistral Saba 除阿拉伯语语外也支持多种印度起源语言,尤其是以泰米尔语为代表的南印度达罗毗荼语系诸语种(最新注:该语系使用者总数达 2.5 亿人)。
Mistral AI 认为,要让 AI 无处不在就需要解决各种文化和语言问题。目前较大规模的通用模型在多种语言上都有良好表现,但缺乏语言细微差别、文化背景和深入的区域知识,无法为具有强大区域背景的用例提供服务,而这就是 Mistral Saba 等专精特定语言的较小模型的用武之地。
赞一个! ()
相关文章
- OpenAI 周活跃用户达 4 亿,高管称用户“口口相传”发现
- Figure AI 人形机器人多模态能力升级:“听懂”语音指令
- 李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业
- Spotify 启动 AI 配音有声书服务,29 种语言可供选择
- OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一
- 英伟达推出 Signs 平台:AI 突破美式手语学习,助力连接无
- 传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都
- 清华系团队 DeepSeek 版多模态生物医药大模型 BioMedG
- DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保
- 报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱