ITBear旗下自媒体矩阵:

阿布扎比G42发布NANDA87B:87亿参数开源印英模型助力印度AI生态创新

   时间:2025-12-17 21:24:59 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

阿布扎比人工智能企业G42近日宣布,正式推出名为NANDA87B的开源多语言模型。这款拥有87亿参数的模型以印地语和英语为核心开发,现已通过穆罕默德・本・扎耶德人工智能大学(MBZUAI)的Hugging Face平台向全球开发者开放权重文件,允许自由使用与二次开发。

该模型由MBZUAI联合G42旗下Inception公司及芯片制造商Cerebras共同研发,其技术架构基于Llama-3.170B模型优化而成。研发团队在超过650亿个印地语数据标记上完成训练,并采用定制化分词器提升处理效率。据介绍,这种设计使模型能更精准地识别印地语特有的语法结构与表达习惯。

G42印度业务负责人马努・贾因强调,这款模型承载着推动印度本土技术发展的战略意义。"印度需要掌握自主语言技术的世界级解决方案,NANDA87B的推出标志着这个进程的重要突破。"他透露,模型将重点支持教育、媒体娱乐和商业创新三大领域的应用开发。

技术文档显示,NANDA87B具备处理三种印地语变体的能力:包括标准书面语、日常口语以及融合英语的混合表达(Hinglish)。在功能测试中,该模型成功完成文本翻译、内容摘要、指令响应和语音转写等复杂任务。研发团队特别指出,模型内置了文化适配机制和安全过滤系统,确保输出内容符合当地社会规范。

支撑这项技术突破的是G42与Cerebras联合搭建的Condor Galaxy超级计算集群。该系统为模型训练提供了前所未有的算力支持,使得大规模多语言数据处理成为可能。MBZUAI基础模型研究所执行董事理查德・莫顿评价称,这次发布显著提升了先进语言技术的普及程度,"为全球使用人口最多的语言社区之一打开了高质量技术资源的大门"。

目前,开发者社区已开始基于NANDA87B进行应用开发。有技术人员测试发现,该模型在处理区域性方言和行业术语时表现出色,特别是在医疗、法律等专业领域的文本生成中展现出实用价值。随着开源生态的完善,预计将涌现出更多针对印度市场的定制化AI解决方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version