阿布扎比人工智能企业G42近日宣布,正式推出名为NANDA87B的开源多语言模型。这款拥有87亿参数的模型以印地语和英语为核心开发,现已通过穆罕默德・本・扎耶德人工智能大学(MBZUAI)的Hugging Face平台向全球开发者开放权重文件,允许自由使用与二次开发。
该模型由MBZUAI联合G42旗下Inception公司及芯片制造商Cerebras共同研发,其技术架构基于Llama-3.170B模型优化而成。研发团队在超过650亿个印地语数据标记上完成训练,并采用定制化分词器提升处理效率。据介绍,这种设计使模型能更精准地识别印地语特有的语法结构与表达习惯。
G42印度业务负责人马努・贾因强调,这款模型承载着推动印度本土技术发展的战略意义。"印度需要掌握自主语言技术的世界级解决方案,NANDA87B的推出标志着这个进程的重要突破。"他透露,模型将重点支持教育、媒体娱乐和商业创新三大领域的应用开发。
技术文档显示,NANDA87B具备处理三种印地语变体的能力:包括标准书面语、日常口语以及融合英语的混合表达(Hinglish)。在功能测试中,该模型成功完成文本翻译、内容摘要、指令响应和语音转写等复杂任务。研发团队特别指出,模型内置了文化适配机制和安全过滤系统,确保输出内容符合当地社会规范。
支撑这项技术突破的是G42与Cerebras联合搭建的Condor Galaxy超级计算集群。该系统为模型训练提供了前所未有的算力支持,使得大规模多语言数据处理成为可能。MBZUAI基础模型研究所执行董事理查德・莫顿评价称,这次发布显著提升了先进语言技术的普及程度,"为全球使用人口最多的语言社区之一打开了高质量技术资源的大门"。
目前,开发者社区已开始基于NANDA87B进行应用开发。有技术人员测试发现,该模型在处理区域性方言和行业术语时表现出色,特别是在医疗、法律等专业领域的文本生成中展现出实用价值。随着开源生态的完善,预计将涌现出更多针对印度市场的定制化AI解决方案。











