ITBear旗下自媒体矩阵:

亚马逊云科技再扩模型阵容:Qwen3与DeepSeek-V3.1上架,企业级功能助力生产应用

   时间:2025-09-19 19:37:36 来源:小AI编辑:快讯团队 IP:北京 发表评论无障碍通道
 

亚马逊云科技近日宣布,在旗下完全托管的AI模型服务平台Amazon Bedrock上新增五款开放权重模型,其中包括四款Qwen3系列模型和一款DeepSeek-V3.1模型。这是继年初上架DeepSeek-R1后,该平台再次引入中国技术团队开发的大模型,也是Qwen系列首次登陆Amazon Bedrock。此次扩展使平台上的开放权重模型阵容进一步壮大,目前全球用户均可通过亚马逊云科技服务使用这些模型。

新增的五款模型各具特色,针对不同应用场景进行了优化。Qwen3-Coder-480B-A3B-Instruct和Qwen3-Coder-30B-A3B两款模型专注于复杂软件工程领域,支持多种编程语言的代码生成与理解,并能自主调用外部工具和应用程序。Qwen-3-235B-A22B-Instruct-2507则是一款通用推理模型,采用“混合专家”(MoE)架构,在代码、数学和通用推理任务中表现优异,同时通过按需激活部分参数实现高效运行。Qwen3-32B(Dense)模型适用于计算资源有限的环境,提供稳定可预测的性能。

DeepSeek-V3.1模型拥有6850亿参数,每次任务仅调用相关知识部分,在保持强大性能的同时优化了运行成本。该模型在推理能力和Agentic技能方面较前代有显著提升,支持多语言处理,尤其在软件开发、数学推理和数据分析领域表现突出。它还能高效处理各类编程和技术挑战,适合构建AI Agents和流程自动化等任务。

这些模型具备处理长上下文窗口的能力,其中Qwen3-Coder-30B-A3B-Instruct和Qwen-3-235B-A22B-Instruct-2507可即刻处理高达262K token的上下文长度,相当于单次对话中处理约20万个字符或两部完整长篇小说的内容量。所有模型均支持多步骤工作流规划,可与工具和API集成,部分通用模型还提供“思考”和“非思考”推理模式。

亚马逊云科技强调,开放权重模型代表AI创新的重要前沿。公司不断投入资源,致力于成为安全、规模化且具有成本效益地运行这些模型的最佳平台。Amazon Bedrock总监Luis Wang指出,没有单一模型能适用于所有场景,许多客户偏好开源模型,因其提供更大的灵活性和定制空间。

与专有模型不同,开放权重模型允许开发者深入了解模型权重,根据需求进行定制。例如,在MoE架构下,客户可以查看激活的专家参数,从而推算算力和成本。这种透明性对部分客户至关重要。客户还能基于开放权重模型,利用自身数据进行二次训练,获得更大的灵活性。

通过Amazon Bedrock使用这些模型,客户可获得企业级安全保障,包括数据加密和严格的访问控制,确保数据隐私和合规要求。客户对其数据拥有完全控制权,亚马逊云科技不会与模型提供商共享客户的模型输入和输出数据,这些数据也不会用于基础模型的改进。客户还可设置安全保障措施,如Amazon Bedrock Guardrails来检测和防止模型幻觉。

值得注意的是,此次发布的Qwen3和DeepSeek-V3.1模型完整集成了Amazon Bedrock上的企业级功能,包括agent相关能力、Amazon Bedrock Guardrails和模型评估等。这与单纯提供模型下载或调用的服务有本质区别,Amazon Bedrock更注重帮助客户将模型真正应用到生产环境中。

目前,Amazon Bedrock不仅提供开源权重模型,也提供专业(商业)模型,如Amazon Nova和Anthropic Claude等闭源模型。通过与AI公司合作,该平台已提供超过一百个基础模型。亚马逊云科技大中华区产品部总经理陈晓建表示,此次发布进一步丰富了平台上的模型选择,能更好地服务全球客户。公司未来将继续扩展模型阵容,为更多客户提供就近服务。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version