在直播行业蓬勃发展的当下,1.8亿实名开播账号与3880万名职业主播的规模背后,是千亿级终端需求的明确市场。然而,行业长期面临“手机直播画质不足、PC专业直播操作复杂且成本高昂”的双重困境。针对这一痛点,科技企业易思态(EastAI)凭借五年软硬一体技术研发积累,推出以“All-in-One硬件+AI专业导播+SaaS增值服务”为核心的三位一体解决方案,联合阿里云千问系列大模型能力,打造AI直播一体机及多品类智能终端,为直播、会议、教育等场景提供高效智能的技术支撑。
作为端侧AI技术创新的先行者,易思态的技术覆盖操作系统改造、音视频处理、模型端侧部署等关键领域。经过1800余天研发、17套平台方案优化、32次固件迭代,并通过3000余家硬件付费客户的验证,其首款量产产品P9 Max直播一体机正式落地。该设备在硬件层面搭载索尼IMX766大底传感器,配备5000万像素全像素全向对焦技术,从底层重构影像、音频、显示三大系统,直播画质可媲美苹果前置摄像头。接口方面,支持HDMI IN/OUT、USB3.0、全功能Type-C等全协议覆盖,兼容微单、无人机等专业设备,无需外设即可搭建复杂直播间。
软件体验上,全自研iDaobo智能导播系统将专业功能简化至“一屏操作”:美颜、机位切换、调音等核心功能三步完成,零基础用户1分钟即可开播。其背后依托阿里云视频大模型万相的深度赋能:AI提词器通过FunASR端侧ASR技术实现“字随音走”,解决主播忘词难题;直播间背景视频借助万相模型自动生成首尾帧衔接循环,无需专业团队即可打造沉浸式动态场景。翻译功能支持跨境直播的双向同传,实现“主播说中文、观众听英文、弹幕双语同步”,打破跨文化交流壁垒。
在生态构建方面,易思态以“技术落地+生态共建”为理念,将端侧AI音视频技术延伸至会议、通话等场景。在阿里云通义智能硬件展上,其通过实景AI直播间展示技术实力:P9 Max与阿里云无影数字人方案深度兼容,生态伙伴可快速落地数字人直播服务,覆盖虚拟主播生成、多语种播报、实时互动等全流程。目前,已有企业借助该方案推出数字人直播一体机,应用于电商带货、本地生活等领域,显著降低运营成本。
针对开发者合作,易思态提供“零开发接入”“浅层适配(3天上线)”“深度整合”三种模式,开放千问系列大模型技术能力。例如,品牌客户“必火智能”通过即插即用模式接入后,服务的本地生活商家月均曝光量提升超30万;数字人企业“开飞秒创”经浅层适配后,3天内完成多平台数据对接,实现场景全覆盖。在AI直播托管场景中,生态伙伴集成百聆大模型语义理解与TTS技术,实现直播内容自动生成、主播声音定制化播报,推动“无人值守直播”精准触达目标用户。
易思态联合合作伙伴推出双向同声传译耳机、双屏翻译机、同传手机等创新产品。耳机通过蓝牙协议改造支持全场景双向同传;双屏翻译机采用Gummy+Qwen-mt-plus双模型,适配酒店、展会等场景的实时对话需求;同传手机兼容所有通话、社交、会议类APP,全面支持远程沟通。这些产品均深度融合千问系列大模型能力,推动AI音频应用融入日常生态。
目前,易思态已形成toB与toC并行的商业模式:面向企业提供“PCBA+License”、纯License、整机贴牌等服务,通过“硬件为基、软件为魂、生态为翼”的发展格局,持续推动端侧AI音视频技术落地,助力产业升级与生活便利化。







