近日,百度智能云在城市治理领域取得了突破性进展,其泛政多模态大模型正式参与到北京经开区的城市管理工作中。这一创新实践标志着多模态大模型首次在全域城市治理中发挥作用。
据了解,北京经开区借助百度智能云的技术力量,构建了一个智能化的城市治理平台。该平台通过算法分析,能够提取超过四千种城市治理要素的结构化数据,将监控视频转化为动态的事件流与数据流。这一转变使得城市治理问题能够被智能地发现、预警,并自动立案追踪,直至案件审核结案。这一流程的优化,极大地提升了城市治理问题的处置效率。
目前,该平台已经覆盖了北京经开区的全域视频,实现了对百余种城市治理场景的全天候监控。事件预警信息能够实时对接到经开区的治理链平台,治理问题能够智能流转,为城市管理相关部门提供了精细化、常态化、智能化的监管手段。这一创新实践得到了业界的广泛关注。
值得注意的是,百度智能云的“视频大模型全域智能训练赋能城市治理”案例已经被纳入“北京市人工智能赋能行业发展典型案例”。专家指出,大模型的应用将推动城市治理从传统的“经验驱动”模式转变为“智能驱动”模式,实现全域感知与精准决策。
吉林大学通信工程学院硕士生导师刘振泽表示,多模态大模型能够整合视频、传感器等多种数据,构建出“空天地”一体化的感知体系。他举例说,深圳的数字孪生底座就能够提前15分钟预警暴雨内涝,这一技术在实际应用中取得了显著成效。然而,刘振泽也指出,多模态大模型在应用中面临着一些技术挑战,如多源数据融合难度大、时空基准异构、语义碎片化等问题。
在技术层面,多源数据的融合是一个难题。由于数据的时空基准异构和语义碎片化,融合成本高昂。例如,南京的“城市之眼”项目就需要对物联数据和视频解析进行标准化协同处理。在人才培养方面,算力与人才瓶颈也显得尤为突出。智算人才结构性失衡,复合型“业务传译员”稀缺,这些问题都需要得到进一步的解决。
尽管面临挑战,但百度对多模态大模型的应用前景充满信心。百度副总裁阮瑜在之前的论坛上就表示,大模型在未来将在多模态交互、跨领域知识融合等方向上潜藏着海量的机遇。随着底模在算法效率、长文本理解、逻辑推理等能力上的持续突破,应用层将在更多场景中加速落地。