Uber近期在印度实施了一项创新举措,旨在利用共享乘车和外卖司机的空闲时间,通过其应用程序参与数据整理与信息搜集工作。这一创新服务由Uber AI解决方案的全球领航者Megha Yethadka在职业社交平台LinkedIn上揭晓。Yethadka强调,许多司机在日常运营中存在空闲时段,或是希望在夜晚增加额外收入。
这项新推出的工作任务种类繁多,涵盖照片审核、物体计数、文本分类、音频录制以及收据数字化等。Yethadka指出,这些任务将惠及Uber的全球企业客户,助力他们开发先进的生成式人工智能模型或消费应用。她还透露,这些任务以往是由独立承包商在应用外完成的,但初步成果十分乐观,Uber期待将这一服务推向更广阔的市场,并暗示可能在全球范围内进行推广。
Uber印度及南亚地区的负责人Prabhjeet Singh表示,目前这项创新服务已在12个城市上线,并有“成千上万”的司机开始执行Uber所称的“数字任务”。这些司机正利用他们的碎片时间为技术进步贡献力量。
Uber的首席执行官Dara Khosrowshahi在8月的财报电话会议中谈及,推出数字任务是基于Uber将任务分配给全球参与者的核心能力。他预测,未来会看到不同类型的参与者为全球AI的蓬勃发展贡献力量。Khosrowshahi对这一创新举措充满信心。
Uber在同一天还宣布了一项关于数据存储的重大进展——运营着一个规模达到350PB(拍字节)的数据湖。为了保障数据安全,Uber还开发了一款名为“HiveSync”的工具。据Uber工程团队的公告介绍,以往Uber的数据基础设施在两个数据中心区域间运行以确保冗余,但这一模式导致第二个区域在运行时未被有效利用,增加了不必要的成本。
为解决这一问题,Uber启动了“单区域计算”(SRC)计划,将所有批量计算任务集中在一个区域内运行,并通过HiveSync将数据复制到第二个区域。HiveSync自2016年起由Uber开发,现已管理约300PB的数据,这些数据存储在80万张Hive表中,每天的数据复制量达到8PB。Uber计划将这一复制服务开源,并继续开发新功能,以满足日益增长的扩展性和低延迟需求。在Uber将批量数据分析和机器学习训练系统迁移到谷歌云的过程中,HiveSync发挥了关键作用。