4大特点解析华为云数据湖“黑科技”

时间：2018-11-08 13:48:38 来源：互联网编辑：星辉 发表评论无障碍通道

如果有人问数据湖是什么，我会告诉他们，是“桶装水”的集合。

随着企业业务的发展，数据出现井喷，数据量呈几何增长，数据来源和类型更加多元化。传统数据仓库就如同“桶装水商店”，已经承载不了全部水体，因此需要一个可以满足存储需求的，新的架构作为大数据的支撑。

这就是数据湖。它汇聚不同数据源的溪流，包括大量无序的非结构化数据(文本、图像、声音、网页等)。我们把它倒入数据湖，然后开始探索该数据。我们希望这是一个包含所有数据的，一个超快、易于访问的存储库，能解决集成难题的终极方法。

但实际上，存储库反而变成了一个缓慢、僵化的数据沼泽。大数据需要特殊的专长来分析数据。使用原始数据得出分析结论，将持续在数据质量和治理方面发出危险信号。业内给这种问题起了个名字，叫数据囤积障碍。

爆炸式增长的数据及数据孤岛

你应该明白了。只为了保存数据而存储数据，不是一个好主意。我们应该有一个明确的使用目的，然后只向数据供应链中导入相关的数据。当数据水库中的数据不再有用时，就直接丢弃它。没有必要把某个特别的应用程序生成的所有数据都存储下来。以物联网为例，传感器会产生奇大无比的数据量，但大多数时候其实我们只是在意一些极端值而已，比如温度超出了某个阈值范围。下图为某物联网公司的业务示意图。

首当其冲的挑战便是，数据存储、数据处理、AI组件众多。处理难度极大。

紧接着，数据孤岛问题接踵而至。

多种数据源，每种数据单独在一个库中，业务人员需要在应用层做数据集成/数据搬移，技能要求高，工程耗时长。

数据量日益增大，数据源日益增多，单个库扩容困难，性能下降，成本高，难以做跨市跨省等全量数据分析。

缺乏高级分析工具，前沿技术，如机器学习、图计算、深度学习等，未能充分利用多种数据深入挖掘价值。

用智能解决非智能

鉴于数据湖现状，我们如何利用它们为企业带来优势?这里是智能数据湖整体解决方案，包含四个关键的实践：融合，高效，易用，智能

融合——云化的hadoop

统一数据存储，再无数据孤岛;开放格式，丰富的数据类型：JSON, CSV, AVRO，图片，视频等;开放接口，兼容原生社区应用：100%兼容OBS和HDFS接口，总而言之，我们在数据湖中处理数据，试图找到新的洞察力。我们不会，任由数据处于最原始的格式，我们将优化数据。确保数据得到治理，确保数据在语义上一致，并满足业务的要求。

高效

一个字：快。实时数据实时分析， Apache CarbonData加速，万亿数据秒级响应

易用

做一个一站式、端到端开发工具，支持大数据+AI敏捷开发。可视化，代表丰富的可视化组件，图形化编辑界面，同时支持定制;而数据湖一站式开发工具，可管理多种大数据服务，实现跨服务作业编排调度;支持拖拉拽，预设10多种任务类型。

最后，对于数据标准，数据质量，数据安全的治理不可或缺。

数据湖治理：一站式治理平台(数据标准，数据质量，数据安全)

智能

重点绝不仅仅是数据，而是始终关于你要做什么工作。使用场合是什么，你可以运用什么应用程序来处理该数据以便从中受益——用智能实现高效。

智能元数据采集，统一数据视图

智能数据管理，无需人工拷贝

智能优化建议，免DBA

对数据进行“联系”，而不是“收集”。相比将数据转移到越来越大的集群或数据仓库，让数据待在数据湖进行智能化处理，来得更省钱、更容易也更高效。

如果想先试试效果，无论是企业用户，还是个人用户，华为云均提供了一组免费套餐，最高可免费试用60天，与此同时，华为云数据湖工厂(Data Lake Factory)2018年12月31日前提供免费试用，名额有限。

更多详细内容，欢迎访问：华为云官网 EI企业智能 EI大数据数据湖工厂DLF

【ITBEAR科技资讯】4月13日消息，近日，华为常务董事余承东与小米创始人雷军就手机支架的必要性展开了一场热烈的讨论，这场讨论也引发了网友的广泛关注。余承东在华为智界S7的发布会上表示，他最初对于车载手机支架的存在感到困惑，认为这是因为车载导航系统的功能不足

【ITBEAR科技资讯】4月12日消息，华为技术有限公司最近成功申请了一项重要的通信专利，该技术能有效保证信道占用时间的连续性，避免因跨信道占用时间而引发的数据丢失问题。据悉，此专利覆盖了一种全新的通信方法、装置、计算机可读存储介质以及程序产品。其核心技术在

【ITBEAR科技资讯】4月12日消息，前日夜间，大疆公司全新推出的Avata 2无人机正式亮相，为消费者提供了裸机及两种不同配置的电池套装选择。具体价格及配置如下：裸机版售价为2988元;单电池畅飞套装，内含飞行眼镜3、穿越摇杆3以及1块飞行电池，售价为5988元;而三电池畅

【ITBEAR科技资讯】4月11日消息，索尼官方今日正式公布，备受瞩目的2024年索尼电视及家庭影院新品发布会将于4月18日隆重举行。全球发布会将在零点准时开启，而中国区的发布会(直播)则定于晚20:00与大家见面。今年的发布会口号与去年“为娱乐而生”的主题有所不同，索尼

【ITBEAR科技资讯】4月11日消息，据相关媒体报道，阿里巴巴创始人马云今日在阿里内网发布了一篇名为《致改革致创新》的长文，对阿里巴巴过去一年的改革创新成果给予了高度评价。这也是马云自五年前退休以来的首次长篇分享，详细阐述了他对公司改革创新及展望未来的观点

【ITBEAR科技资讯】4月11日消息，近日有报道称，苹果的重要代工厂富士康或将迎来管理层的大调整。据悉，富士康正在积极探讨引入轮值CEO制度的可行性，此举被视为公司管理层改组的重磅策略，意在长远地培育公司领导人才。尽管轮值CEO制度在全球范围内并不十分普及，但行

作为家电领域德系匠心的代表，成立于1899年的美诺Miele，至今已走过125年的漫漫征途。百余年间，秉承“匠心品质，超越时代”这一刻入品牌DNA的精神，美诺不断突破自我，诠释卓越，以品质佳作，书写家电发展历史。“爱一事，终一生”，匠人精神无问东西。值此125周年之际

【ITBEAR科技资讯】4月10日消息，今日下午，字节跳动官方账号发布声明，针对媒体关于公司利润增长及数据的传言进行辟谣，明确表示相关报道不实。早前，有外媒报道称字节跳动在2023年的利润飙升约60%，甚至超过了腾讯控股和阿里巴巴集团控股的增长速度。这一消息似乎表明

【ITBEAR科技资讯】4月10日消息，近日，腾讯音乐娱乐集团(TME)与长城汽车联合举办了一场研讨会，并正式宣布启动战略合作。在这次合作中，腾讯音乐为长城汽车颁发了“AI 座舱先锋合作伙伴”证书，双方将共同致力于智能座舱中AI音频技术的研发与应用，通过TME旗下产品为车

【ITBEAR科技资讯】4月10日消息，近日，有知情人士透露，字节跳动在2023年的利润实现了惊人的增长，飙升约60%，这一数字不仅超越了腾讯控股和阿里巴巴集团控股的增长，更彰显了TikTok所有者在经济低迷时期的强大韧性。据悉，这家全球估值最高的初创公司，在过去一年中销

【ITBEAR科技资讯】4月10日消息，近日，台积电公布了其2024年三月份的营收情况以及一至三月的累计营收数据。据数据显示，三月份台积电实现了1952.11亿元新台币的营收，环比增长7.5%，同比增长更是高达34.3%。而在一至三月的累计营收方面，台积电累计实现了5926.44亿元新

【ITBEAR科技资讯】4月10日消息，LG电子近日宣布，已与企业工会就本年度薪水和福利待遇调整达成了一致意见，并在内部发布了相关公告。据悉，今年的平均工资涨幅定为5.2%，相比去年的6%略有下滑。这一调整方案不仅涉及到基础薪资的增长，还包括了追溯调整3月份的工资。对

【ITBEAR科技资讯】4月10日消息，美的集团与蔚来汽车在安庆的威灵汽车部件工厂达成了一项重要战略合作。两大行业巨头将在新能源汽车零部件、自动化技术服务、数字化建设等多个领域携手并进，共同探索低碳可持续园区及智慧物流的新路径。此次签约仪式得到了双方高层的高

【ITBEAR科技资讯】4月10日消息，金山办公在近期发布了一站式AI办公平台WPS 365，该平台全面覆盖了企业日常办公的基本需求，从文档创作到即时通讯、会议、邮件，再到AI应用，标志着文档处理套件正式升级为一站式AI办公。此次发布会上，金山办公推出了面向企业和组织的WP

【ITBEAR科技资讯】4月10日消息，近日有消息人士透露，京东近期在内部进行了多次讨论，重点探讨如何进军短视频领域。据称，京东高层已就此议题组织了多次小范围讨论，并最终达成共识，计划对短视频领域进行重大投入，其中包括高达10亿量级的现金补贴。此举意在顺应当前

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.