99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

湖倉一體:揭秘?cái)?shù)據(jù)湖架構(gòu)現(xiàn)代化之道

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-07-17 21:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Hebert W. Pereyra,IBM 杰出工程師,Hybrid Data Management首席架構(gòu)師

譯者:劉俊 ,IBM watsonx.data開發(fā)架構(gòu)師

北京2023年7月17日/美通社/ -- 數(shù)據(jù)湖誕生至今已有十多年的歷史,為全球一些最大的企業(yè)提供了數(shù)據(jù)分析的支持。然而,也有人認(rèn)為,絕大多數(shù)數(shù)據(jù)湖部署已經(jīng)演變成為"數(shù)據(jù)沼澤"。不論你站在哪一邊,現(xiàn)實(shí)情況是,這些系統(tǒng)中仍然承載著大量的數(shù)據(jù)。這些數(shù)據(jù)規(guī)模龐大,使得移動(dòng)、遷移或?qū)ζ溥M(jìn)行現(xiàn)代化都變得異常困難。

數(shù)據(jù)湖的巨大挑戰(zhàn):單一結(jié)構(gòu)的架構(gòu)問題

從較高層次來看,數(shù)據(jù)湖是一個(gè)大規(guī)模的單一數(shù)據(jù)存儲庫。數(shù)據(jù)可以以原始形式存儲,也可以經(jīng)過優(yōu)化,采用適合專用引擎使用的不同格式。

就Hadoop而言,它是最受歡迎的數(shù)據(jù)湖之一,通過使用開源軟件實(shí)現(xiàn)該存儲庫,并在通用硬件上運(yùn)行,可以以非常低的成本在系統(tǒng)中存儲大量數(shù)據(jù)。數(shù)據(jù)可以以開放的數(shù)據(jù)格式進(jìn)行持久化,從而實(shí)現(xiàn)了數(shù)據(jù)消費(fèi)的民主化,并通過自動(dòng)復(fù)制提供了高可用性的支持。默認(rèn)的處理框架具備從故障中恢復(fù)的能力。這無疑是與傳統(tǒng)分析環(huán)境有著顯著差異的重要轉(zhuǎn)變,傳統(tǒng)數(shù)據(jù)分析環(huán)境往往意味著供應(yīng)商鎖定以及無法處理大規(guī)模數(shù)據(jù)。

另一個(gè)出乎意料的挑戰(zhàn)是將Spark引入作為大數(shù)據(jù)處理框架。由于其支持?jǐn)?shù)據(jù)轉(zhuǎn)換、流式處理和SQL,它迅速獲得了廣泛的認(rèn)可。然而,它并未能與現(xiàn)有的數(shù)據(jù)湖環(huán)境友好共存,因此通常需要額外的專用計(jì)算集群才能運(yùn)行Spark。

我們將時(shí)間前移15年回到當(dāng)下,現(xiàn)實(shí)已經(jīng)清楚地表明了這項(xiàng)技術(shù)所涉及的權(quán)衡和妥協(xié)。其快速的采用意味著客戶很快失去了對數(shù)據(jù)湖中數(shù)據(jù)的追蹤。同樣具有挑戰(zhàn)的是,他們無法確定數(shù)據(jù)的來源、獲取方式以及在處理過程中的轉(zhuǎn)換方式。數(shù)據(jù)治理仍然是這項(xiàng)技術(shù)中尚未探索的領(lǐng)域。雖然軟件可能是開源的,但需要有人學(xué)習(xí)如何使用、維護(hù)和支持它。僅依賴社區(qū)支持并不能持續(xù)滿足業(yè)務(wù)運(yùn)營所需的響應(yīng)時(shí)間。高可用性通過復(fù)制實(shí)現(xiàn)則意味著需要更多磁盤上的數(shù)據(jù)副本,增加存儲成本,并導(dǎo)致故障更加頻繁。而高可用的分布式處理框架則意味著不得不在性能方面做出妥協(xié),以換取彈性(這將導(dǎo)致交互式分析和商業(yè)智能的性能嚴(yán)重下降)。

為何要對數(shù)據(jù)湖進(jìn)行現(xiàn)代化?

數(shù)據(jù)湖在特定的使用場景中已經(jīng)被證明是成功的。然而清楚的是,企業(yè)迫切需要對這些部署進(jìn)行現(xiàn)代化,保護(hù)基礎(chǔ)設(shè)施、技能和存儲在這些系統(tǒng)中的數(shù)據(jù)的投資。

在尋找答案的過程中,行業(yè)研究了現(xiàn)有的數(shù)據(jù)平臺技術(shù)及其優(yōu)勢。很明顯,有效的方法是將傳統(tǒng)的(或者說是遺留的)數(shù)據(jù)倉庫或數(shù)據(jù)集市的關(guān)鍵特性與數(shù)據(jù)湖的優(yōu)勢結(jié)合起來。以下幾個(gè)關(guān)鍵要素迅速浮出水面:

具備彈性和可擴(kuò)展的存儲,能夠滿足日益增長的數(shù)據(jù)規(guī)模需求。

采用開放的數(shù)據(jù)格式,使數(shù)據(jù)對所有人都可訪問,同時(shí)針對高性能進(jìn)行優(yōu)化,并具備良好定義的結(jié)構(gòu)。

開放的元數(shù)據(jù)(可共享),能夠支持多個(gè)消費(fèi)引擎或框架。

支持?jǐn)?shù)據(jù)更新(ACID特性)和事務(wù)并發(fā)處理。

綜合的數(shù)據(jù)安全和數(shù)據(jù)治理(如數(shù)據(jù)血緣、完整的數(shù)據(jù)訪問策略定義和執(zhí)行,包括地理分布)。

上述要素導(dǎo)致了湖倉一體的出現(xiàn)。湖倉一體是一種數(shù)據(jù)平臺,是將數(shù)據(jù)倉庫和數(shù)據(jù)湖的優(yōu)點(diǎn)融合在一起,形成統(tǒng)一、協(xié)調(diào)的數(shù)據(jù)管理解決方案。

利用watsonx.data來現(xiàn)代化數(shù)據(jù)湖的好處

站在當(dāng)下數(shù)據(jù)分析的十字路口,IBM的回應(yīng)是為企業(yè)提供watsonx.data解決方案。

站在當(dāng)下數(shù)據(jù)分析的十字路口,IBM的回應(yīng)是為企業(yè)提供watsonx.data解決方案,這是一個(gè)用于大規(guī)模數(shù)據(jù)管理的新型開放式數(shù)據(jù)存儲,允許企業(yè)在無需遷移的情況下圍繞、增強(qiáng)和現(xiàn)代化其現(xiàn)有的數(shù)據(jù)湖和數(shù)據(jù)倉庫。它支持開放式的多云與混合云,可以在客戶管理的基礎(chǔ)設(shè)施(本地或者私有云)和公有云上運(yùn)行。它建立在湖倉一體架構(gòu)之上,并嵌入了一整套解決方案(以及通用軟件堆棧),適用于所有形態(tài)。

與市場上的競品相比,IBM的方法基于開源堆棧和架構(gòu)。這些組件并不是新的,而是業(yè)界已經(jīng)廣泛使用的成熟組件。IBM關(guān)注它們的互操作性、共存性和元數(shù)據(jù)交換。用戶可以快速入門,從而大大降低了入門和使用的成本,因?yàn)槠渖蠈蛹軜?gòu)和基礎(chǔ)概念是大家熟悉且直觀的:

通過對象存儲實(shí)現(xiàn)開放的數(shù)據(jù)(和表格格式)

通過S3進(jìn)行數(shù)據(jù)訪問

使用Presto和Spark進(jìn)行查詢計(jì)算(SQL、數(shù)據(jù)科學(xué)、轉(zhuǎn)換和流處理)

通過Hive和兼容結(jié)構(gòu)實(shí)現(xiàn)開放的元數(shù)據(jù)共享

Watsonx.data為企業(yè)提供了一種保護(hù)他們在數(shù)據(jù)湖和數(shù)據(jù)倉庫數(shù)十年投資的方式,使企業(yè)可立即擴(kuò)展并逐步現(xiàn)代化其安裝,將每個(gè)組件專注于對企業(yè)最重要的使用場景。

一個(gè)關(guān)鍵的差異化因素是多引擎策略,允許用戶在統(tǒng)一的數(shù)據(jù)平臺上根據(jù)實(shí)際情況選擇適合的技術(shù)。watsonx.data使客戶能夠?qū)崿F(xiàn)完全動(dòng)態(tài)的分層存儲(以及相關(guān)的計(jì)算)。隨著時(shí)間的推移,這可以帶來非常顯著的數(shù)據(jù)管理和處理的成本節(jié)省。

如果最終企業(yè)的目標(biāo)是通過湖倉一體架構(gòu)來現(xiàn)代化現(xiàn)有的數(shù)據(jù)湖部署,那么watsonx.data則通過選擇計(jì)算方式來最小化數(shù)據(jù)遷移和應(yīng)用遷移,從而簡化了任務(wù)。

接下來可以做什么?

在過去的幾年里,數(shù)據(jù)湖在大多數(shù)企業(yè)的數(shù)據(jù)管理策略中發(fā)揮了重要作用。如果企業(yè)的目標(biāo)是對其數(shù)據(jù)管理策略進(jìn)行演進(jìn)并現(xiàn)代化為真正的混合分析云架構(gòu),那么IBM基于湖倉一體架構(gòu)構(gòu)建的新型數(shù)據(jù)存儲watsonx.data,則是值得企業(yè)考慮的技術(shù)選擇。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4533

    瀏覽量

    87490
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    528

    瀏覽量

    25996
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1473

    瀏覽量

    35050
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    軟通動(dòng)力攜手鴻萬聯(lián)亮相華為開發(fā)者大會2025

    近日,華為開發(fā)者大會 2025在東莞松山盛大舉行,軟通動(dòng)力攜子公司鴻萬聯(lián)深度參與會議。作為開源鴻蒙核心共建者,鴻萬聯(lián)集中展示了基于天鴻操作系統(tǒng)(SwanLinkOS)及天鴻智能
    的頭像 發(fā)表于 06-26 14:15 ?295次閱讀

    從接口到架構(gòu):工控一體機(jī)定制的深度技術(shù)剖析

    在工業(yè)4.0與數(shù)字轉(zhuǎn)型的浪潮中,工控一體機(jī)作為工業(yè)自動(dòng)與信息融合的核心載體,正通過深度定制技術(shù)重構(gòu)工業(yè)控制系統(tǒng)的底層邏輯。從硬件接口
    的頭像 發(fā)表于 06-17 16:47 ?155次閱讀

    萬聯(lián)攜手南方科技大學(xué)推動(dòng)開源鴻蒙生態(tài)發(fā)展

    近日,軟通動(dòng)力子公司鴻萬聯(lián)與南方科技大學(xué)攜手,開展了系列旨在推動(dòng)開源鴻蒙生態(tài)發(fā)展的活動(dòng)。在此期間,鴻萬聯(lián)見證了南方科技大學(xué)OpenHarmony技術(shù)俱樂部的成立。此外,在當(dāng)日舉辦的“2024
    的頭像 發(fā)表于 01-06 14:01 ?656次閱讀

    戴爾數(shù)據(jù)助力企業(yè)數(shù)字轉(zhuǎn)型

    在數(shù)字轉(zhuǎn)型的浪潮下,企業(yè)正面臨著前所未有的數(shù)據(jù)挑戰(zhàn)。從傳統(tǒng)的結(jié)構(gòu)數(shù)據(jù)到如今的非結(jié)構(gòu)數(shù)據(jù)、半
    的頭像 發(fā)表于 12-20 09:31 ?517次閱讀

    萬聯(lián)亮相OpenHarmony人才生態(tài)大會2024

    近日,由開放原子開源基金會指導(dǎo),OpenHarmony項(xiàng)目群工作委員會主辦的OpenHarmony人才生態(tài)大會2024在武漢隆重舉辦。軟通動(dòng)力子公司鴻萬聯(lián)作為OpenHarmony項(xiàng)目群A類捐贈(zèng)人
    的頭像 發(fā)表于 11-30 10:41 ?638次閱讀

    T-Core一體成型貼片電感的優(yōu)勢

    小型與集成化 : T-Core一體成型貼片電感采用先進(jìn)的制作工藝,能夠?qū)崿F(xiàn)超薄、小尺寸的設(shè)計(jì),非常適合現(xiàn)代電子產(chǎn)品對小型和集成化的需求。 這種小型
    發(fā)表于 11-13 22:22

    OBOO鷗柏丨PLC嵌入式工控一體機(jī)進(jìn)軍現(xiàn)代工廠產(chǎn)線電子看板市場

    OBOO鷗柏作為嵌入式工控一體機(jī)現(xiàn)代化品牌源頭工廠,將進(jìn)軍自動(dòng)機(jī)柜相關(guān)應(yīng)用場景的市場規(guī)劃,OBOO鷗柏工控一體機(jī),觸摸屏查詢一體機(jī)相關(guān)數(shù)字
    的頭像 發(fā)表于 11-13 12:28 ?549次閱讀
    OBOO鷗柏丨PLC嵌入式工控<b class='flag-5'>一體</b>機(jī)進(jìn)軍<b class='flag-5'>現(xiàn)代</b>工廠產(chǎn)線電子看板市場

    測控一體化閘門遠(yuǎn)程監(jiān)控運(yùn)維系統(tǒng)解決方案

    灌區(qū)通常需要根據(jù)灌區(qū)面積和用水需求進(jìn)行合理規(guī)劃,實(shí)現(xiàn)主干渠、支渠、斗渠各個(gè)閘門的合理部署,是現(xiàn)代化灌區(qū)的重要內(nèi)容。測控一體化閘門是種集成了測量和控制功能的現(xiàn)代化水工設(shè)施,不僅能夠?qū)崿F(xiàn)
    的頭像 發(fā)表于 09-30 17:03 ?656次閱讀
    測控<b class='flag-5'>一體化</b>閘門遠(yuǎn)程監(jiān)控運(yùn)維系統(tǒng)解決方案

    一體成型功率電感漏感原因大揭秘

    一體成型功率電感漏感原因大揭秘gujing 編輯:谷景電子 一體成型功率電感也就是我們常說的棒型電感,它在電子電路中扮演者非常重要的角色。在一體成型功率電感的實(shí)際應(yīng)用中,有時(shí)候可能會出
    的頭像 發(fā)表于 08-19 21:45 ?666次閱讀

    谷景揭秘一體成型電感外殼破了有影響嗎

    谷景揭秘一體成型電感外殼破了有影響嗎 編輯:谷景電子 一體成型電感作為電子電路中非常重要的種電子元器件,它對于維護(hù)整個(gè)電路的穩(wěn)定運(yùn)行有著非常重要的作用。在
    的頭像 發(fā)表于 08-14 20:45 ?671次閱讀

    一體成型電感感值低的原因

    12、谷景揭秘一體成型電感感值低的
    發(fā)表于 07-30 10:41 ?0次下載

    云邊一體化物聯(lián)網(wǎng)平臺如何實(shí)現(xiàn)?有什么功能

    響應(yīng)和全局管理。以下是實(shí)現(xiàn)云邊一體化物聯(lián)網(wǎng)平臺的般步驟和其主要功能: ?實(shí)現(xiàn)步驟 1. 架構(gòu)設(shè)計(jì): ??? 確定系統(tǒng)架構(gòu),包括云端和邊緣端的組件及其交互方式。 ??? 設(shè)計(jì)
    的頭像 發(fā)表于 07-29 14:34 ?815次閱讀

    安消一體化平臺建設(shè)方案

    與消防一體化平臺已成為迫切需求。本文古河云科技將詳細(xì)介紹針對企業(yè)安全生產(chǎn)和消防管理需求的一體化平臺建設(shè)方案。 首先,安消一體化平臺的系統(tǒng)架構(gòu)應(yīng)該包括前端展示層、后端
    的頭像 發(fā)表于 07-26 14:14 ?881次閱讀