首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

肯睿Cloudera助力企業(yè)將AI與分析部署到開放式數據湖倉一體架構,統(tǒng)一企業(yè)數據

2024年9月3日 15:13  CCTIME飛象網  作 者:劉隸放

肯睿Cloudera大中華區(qū)技術總監(jiān) 劉隸放

肯睿Cloudera的客戶大多運行著龐大的數據湖,從而為關鍵大規(guī)模數據分析和AI用例(包括企業(yè)數據庫)提供助力。根據IDC發(fā)布的IDC MarketScape:中國實時湖倉市場2024年廠商評估》報告中的數據顯示,未來12個月,選擇外部合作來構建數據管理服務的企業(yè)比例將從58%快速增長至85%。數據量的快速增長、對數據管理需求的升級以及技術架構復雜度和獨立開發(fā)成本的上升,都將推動企業(yè)開始越來越多地考慮湖倉一體的管理解決方案。

肯睿Cloudera在平臺中提供Apache Iceberg能夠幫助用戶避免廠商鎖定,實現開放式湖倉一體架構。借助由Apache Iceberg支持的開放式湖倉一體架構,企業(yè)可以更好地利用分析和AI的力量。近日,肯睿Cloudera還宣布了現代化數據目錄和Iceberg REST集成這兩項關鍵增強功能更新,以加強元數據管理,進一步提高開放式數據湖倉一體架構內部的開放互通性,滿足數據全生命周期內日益增長的安全和治理需求。

將AI和分析部署到開放式數據湖倉一體架構中有諸多優(yōu)點,其主要優(yōu)勢之一是能夠將不同來源的數據集中到一個單一且連貫的存儲庫中。開放式數據湖倉一體架構融合了數據湖的靈活性,以及數據倉庫的結構化查詢功能,可以容納種類型、格式和速度的原始數據和處理后的數據。這種統(tǒng)一的數據環(huán)境不僅避免了維護獨立數據孤島的工作,還便于AI和分析應用無縫訪問數據。

肯睿Cloudera可助力企業(yè)充分利用開放式數據湖倉一體架構的以下優(yōu)勢:

數據湖和數據倉庫的集成:開放式數據湖倉一體架構整合了數據湖的存儲靈活性,以及數據倉庫的查詢性能和結構化查詢功能,實現了兩者的緊密結合。

開放性:開放式數據湖倉一體架構中的“開放”一詞指的是與各種數據處理框架、分析工具和編程語言的互通性和兼容性。這種開放性使數據科學家、分析師和開發(fā)人員能夠充分利用他們的首選工具和方法來探索、分析數據并從中獲得洞察,以更好地協作和創(chuàng)新。無論是基于SQL的傳統(tǒng)查詢、先進的機器學習(ML)算法,還是復雜的數據處理工作流程,開放式數據湖倉一體架構都能提供一個可適應各種分析工作負載的靈活、可擴展的平臺。

可擴展性和靈活性:與傳統(tǒng)數據湖一樣,開放式數據湖倉一體架構也能夠橫向擴展,容納來自不同來源的大量數據。它可以靈活存儲原始數據和處理后的數據,幫助企業(yè)適應不斷變化的數據要求和分析需求。隨著數據量增長和分析需求的變化,企業(yè)可以連續(xù)橫向擴展其基礎設施,以滿足不斷增加的數據攝取、處理和存儲需求。這種可擴展性確保了數據湖倉一體架構即使在數據復雜性和使用模式發(fā)生變化時,也能保持響應速度和性能。

統(tǒng)一的數據平臺:開放式數據湖倉一體架構作為數據存儲、處理和分析的統(tǒng)一平臺,減少了維護獨立數據孤島和ETL(提取、轉換、加載)流程的需要。將AI和分析部署到開放式數據湖倉一體架構中可以促進數據的民主化和自助式分析,讓整個企業(yè)的用戶都能夠自主訪問、分析數據并從中獲得洞察。通過提供統(tǒng)一、可訪問的數據平臺,企業(yè)能夠打破數據孤島、實現數據和分析工具訪問的民主化,并在各級培養(yǎng)數據驅動決策的習慣。這種數據和分析的民主化可提高企業(yè)的敏捷性和競爭力以及員工的協作能力和數據素養(yǎng)data-literate。

支持現代分析工作負載:開放式數據湖倉一體架構支持基于SQL的查詢和高級分析框架(如ML、圖形處理等),滿足了各種分析工作負載的需求,包括即席查詢(Ad Hoc Query)、復雜數據處理和預測建模等工作。

數據治理與安全:肯睿Cloudera近日發(fā)布的元數據管理解決方案的兩項關鍵增強功能,滿足了數據全生命周期內日益增長的安全和治理需求?项loudera的Iceberg REST Catalog集成允許使用第三方引擎無縫訪問Apache Iceberg表,幫助用戶在充分利用各種工具的同時,確保統(tǒng)一的安全性和治理。該集成能夠簡化數據訪問,并維持各個平臺上的數據權限和溯源,通過更大程度地減少獨立安全層數量來降低成本和數據泄露的風險。

此外,肯睿Cloudera的共享數據體驗(SDX)現已發(fā)布以云原生容器形式提供的技術預覽版,實現了端到端的統(tǒng)一數據安全、治理和元數據管理,并且已得到增強,具有更出色的彈性、擴展性和性能。SDX還提供各種工具的自助式數據訪問、通過整合安全功能,更大程度地降低違規(guī)風險,并支持覆蓋云和本地數據的統(tǒng)一視圖窗口管理。

開放式數據湖倉一體架構代表了一種現代化的數據管理和分析方法,助力企業(yè)充分挖掘其數據資產潛力的同時,實現開放性、可擴展性和互通性。

點擊此處了解有關肯睿Cloudera開放式數據湖倉一體架構的更多信息。

編 輯:路金娣
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網絡的實踐和展望
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像