99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里巴巴再度開放一份計算機集群的真實數(shù)據(jù)集(Alibaba Cluster Data V2018)

vsUE_AI_Career ? 來源:lq ? 2018-12-25 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里妹導讀:打開一篇篇 IT 技術文章,你總能夠看到“大規(guī)?!薄ⅰ昂A空埱蟆边@些字眼。這些功能強大的互聯(lián)網(wǎng)應用,都運行在大規(guī)模數(shù)據(jù)中心上。數(shù)據(jù)中心每個機器的運行情況如何?運行著什么樣的應用?應用有什么特點?除了少數(shù)資深從業(yè)者之外,普通學生和企業(yè)的研究者很難了解其中細節(jié)。

今天,阿里巴巴再度開放一份計算機集群的真實數(shù)據(jù)集(Alibaba Cluster Data V2018)。該數(shù)據(jù)集中記錄了某個生產(chǎn)集群中服務器以及運行任務的詳細情況。我們希望這波數(shù)據(jù)的發(fā)布可以拉近我們與學術研究、業(yè)界同行之間的距離,推動產(chǎn)業(yè)的進一步發(fā)展。

下面,阿里系統(tǒng)軟件事業(yè)部的技術專家臨石,為大家深入介紹這份獨特的數(shù)據(jù)集。

2015 年,我們嘗試在阿里巴巴的數(shù)據(jù)中心,將延遲不敏感的批量離線計算任務和延遲敏感的在線服務部署到同一批機器上運行,讓在線服務用不完的資源充分被離線使用以提高機器的整體利用率。

經(jīng)過 3 年多的試驗論證、架構調整和資源隔離優(yōu)化,目前這個方案已經(jīng)走向大規(guī)模生產(chǎn)。我們通過混部技術將集群平均資源利用率從 10% 大幅度提高到 45%。另外,通過各種優(yōu)化手段,可以讓更多任務運行在數(shù)據(jù)中心,將“雙11”平均每萬筆交易成本下降了 17%。

那么,實施了一系列優(yōu)化手段之后的計算機集群究竟是什么樣子?混部的情況究竟如何?

為了讓有興趣的學生以及相關研究人員,可以從數(shù)據(jù)上更加深入地理解大規(guī)模數(shù)據(jù)中心,我們特別發(fā)布了這份數(shù)據(jù)集(Alibaba Cluster Data V2018)。數(shù)據(jù)集中記錄了某個生產(chǎn)集群中服務器以及運行任務的詳細情況。我們希望這波數(shù)據(jù)的發(fā)布可以拉近我們與學術研究、業(yè)界同行之間的距離。

在數(shù)據(jù)集中,你可以詳細了解到我們是如何通過混部把資源利用率提高到 45%;我們每天到底運行了多少任務;以及業(yè)務的資源需求有什么特點。如何使用這份數(shù)據(jù)集,完全取決于你的需要。

這個數(shù)據(jù)可以做什么?

這份 Alibaba Cluster Data V2018 包含 6 個文件,壓縮后大小近 50GB(壓縮前270+GB),里面包含了 4000 臺服務器、相應的在線應用容器和離線計算任務長達 8 天的運行情況。

通過這份數(shù)據(jù),你可以:

了解當代先進數(shù)據(jù)中心的服務器以及任務運行特點;

試驗你的調度、運籌等各種任務管理和集群優(yōu)化方面的各種算法并撰寫論文;

利用這份數(shù)據(jù)學習如何進行數(shù)據(jù)分析,揭示更多我們自己都未曾發(fā)現(xiàn)的規(guī)律。

上面這幾點,沒有接觸過類似數(shù)據(jù)的朋友,可能對于這份數(shù)據(jù)的用處并沒有直觀的印象,下面我舉幾個簡單的例子:

電商業(yè)務在白天和晚上面臨的壓力不同,我們如何在業(yè)務存在波峰波谷的情況下提高整體資源利用率?

你知道我們最長的 DAG 有多少依賴嗎?

一個典型的容器存在時間是多久?

一個計算型任務的典型存在時間是多少?一個 Task 的多個 Instance 理論上彼此很相似,但是它們運行的時間都一樣嗎?

實際上,學者們甚至可以用這些數(shù)據(jù)作出更加精彩的分析。2017年,我們開放的第一波數(shù)據(jù)(Alibaba Cluster Data V2017),已經(jīng)產(chǎn)生了多篇優(yōu)秀的學術成果。

以下是學者們在論文中引用數(shù)據(jù)(Alibaba Cluster Data V2017)的例子,其中不乏被 OSDI 這樣頂級學術會議收錄的優(yōu)秀文章。我們期待,未來你也能與我們共同分享你用這份數(shù)據(jù)產(chǎn)生的成果!

"LegoOS: A Disseminated, Distributed OS for Hardware Resource Disaggregation, Yizhou Shan, Yutong Huang, Yilun Chen, and Yiying Zhang, Purdue University. OSDI'18"(Best paper award!)

"Imbalance in the Cloud: an Analysis on Alibaba Cluster Trace, Chengzhi Lu et al. BIGDATA 2017"

"CharacterizingCo-located Datacenter Workloads: An Alibaba Case Study, Yue Cheng, Zheng Chai,Ali Anwar. APSys2018"

"The Elasticity and Plasticity in Semi-Containerized Co-locating Cloud Workload: aView from Alibaba Trace, Qixiao Liu and Zhibin Yu. SoCC2018"

Cluster Data V2018 更出色

新版本 V2018 與 V2017 存在兩個最大的區(qū)別:

DAG 信息加入

我們加入了離線任務的 DAG 任務信息,據(jù)了解,這是目前來自實際生產(chǎn)環(huán)境最大的 DAG 數(shù)據(jù)。

究竟什么是 DAG?離線計算任務,例如 Map Reduce、Hadoop、Spark、Flink 中常用的任務,都是以有向無環(huán)圖(Directed Acyclic Graph,DAG)的形式進行編排的,其中涉及到任務之間的并行、依賴等方面。下面是一個 DAG 的例子。

規(guī)模更大

上一版數(shù)據(jù)包含了約 1300 臺機器在約 24 小時的內容數(shù)據(jù),而新版 Cluster Data V2018 中包括了 4000 臺機器 8 天的數(shù)據(jù)。

我們建立了一個關于Cluster Data V2018的交流釘釘群。使用釘釘搜索群號:23112775,即可加入。點擊文末“閱讀原文”,可填寫調查問卷。

想看到更多數(shù)據(jù)?我們長期招收研究型實習生,與我們一起發(fā)現(xiàn)問題、解決問題,挑戰(zhàn)世界級技術問題,歡迎投遞簡歷:haiyang.dhy@alibaba-inc.com

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    13

    文章

    9795

    瀏覽量

    87966
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1638

    瀏覽量

    48240
  • 數(shù)據(jù)集

    關注

    4

    文章

    1224

    瀏覽量

    25446

原文標題:阿里重磅開源!4000臺服務器真實數(shù)據(jù)集,揭秘世界級數(shù)據(jù)中心

文章出處:【微信號:AI_Career,微信公眾號:人工智能見聞】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    普華基礎軟件蒞臨阿里巴巴達摩院調研交流

    近日, 普華基礎軟件股份有限公司(以下簡稱普華基礎軟件)董事、總經(jīng)理劉宏倩行前往阿里巴巴達摩院(杭州)科技有限公司(以下簡稱達摩院)調研交流,阿里巴巴集團高層及達摩院核心團隊參與了本次調研交流活動
    的頭像 發(fā)表于 04-08 10:10 ?534次閱讀

    Arm與阿里巴巴合作加速端側多模態(tài)AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發(fā)布與阿里巴巴淘天集團輕量級深度學習框架 MNN 的又新合作。
    的頭像 發(fā)表于 03-10 09:07 ?628次閱讀

    谷景阿里巴巴國際站正式上線

    在行業(yè)發(fā)展的關鍵節(jié)點,谷景電子取得了重大突破,谷景阿里巴巴國際站正式上線!此次上線聚焦電感領域,旨在為全球客戶提供更較大好的電感產(chǎn)品與服務,也標志著谷景電感業(yè)務在國際化道路上邁出了關鍵步。
    的頭像 發(fā)表于 02-26 09:44 ?438次閱讀

    阿里巴巴否認投資DeepSeek傳聞

    近日,市場流傳出則消息,稱阿里巴巴計劃向人工智能企業(yè)DeepSeek投資10億美元,意在獲取該公司10%的股份,并考慮將阿里云作為其首要推理算力平臺。此消息出,立即引起了市場的廣泛
    的頭像 發(fā)表于 02-10 09:10 ?578次閱讀

    阿里巴巴否認投資DeepSeek

    近日,有傳聞稱阿里巴巴計劃以100億美元的估值,投資10億美元認購中國AI初創(chuàng)企業(yè)DeepSeek的10%股權。然而,阿里高管顏喬迅速對此進行了否認,他表示:“同為中國杭州企業(yè),我們?yōu)镈eepSeek的成就鼓掌,但外界流傳的阿里
    的頭像 發(fā)表于 02-08 16:47 ?658次閱讀

    阿里巴巴出售高鑫零售股權,聚焦核心業(yè)務

    近日,阿里巴巴集團正式對外發(fā)布公告,宣布其子公司及New Retail與德弘資本達成了項重要協(xié)議。根據(jù)該協(xié)議,阿里巴巴將出售其所持有的高鑫零售全部股權,這些股權合計占高鑫零售已發(fā)行股份總數(shù)的約
    的頭像 發(fā)表于 01-02 10:54 ?452次閱讀

    阿里巴巴74億出售銀泰百貨予雅戈爾

    近日,電子商務巨頭阿里巴巴集團宣布了項重大決策,決定將旗下銀泰百貨的全部股權轉讓給由雅戈爾集團與銀泰管理團隊聯(lián)合組成的財團。這消息引起了業(yè)界的廣泛關注。 據(jù)悉,此次交易涉及的金額高達74億元
    的頭像 發(fā)表于 12-18 10:04 ?469次閱讀

    阿里巴巴將在美國推出AI電商工具PIC COPILOT

    人工智能領域的次重要嘗試,旨在利用先進的AI技術為美國電商市場提供更加智能化、便捷化的服務。該工具將深度融合阿里巴巴在大數(shù)據(jù)、云計算以及電子商務領域的深厚積累,通過智能算法和
    的頭像 發(fā)表于 12-06 10:52 ?1043次閱讀

    阿里巴巴整合電商資源,成立全新電商事業(yè)群

    業(yè)群將由蔣凡擔任CEO,直接向吳泳銘匯報。該事業(yè)群將全面覆蓋并整合阿里巴巴旗下的淘寶天貓集團、國際數(shù)字商業(yè)集團,以及1688、閑魚等核心電商業(yè)務。這整合舉措旨在打造個覆蓋國內外全產(chǎn)業(yè)鏈的綜合性業(yè)務
    的頭像 發(fā)表于 11-22 10:51 ?505次閱讀

    阿里巴巴國際站首推全流程AI產(chǎn)品

    近日,阿里巴巴國際站正式推出了其首個全流程AI產(chǎn)品——AI生意助手2.0。這創(chuàng)新產(chǎn)品的問世,標志著阿里巴巴在助力中小企業(yè)外貿(mào)經(jīng)營方面邁出了重要步。
    的頭像 發(fā)表于 10-30 16:12 ?747次閱讀

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設備和軟件程序。它在
    的頭像 發(fā)表于 10-14 14:02 ?1307次閱讀

    阿里巴巴計算入股蘇州語靈人工智能科技公司

    近日,國內云計算巨頭阿里巴巴計算有限公司(簡稱“阿里云”)在人工智能領域的布局再下城,宣布入股蘇州語靈人工智能科技有限公司(簡稱“蘇州語
    的頭像 發(fā)表于 08-30 18:03 ?2698次閱讀

    阿里巴巴完成雙重主要上市

    8月28日阿里巴巴在香港聯(lián)交所主板主要上市,成為在港交所、紐交所雙重主要上市的公司。如今,阿里巴巴完成雙重主要上市。 此外,有投資機構認為阿里巴巴最快有望于9月就納入港股通。 截至8
    的頭像 發(fā)表于 08-29 16:06 ?628次閱讀

    簡述微型計算機系統(tǒng)的組成

    微型計算機系統(tǒng),簡稱微機系統(tǒng),是硬件和軟件于體的復雜系統(tǒng),旨在高效處理信息、存儲數(shù)據(jù)和執(zhí)行用戶指令。下面將從硬件和軟件兩大方面對微型
    的頭像 發(fā)表于 08-22 12:37 ?8489次閱讀

    阿里巴巴季報出爐 阿里云二季度營收增長6%

    阿里巴巴季報出爐我們起來圍觀下,根據(jù)阿里巴巴集團發(fā)布的截至2024年6月30日的第二季度經(jīng)營業(yè)績數(shù)據(jù)顯示,
    的頭像 發(fā)表于 08-16 16:45 ?788次閱讀