国产成a人片在线观看视频下载,厨房玩朋友,大又大又粗又硬又爽少妇毛片自己的妹妹自己操,午夜精品久视频在线观看丝袜美腿91a,精品爆乳一区二区三区无码A∨

阿里企業(yè)郵箱-阿里云企業(yè)郵箱-阿里郵箱企業(yè)版注冊-申請-升級-購買-續(xù)費(fèi)-開通-報價等服務(wù)。全國服務(wù)熱線:400-889-0304
行業(yè)動態(tài) 更新日志 熱門問題

業(yè)界最大數(shù)據(jù)湖0故障遷上阿里云

2024-11-13 11:14:23 1582
最近,小紅書技術(shù)團(tuán)隊完成了一件前所未有的壯舉: 一年內(nèi),把業(yè)界最大數(shù)據(jù)湖0故障遷上阿里云。

圖片

壯舉的背后意味著風(fēng)險和挑戰(zhàn)。

作為中國頭部互聯(lián)網(wǎng)公司之一,小紅書月活用戶已過3億,其數(shù)據(jù)湖存儲了過去11年的所有原始數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。近年來,隨著業(yè)務(wù)的高速增長,小紅書在線處理數(shù)據(jù)的需求不斷增加,同時離線處理所積累的歷史問題,也提高了切換的難度。

為此,2023年11月,小紅書共有1500人參與遷云項目——計劃一年內(nèi),把小紅書的數(shù)據(jù)湖搬上阿里云。

饒是如此,難度依舊超出想象。即便是業(yè)界體量最大的案例,也遠(yuǎn)小于小紅書的本次遷移。

圖片
*注:任務(wù)=數(shù)據(jù)處理過程(如,數(shù)據(jù)出入數(shù)倉就需要通過任務(wù)進(jìn)行調(diào)度)

// 拉著1500人一起開盲盒

2023年11月,項目組正式成立,在小紅書內(nèi)部出現(xiàn)了一種聲音,覺得這是個「推著推著就會不了了之的事」。

不看好的理由,來自于沉重的歷史包袱。

這是小紅書歷史上首次盤點(diǎn)公司數(shù)字資產(chǎn),過去11年發(fā)展歷程中積累了大量無主任務(wù)與不標(biāo)準(zhǔn)操作。即便前期做了取舍,仍需要大量治理。

即便壓力重重,團(tuán)隊還是在立項文檔的最后一行寫下了4個字,「干就完了」。

首先要解決的還是標(biāo)準(zhǔn)問題。

過去的數(shù)據(jù)平臺開發(fā)模式混亂,需要在遷移前把新的基礎(chǔ)環(huán)境搭建好,切換到自研平臺,統(tǒng)一開發(fā)標(biāo)準(zhǔn)。

其次根據(jù)標(biāo)準(zhǔn)進(jìn)行治理。

大家把這一過程形容為「拉著1500人一起開盲盒,如果不打開就不知道里面有多千奇百怪」。

以下是幾種典型:
· 引用自己寫的「野生」代碼
· 離線任務(wù)不按規(guī)范經(jīng)過數(shù)倉,直接訪問在線
· 源代碼已丟失、流程已丟失
· 交接好幾手,「跑很久沒掛,就一直沒管」

為此,小紅書幾大業(yè)務(wù)的負(fù)責(zé)人,把各自O(shè)KR的最重要一項列為遷云,開始為結(jié)果負(fù)責(zé)、推動問題解決。

數(shù)據(jù)平臺與業(yè)務(wù)技術(shù)的配合也變得更加緊密。

// 如果項目失敗,可能的原因是什么?

在遷云項目中,關(guān)鍵是「舍掉什么」以及「誰來拍板」,背后對應(yīng)著兩個「有限」:

1. 時間有限

量大,無法一次性全量遷移。

為此團(tuán)隊總結(jié)出了一套取舍的標(biāo)準(zhǔn):「長期無人維護(hù)、訪問,說明不重要」、「斷掉后沒有人舉手,說明不重要」。同時在測試環(huán)境中頻繁演練、迭代。

2. 準(zhǔn)確度有限

需要和項目驗(yàn)收方提前達(dá)成共識。
算法類:算法數(shù)據(jù)工程負(fù)責(zé)人驗(yàn)收。
報表類:由數(shù)據(jù)分析負(fù)責(zé)人驗(yàn)收。懂?dāng)?shù)據(jù),更易拉齊與收斂。

子城是小紅書遷云項目負(fù)責(zé)人,在他看來,這一次會議很關(guān)鍵,「跟算法數(shù)據(jù)工程負(fù)責(zé)人和DI負(fù)責(zé)人拉齊標(biāo)準(zhǔn)、一起排查驗(yàn)收,大大降低了驗(yàn)收環(huán)節(jié)的難度」。

// 到底還有多少問題需要解決?

完成治理后,項目在2024年5月正式進(jìn)入雙跑階段。作為切換到正式環(huán)境前最后的測試,是穩(wěn)定性最大的保障。需要把數(shù)據(jù)拷貝到阿里云,兩邊同時跑數(shù),驗(yàn)證正確性與及時性。

這一階段,需要解決的問題數(shù)不勝數(shù)。

類似「蜘蛛網(wǎng)」,數(shù)據(jù)從入倉到出倉,需要經(jīng)過一條漫長的鏈路,通過各種任務(wù)進(jìn)行處理,也在雙跑中帶來了三個問題:
一、在其中的網(wǎng)狀結(jié)構(gòu)中,下游數(shù)據(jù)會受到上游影響,一個小小的錯誤就會帶來很大的偏差,難以歸因;
二、算法具有隨機(jī)性,如果不跑就不知道會有什么問題;
三、現(xiàn)有的任務(wù)仍隨著業(yè)務(wù)的發(fā)展在快速新增,導(dǎo)致每次鏈路都會有所不同。

每周都會平均新增500多個問題,推進(jìn)起來十分緩慢。問題的積累最終造成了延期。問題很嚴(yán)峻,項目組開始了全面的復(fù)盤。

首先要做的仍然是頂層的取舍。

任務(wù)多,時間有限,則必須先解決最重要的問題。最終確定:高風(fēng)險任務(wù)>高優(yōu)任務(wù)>普通任務(wù)的判斷邏輯。

這一原則讓項目團(tuán)隊更明確需要重點(diǎn)解決的問題。

// 保障割接無故障

靈活的調(diào)整之下,進(jìn)度很快被追回。

團(tuán)隊士氣高漲,開始自發(fā)給自己提出了更高要求:把準(zhǔn)確度從90%提高到99%,進(jìn)度上要求自己提前1個月完成任務(wù),同時確保P2及以上的故障小于等于3個。

8月,項目結(jié)束雙跑,進(jìn)入割接階段。需要斷掉跑數(shù)過程,并在新云上觀察結(jié)果。一旦產(chǎn)生故障,不但影響用戶體驗(yàn),還會帶來直接的資產(chǎn)損失。最主要的目標(biāo)也因此從速度變成了質(zhì)量。

正式雙跑定在了9月,一周時間,所有人在會議室完成線下割接,一旦出現(xiàn)問題,就當(dāng)下立刻解決。

圖片
割接現(xiàn)場

阿里云團(tuán)隊也全程在現(xiàn)場保障。讓他們印象最深的是,「小紅書技術(shù)團(tuán)隊反應(yīng)速度很快,出現(xiàn)了問題,第二天就能閉環(huán)處理」。

在全力保障之下,團(tuán)隊順利完成了割接,沒有發(fā)生任何一個P2及以上故障。

// 客戶成功才是最大的價值

2024年11月,小紅書遷云項目正式宣告結(jié)束。在沒有故障的情況下,遷移數(shù)據(jù)500PB,任務(wù)11萬。參與人數(shù)1500人,涉及部門40多個。

遷移至阿里云上后,數(shù)據(jù)湖可通過多個OSS Bucket支持納入統(tǒng)一資源池,實(shí)現(xiàn)多個Bucket共享資源池內(nèi)的OSS吞吐及QPS能力。這樣的流控能力在面向小紅書復(fù)雜業(yè)務(wù)場景,可靈活調(diào)配資源,高效利用吞吐性能,降低不同業(yè)務(wù)租戶間的互相影響。

阿里云原生HDFS+DLF元數(shù)據(jù)可實(shí)現(xiàn)無縫對接Hadoop EMR體系,支持元數(shù)據(jù)線性擴(kuò)展能力,輕松應(yīng)對小紅書數(shù)百PB數(shù)據(jù)下的元數(shù)據(jù)線性增長。

在結(jié)項會議上,阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光分享了一個小故事。

他翻到了多年前的一次會議記錄。2021年的一次交流會議中,他和小紅書中臺技術(shù)負(fù)責(zé)人凱奇第一次談到了數(shù)據(jù)湖遷云的可能,三年后終于一起見證了小紅書的成長,與遷云項目的落地。

劉偉光說:「三年中小紅書發(fā)生了巨大的變化,到今天變成了一個國民級的APP,作為云廠商,客戶的成功也是我們最高興的事」。

對于小紅書遷云項目成員而言,他們也因?yàn)檫@個項目創(chuàng)造了歷史:第一次系統(tǒng)性盤點(diǎn)了小紅書十多年的數(shù)字資產(chǎn),第一次參與千人以上、涉及公司所有產(chǎn)品的項目,共同完成了業(yè)界最大體量的遷云項目。

這些第一次為大家?guī)砹恕感判摹沟奶嵘?/section>

有人說,「做完這個項目,再做任何事都不會怵了」。

在線咨詢
在線咨詢

特價熱線;400-889-0304

微信溝通,領(lǐng)取優(yōu)惠禮包

241600496ffEPp.jpeg

亚洲中文字幕不卡无码欧美亚洲| 在线看片毛片无码永久免费| 国产成人18黄网站在线观看软件_第1集| 久久夜色精品国产噜噜A v| 国产成人一区二区三区在线青青草视频| 亚洲精品综合一二三在线左左木希| 国产最新进精品视频1区2区3区| 亚洲乱码av中文一区二区| 久久99国产乱子伦精品免费,怡红院成永久免费| 精品久久久久久无码中文野结衣_久久激情| 久热国产在线视频3.| 人人妻人人澡人人爽人人精品97_亚洲一| 久久综合亚洲色一区二区三区精品丝袜| 伊人色婷婷综合在线网| 黑人英雄爱吃土豆西红柿口诀| 久久久国产99久久国产久麻豆动漫| 丰满人爽人妻A片二区动漫君冢日向| 五月色中文字幕精品| 俺去俺来也www色官网免费的| 久久精品人成免费一区二区三区| 狠狠色狠狠色综合日日不卡卡| 亚洲精品久久无码老熟妇| 中文乱码人妻系列一区二区手机在线| 综合色热一本加勒比| 激情视频在线观看赤裸特工| 日韩土豪美女在线视频观看网站| 欧美性大战久久久久久久性奴舵教| 成人嘿嘿视频网站在线播放| 日韩少妇内射免费播放18禁裸乳黄色毛片| 国产久久久久久无码黄| 久久天天躁夜夜躁狠狠综合2024| 99精品国产综合久久久久五月天网页版| 国产亚洲精品久久久久动| 亚洲va久久久噜噜噜久久男同 产中文av,亚va久久久久| 国产最新av永久网站在线播放| 在线精品国精品国产尤物884a| 久久久精品2019中文字幕之3_精品久久久久久| 欧洲日本黄色v| 人妻精品久久久久中文字幕69澎丹| 色戒一区二区三区| 日韩少妇内射免费播放18乳高潮|