探究京東咚咚架構(gòu)演進(jìn)
咚咚是什么?咚咚之于京東相當(dāng)于旺旺之于淘寶,它們都是服務(wù)于買家和賣家的溝通。 自從京東開(kāi)始為第三方賣家提供入駐平臺(tái)服務(wù)后,咚咚也就隨之誕生了。 我們首先看看它誕生之初是什么樣的。
1.0 誕生(2010 - 2011)
為了業(yè)務(wù)的快速上線,1.0 版本的技術(shù)架構(gòu)實(shí)現(xiàn)是非常直接且簡(jiǎn)單粗暴的。 如何簡(jiǎn)單粗暴法?請(qǐng)看架構(gòu)圖,如下。
1.0 的功能十分簡(jiǎn)單,實(shí)現(xiàn)了一個(gè) IM 的基本功能,接入、互通消息和狀態(tài)。 另外還有客服功能,就是顧客接入咨詢時(shí)的客服分配,按輪詢方式把顧客分配給在線的客服接待。 用開(kāi)源 Mina 框架實(shí)現(xiàn)了 TCP 的長(zhǎng)連接接入,用 Tomcat Comet 機(jī)制實(shí)現(xiàn)了 HTTP 的長(zhǎng)輪詢服務(wù)。 而消息投遞的實(shí)現(xiàn)是一端發(fā)送的消息臨時(shí)存放在 Redis 中,另一端拉取的生產(chǎn)消費(fèi)模型。
這個(gè)模型的做法導(dǎo)致需要以一種高頻率的方式來(lái)輪詢 Redis 遍歷屬于自己連接的關(guān)聯(lián)會(huì)話消息。 這個(gè)模型很簡(jiǎn)單,簡(jiǎn)單包括多個(gè)層面的意思:理解起來(lái)簡(jiǎn)單;開(kāi)發(fā)起來(lái)簡(jiǎn)單;部署起來(lái)也簡(jiǎn)單。 只需要一個(gè) Tomcat 應(yīng)用依賴一個(gè)共享的 Redis,簡(jiǎn)單的實(shí)現(xiàn)核心業(yè)務(wù)功能,并支持業(yè)務(wù)快速上線。
但這個(gè)簡(jiǎn)單的模型也有些嚴(yán)重的缺陷,主要是效率和擴(kuò)展問(wèn)題。 輪詢的頻率間隔大小基本決定了消息的延時(shí),輪詢?cè)娇煅訒r(shí)越低,但輪詢?cè)娇煜囊苍礁摺?這個(gè)模型實(shí)際上是一個(gè)高功耗低效能的模型,因?yàn)椴换钴S的連接在那做高頻率的無(wú)意義輪詢。 高頻有多高呢,基本在 100 ms 以內(nèi),你不能讓輪詢太慢,比如超過(guò) 2 秒輪一次,人就會(huì)在聊天過(guò)程中感受到明顯的會(huì)話延遲。 隨著在線人數(shù)增加,輪詢的耗時(shí)也線性增長(zhǎng),因此這個(gè)模型導(dǎo)致了擴(kuò)展能力和承載能力都不好,一定會(huì)隨著在線人數(shù)的增長(zhǎng)碰到性能瓶頸。
1.0 的時(shí)代背景正是京東技術(shù)平臺(tái)從 .NET 向 Java 轉(zhuǎn)型的年代,我也正是在這期間加入京東并參與了京東主站技術(shù)轉(zhuǎn)型架構(gòu)升級(jí)的過(guò)程。 之后開(kāi)始接手了京東咚咚,并持續(xù)完善這個(gè)產(chǎn)品,進(jìn)行了三次技術(shù)架構(gòu)演進(jìn)。
2.0 成長(zhǎng)(2012)
我們剛接手時(shí) 1.0 已在線上運(yùn)行并支持京東 POP(開(kāi)放平臺(tái))業(yè)務(wù),之后京東打算組建自營(yíng)在線客服團(tuán)隊(duì)并落地在成都。 不管是自營(yíng)還是 POP 客服咨詢業(yè)務(wù)當(dāng)時(shí)都起步不久,1.0 架構(gòu)中的性能和效率缺陷問(wèn)題還沒(méi)有達(dá)到引爆的業(yè)務(wù)量級(jí)。 而自營(yíng)客服當(dāng)時(shí)還處于起步階段,客服人數(shù)不足,服務(wù)能力不夠,顧客咨詢量遠(yuǎn)遠(yuǎn)超過(guò)客服的服務(wù)能力。 超出服務(wù)能力的顧客咨詢,當(dāng)時(shí)我們的系統(tǒng)統(tǒng)一返回提示客服繁忙,請(qǐng)稍后咨詢。 這種狀況導(dǎo)致高峰期大量顧客無(wú)論怎么刷新請(qǐng)求,都很可能無(wú)法接入客服,體驗(yàn)很差。 所以 2.0 重點(diǎn)放在了業(yè)務(wù)功能體驗(yàn)的提升上,如下圖所示。
針對(duì)無(wú)法及時(shí)提供服務(wù)的顧客,可以排隊(duì)或者留言。 針對(duì)純文字溝通,提供了文件和圖片等更豐富的表達(dá)方式。 另外支持了客服轉(zhuǎn)接和快捷回復(fù)等方式來(lái)提升客服的接待效率。 總之,整個(gè) 2.0 就是圍繞提升客服效率和用戶體驗(yàn)。 而我們擔(dān)心的效率問(wèn)題在 2.0 高速發(fā)展業(yè)務(wù)的時(shí)期還沒(méi)有出現(xiàn),但業(yè)務(wù)量正在逐漸積累,我們知道它快要爆了。 到 2012 年末,度過(guò)雙十一后開(kāi)始了 3.0 的一次重大架構(gòu)升級(jí)。
3.0 爆發(fā)(2013 - 2014)
經(jīng)歷了 2.0 時(shí)代一整年的業(yè)務(wù)高速發(fā)展,實(shí)際上代碼規(guī)模膨脹的很快。 與代碼一塊膨脹的還有團(tuán)隊(duì),從最初的 4 個(gè)人到近 30 人。 團(tuán)隊(duì)大了后,一個(gè)系統(tǒng)多人開(kāi)發(fā),開(kāi)發(fā)人員層次不一,規(guī)范難統(tǒng)一,系統(tǒng)模塊耦合重,改動(dòng)溝通和依賴多,上線風(fēng)險(xiǎn)難以控制。 一個(gè)單獨(dú) tomcat 應(yīng)用多實(shí)例部署模型終于走到頭了,這個(gè)版本架構(gòu)升級(jí)的主題就是服務(wù)化。
服務(wù)化的第一個(gè)問(wèn)題如何把一個(gè)大的應(yīng)用系統(tǒng)切分成子服務(wù)系統(tǒng)。 當(dāng)時(shí)的背景是京東的部署還在半自動(dòng)化年代,自動(dòng)部署系統(tǒng)剛起步,子服務(wù)系統(tǒng)若按業(yè)務(wù)劃分太細(xì)太多,部署工作量很大且難管理。 所以當(dāng)時(shí)我們不是按業(yè)務(wù)功能分區(qū)服務(wù)的,而是按業(yè)務(wù)重要性級(jí)別劃分了 0、1、2 三個(gè)級(jí)別不同的子業(yè)務(wù)服務(wù)系統(tǒng)。 另外就是獨(dú)立了一組接入服務(wù),針對(duì)不同渠道和通信方式的接入端,見(jiàn)下圖。
更細(xì)化的應(yīng)用服務(wù)和架構(gòu)分層方式可見(jiàn)下圖。
這次大的架構(gòu)升級(jí),主要考慮了三個(gè)方面:穩(wěn)定性、效率和容量。 做了下面這些事情:
- 業(yè)務(wù)分級(jí)、核心、非核心業(yè)務(wù)隔離
多機(jī)房部署,流量分流、容災(zāi)冗余、峰值應(yīng)對(duì)冗余
讀庫(kù)多源,失敗自動(dòng)轉(zhuǎn)移
寫(xiě)庫(kù)主備,短暫有損服務(wù)容忍下的快速切換
外部接口,失敗轉(zhuǎn)移或快速斷路
Redis 主備,失敗轉(zhuǎn)移
大表遷移,MongoDB 取代 MySQL 存儲(chǔ)消息記錄
改進(jìn)消息投遞模型
前 6 條基本屬于考慮系統(tǒng)穩(wěn)定性、可用性方面的改進(jìn)升級(jí)。 這一塊屬于陸續(xù)迭代完成的,承載很多失敗轉(zhuǎn)移的配置和控制功能在上面圖中是由管控中心提供的。 第 7 條主要是隨著業(yè)務(wù)量的上升,單日消息量越來(lái)越大后,使用了 MongoDB 來(lái)單獨(dú)存儲(chǔ)量最大的聊天記錄。 第 8 條是針對(duì) 1.0 版本消息輪詢效率低的改進(jìn),改進(jìn)后的投遞方式如下圖所示:
不再是輪詢了,而是讓終端每次建立連接后注冊(cè)接入點(diǎn)位置,消息投遞前定位連接所在接入點(diǎn)位置再推送過(guò)去。 這樣投遞效率就是恒定的了,而且很容易擴(kuò)展,在線人數(shù)越多則連接數(shù)越多,只需要擴(kuò)展接入點(diǎn)即可。 其實(shí),這個(gè)模型依然還有些小問(wèn)題,主要出在離線消息的處理上,可以先思考下,我們最后再講。
3.0 經(jīng)過(guò)了兩年的迭代式升級(jí),單純從業(yè)務(wù)量上來(lái)說(shuō)還可以繼續(xù)支撐很長(zhǎng)時(shí)間的增長(zhǎng)。 但實(shí)際上到 2014 年底我們面對(duì)的不再是業(yè)務(wù)量的問(wèn)題,而是業(yè)務(wù)模式的變化。 這直接導(dǎo)致了一個(gè)全新時(shí)代的到來(lái)。
4.0 涅槃(2015 至今 )
2014 年京東的組織架構(gòu)發(fā)生了很大變化,從一個(gè)公司變成了一個(gè)集團(tuán),下設(shè)多個(gè)子公司。 原來(lái)的商城成為了其中一個(gè)子公司,新成立的子公司包括京東金融、京東智能、京東到家、拍拍、海外事業(yè)部等。 各自業(yè)務(wù)范圍不同,業(yè)務(wù)模式也不同,但不管什么業(yè)務(wù)總是需要客服服務(wù)。 如何復(fù)用原來(lái)為商城量身訂做的咚咚客服系統(tǒng)并支持其他子公司業(yè)務(wù)快速接入成為我們新的課題。
最早要求接入的是拍拍網(wǎng),它是從騰訊收購(gòu)的,所以是完全不同的賬戶和訂單交易體系。 由于時(shí)間緊迫,我們把為商城訂做的部分剝離,基于 3.0 架構(gòu)對(duì)接拍拍又單獨(dú)訂做了一套,并獨(dú)立部署,像下面這樣。
雖然在業(yè)務(wù)要求的時(shí)間點(diǎn)前完成了上線,但這樣做也帶來(lái)了明顯的問(wèn)題:
- 復(fù)制工程,定制業(yè)務(wù)開(kāi)發(fā),多套源碼維護(hù)成本高
獨(dú)立部署,至少雙機(jī)房主備外加一個(gè)灰度集群,資源浪費(fèi)大
以前我們都是面向業(yè)務(wù)去架構(gòu)系統(tǒng),如今新的業(yè)務(wù)變化形勢(shì)下我們開(kāi)始考慮面向平臺(tái)去架構(gòu),在統(tǒng)一平臺(tái)上跑多套業(yè)務(wù),統(tǒng)一源碼,統(tǒng)一部署,統(tǒng)一維護(hù)。 把業(yè)務(wù)服務(wù)繼續(xù)拆分,剝離出最基礎(chǔ)的 IM 服務(wù),IM 通用服務(wù),客服通用服務(wù),而針對(duì)不同的業(yè)務(wù)特殊需求做最小化的定制服務(wù)開(kāi)發(fā)。 部署方式則以平臺(tái)形式部署,不同的業(yè)務(wù)方的服務(wù)跑在同一個(gè)平臺(tái)上,但數(shù)據(jù)互相隔離。 服務(wù)繼續(xù)被拆分的更微粒化,形成了一組服務(wù)矩陣(見(jiàn)下圖)。
而部署方式,只需要在雙機(jī)房建立兩套對(duì)等集群,并另外建一個(gè)較小的灰度發(fā)布集群即可,所有不同業(yè)務(wù)都運(yùn)行在統(tǒng)一平臺(tái)集群上,如下圖。
更細(xì)粒度的服務(wù)意味著每個(gè)服務(wù)的開(kāi)發(fā)更簡(jiǎn)單,代碼量更小,依賴更少,隔離穩(wěn)定性更高。 但更細(xì)粒度的服務(wù)也意味著更繁瑣的運(yùn)維監(jiān)控管理,直到今年公司內(nèi)部彈性私有云、緩存云、消息隊(duì)列、部署、監(jiān)控、日志等基礎(chǔ)系統(tǒng)日趨完善, 使得實(shí)施這類細(xì)粒度劃分的微服務(wù)架構(gòu)成為可能,運(yùn)維成本可控。 而從當(dāng)初 1.0 的 1 種應(yīng)用進(jìn)程,到 3.0 的 6、7 種應(yīng)用進(jìn)程,再到 4.0 的 50+ 更細(xì)粒度的不同種應(yīng)用進(jìn)程。 每種進(jìn)程再根據(jù)承載業(yè)務(wù)流量不同分配不同的實(shí)例數(shù),真正的實(shí)例進(jìn)程數(shù)會(huì)過(guò)千。 為了更好的監(jiān)控和管理這些進(jìn)程,為此專門定制了一套面向服務(wù)的運(yùn)維管理系統(tǒng),見(jiàn)下圖。
統(tǒng)一服務(wù)運(yùn)維提供了實(shí)用的內(nèi)部工具和庫(kù)來(lái)幫助開(kāi)發(fā)更健壯的微服務(wù)。 包括中心配置管理,流量埋點(diǎn)監(jiān)控,數(shù)據(jù)庫(kù)和緩存訪問(wèn),運(yùn)行時(shí)隔離,如下圖所示是一個(gè)運(yùn)行隔離的圖示:
細(xì)粒度的微服務(wù)做到了進(jìn)程間隔離,嚴(yán)格的開(kāi)發(fā)規(guī)范和工具庫(kù)幫助實(shí)現(xiàn)了異步消息和異步 HTTP 來(lái)避免多個(gè)跨進(jìn)程的同步長(zhǎng)調(diào)用鏈。 進(jìn)程內(nèi)部通過(guò)切面方式引入了服務(wù)增強(qiáng)容器 Armor 來(lái)隔離線程, 并支持進(jìn)程內(nèi)的單獨(dú)業(yè)務(wù)降級(jí)和同步轉(zhuǎn)異步化執(zhí)行。而所有這些工具和庫(kù)服務(wù)都是為了兩個(gè)目標(biāo):
- 讓服務(wù)進(jìn)程運(yùn)行時(shí)狀態(tài)可見(jiàn)
讓服務(wù)進(jìn)程運(yùn)行時(shí)狀態(tài)可被管理和改變
最后我們回到前文留下的一個(gè)懸念,就是關(guān)于消息投遞模型的缺陷。 一開(kāi)始我們?cè)诮尤雽訖z測(cè)到終端連接斷開(kāi)后,消息無(wú)法投遞,再將消息緩存下來(lái),等終端重連接上來(lái)再拉取離線消息。 這個(gè)模型在移動(dòng)時(shí)代表現(xiàn)的很不好,因?yàn)橐苿?dòng)網(wǎng)絡(luò)的不穩(wěn)定性,導(dǎo)致經(jīng)常斷鏈后重連。 而準(zhǔn)確的檢測(cè)網(wǎng)絡(luò)連接斷開(kāi)是依賴一個(gè)網(wǎng)絡(luò)超時(shí)的,導(dǎo)致檢測(cè)可能不準(zhǔn)確,引發(fā)消息假投遞成功。 新的模型如下圖所示,它不再依賴準(zhǔn)確的網(wǎng)絡(luò)連接檢測(cè),投遞前待確認(rèn)消息 id 被緩存,而消息體被持久存儲(chǔ)。 等到終端接收確認(rèn)返回后,該消息才算投妥,未確認(rèn)的消息 id 再重新登陸后或重連接后作為離線消息推送。 這個(gè)模型不會(huì)產(chǎn)生消息假投妥導(dǎo)致的丟失,但可能導(dǎo)致消息重復(fù),只需由客戶終端按消息 id 去重即可。
京東咚咚誕生之初正是京東技術(shù)轉(zhuǎn)型到 Java 之時(shí),經(jīng)歷這些年的發(fā)展,取得了很大的進(jìn)步。 從草根走向?qū)I(yè),從弱小走向規(guī)模,從分散走向統(tǒng)一,從雜亂走向規(guī)范。 本文主要重心放在了幾年來(lái)咚咚架構(gòu)演進(jìn)的過(guò)程,技術(shù)架構(gòu)單獨(dú)拿出來(lái)看我認(rèn)為沒(méi)有絕對(duì)的好與不好, 技術(shù)架構(gòu)總是要放在彼時(shí)的背景下來(lái)看,要考慮業(yè)務(wù)的時(shí)效價(jià)值、團(tuán)隊(duì)的規(guī)模和能力、環(huán)境基礎(chǔ)設(shè)施等等方面。 架構(gòu)演進(jìn)的生命周期適時(shí)匹配好業(yè)務(wù)的生命周期,才可能發(fā)揮最好的效果。
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。