人妻夜夜爽天天爽三区麻豆AV网站,无码AV天堂一区二区三区

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動態(tài)

產(chǎn)品資訊

行業(yè)資訊

豆瓣整個基礎(chǔ)架構(gòu)可以粗略的分為在線和離線兩大塊。在線的部分和大部分網(wǎng)站類似：前面用LVS做HA，用Nginx做反向代理，形成負(fù)載均衡的一層；應(yīng)用層主要是做運算，將運算結(jié)果返回給前面的用戶，DAE平臺是這兩年建起來的，現(xiàn)在大部分豆瓣的應(yīng)用基本都跑在DAE上面了；應(yīng)用后面的基礎(chǔ)服務(wù)也跟其他網(wǎng)站差不多，MySQL、memcached、redis、beanstalkd，不一樣的是NoSQL的選擇——BeansDB，這是我們在幾年前開源的KV數(shù)據(jù)庫，也是國內(nèi)比較早開源的KV數(shù)據(jù)庫。

豆瓣的技術(shù)架構(gòu)與主要組件

豆瓣作為一個早期就選擇以Python為主要編程語言的公司，網(wǎng)站所使用到的技術(shù)很多都與Python相關(guān)，包括主要框架quixote、自行實現(xiàn)的DPark等等。在其它技術(shù)的選擇上，并沒有太大不同：nginx、MySQL、memcached、BeansDB、redis……都是知名開源項目。在這些開源項目之上，豆瓣根據(jù)自己產(chǎn)品的特性，針對性地做了配置與部署設(shè)置。

除了使用開源項目，豆瓣也根據(jù)自身需要自主研發(fā)或?qū)崿F(xiàn)了一些產(chǎn)品，比較有特色的如DAE、DPark等等。

DAE全名Douban Application Engine，顧名思義它是一個類似于GAE、SAE的內(nèi)部PaaS系統(tǒng)。使用這樣的PaaS有很多好處，比如第三方庫數(shù)量豐富并且支持多個版本并存、資源配置靈活等等，能夠為工程師省去很多不必要的工作。

BeansDB是DAE中非常重要的一個組件，設(shè)計思想源于亞馬遜的Dynamo，但是簡化了Dynamo的一些復(fù)雜之處。BeansDB主要應(yīng)用于小型文本和中型的圖片、音頻，它們的共同特點在于寫次數(shù)特別少，這也正是BeansDB所擅長的領(lǐng)域。
DPark類似于Spark，是豆瓣用Python實現(xiàn)Map-Reduce類似框架。雖然Python的性能低于基于JVM的Clojure，但這樣做避免了程序員程序員進入不熟悉的領(lǐng)域，而且豆瓣使用開源項目的原則是：如果無法完全掌握，寧可不用。“此外將Spark移植到Python上也很簡單，基本上是一對一的翻譯。

BeansDB項目可以說是一個簡化版的AWS DynamoDB，該項目在2008年啟動，2009年開源，第⼀版使⽤tokyo cabinet作為存儲引擎，2010年使⽤bitcask存儲格式重寫了存儲引擎，性能更好。BeansDB對key做哈希運算找到節(jié)點來實現(xiàn)分布和冗余，一個寫操作會寫好幾個節(jié)點，而現(xiàn)在的配置是寫三份讀一份。BeansDB主要的特點是支持海量KV數(shù)據(jù)庫——相比Redis這種支持幾十個G到幾百個G的內(nèi)存KV數(shù)據(jù)庫，BeansDB可以支持到上百T的數(shù)據(jù)。另外BeansDB最大的好處就是運維很簡單，性能、可用性、擴容都很好，也實現(xiàn)了最終一致性。

BeansDB中間的Proxy是用Go語言寫的，也是一個開源的組件。整體來說BeansDB的設(shè)計結(jié)構(gòu)比較簡單，相比Redis那種有多種value 類型的方式，BeansDB的Value比較簡單一些。

在豆瓣內(nèi)部建立了兩個不同的BeansDB集群，一個是doubandb，一個是doubanfs，分別針對不同的場景。doubandb主要存儲小型文本數(shù)據(jù)，如影評、用戶個人介紹、帖子內(nèi)容等，這樣的好處是可以大大降低我們對MySQL的性能依賴，算是給MySQL減負(fù)；doubanfs主要存放圖片和音頻等中型數(shù)據(jù)。

DAE可以說是基于很多以前積累的、舊的組件做起來的。我們做的這種對內(nèi)的PaaS，相比對外的PaaS而言做了很多簡化，尤其是安全方面如應(yīng)用間隔離、權(quán)限管理方面，我們都不用像公有云那樣花大量精力去做，所以工作量其實還好。DAE現(xiàn)在在計劃開源，當(dāng)然它現(xiàn)在只支持Python應(yīng)用。以后我們也許會讓DAE支持Go語言。

上面是在線的部分，對高可用性和低時延有較大要求。離線部分則包括數(shù)據(jù)挖掘、數(shù)據(jù)分析等，技術(shù)組件分別是海量分布式文件系統(tǒng)MooseFS，這個文件系統(tǒng)的結(jié)構(gòu)類似HDFS，用C語言編寫，其好處在于FUSE模塊實現(xiàn)的比較好，用文件系統(tǒng)就可以直接進行操作，而不需要專門的命令，可以支持的數(shù)據(jù)量也很大。另外就是自己開發(fā)的分布式計算平臺DPark。

DPark顧名思義是Spark的Python實現(xiàn)，不過現(xiàn)在已經(jīng)跟Spark越來越不一樣了。和 Hadoop 相比，Spark可以使用內(nèi)存做為緩存加速分布式計算，DPark繼承了這個優(yōu)點，這對于大規(guī)模數(shù)據(jù)的迭代計算非常有用。在豆瓣的應(yīng)用場景下，因為我們的離線計算很多是推薦算法計算，這種計算涉及大量的迭代算法，如果每次計算的結(jié)果都入磁盤再在下一輪計算加載，那性能是很差的，所以DPark能夠大幅提升性能。另外，因為DPark的編寫使用了函數(shù)式語言的特點，所以可以寫的非常簡潔：

美國服務(wù)器租用

版權(quán)聲明：本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場，如有內(nèi)容涉嫌侵權(quán)，請聯(lián)系alex-e#qq.com處理。

相關(guān)文章

網(wǎng)站服務(wù)器被攻擊的幾種形式?

服務(wù)器運行失敗的原因和解決方法

微信無法連接到服務(wù)器是什么原因?

站群服務(wù)器有哪些特點?

服務(wù)器證書知識

服務(wù)器證書如何提高網(wǎng)站的信任度?

美國和香港服務(wù)器怎么選擇?

外國服務(wù)器主要有哪些品牌?

云服務(wù)器租用要注意哪幾點?

騰訊云服務(wù)器購買注意事項