深圳市確定生物技術技術有限公司。有限公司
Categories

    深圳市確定生物技術技術有限公司。有限公司

    位址: 佛潭工業中心、 26-28 坳背灣街、 火炭、 沙田、 香港 6 樓

    電子郵件: nicole@ok-biotech.com

    smile@ok-biotech.com

    Web: www.ok-biotech.com

    電話: + 852-64872529

    傳真: + 852-54852411

首頁 > 新聞 > 內容

谷歌點燃火花,Hadoop 在它的雲服務

www.ok-biotech.com

谷歌點燃火花,Hadoop 在它的雲服務

如果谷歌更多瞭解一件事,它是開發人員不想花大量的時間設立基礎設施,這樣他們可以對大量的資料來經營這個商行創建應用程式咀嚼。


雖然我們很多人欣賞谷歌對其系統和資料中心的設計,真正讓谷歌強大的東西是其能力快速開發新技術並使其便於程式師要使用。這是柏格叢集控制器和與之一起工作的許多框架的性質。


你不必為谷歌要像谷歌,但是工作。前方的地層 + Hadoop 世界會議下周在紐約,谷歌宣佈雲 Dataproc,打包 Hadoop 存儲與火花在記憶體分析相結合,並提供它作為一種服務。雲計算 Dataproc — — 是短的資料處理,當然,很古老的學校學期什麼我們都還在做 — — 是在 Beta 測試現在;不揭示了發佈時間的商務服務。


為雲 Dataproc 的定價是人的一定會出人頭地關於建立 Hadoop 或火花分析集群,思考是人的件痛苦的事,需要專家們繼續關注的。谷歌收取一分錢,每個虛擬機器每小時在它管理代表雲 Dataproc 使用者虛擬集群。(這是除了收費計算引擎實例、 網路頻寬和存儲客戶承擔建立集群)。 雲 Dataproc 可以在定期保留和對需求的情況下,以及谷歌推出幾個星期前的新的搶佔式實例上運行。定價被四捨五入到最近分鐘十分鐘最低計費週期。


速度也是谷歌正試圖出售的東西。在博客中宣佈火花/Hadoop 服務,產品經理,公司的雲計算平臺的公共雲,James 馬龍說,谷歌可以在 90 秒內啟動 Hadoop 或火花的群集和規模或關閉它在大約在那個時候 — — 或更少。谷歌已選擇 Debian 7 分佈的雲平臺,打造服務; 裡面 Linux 之上運行 Hadoop 和火花據推測,它利用開放源碼 Apache 版本的 Hadoop 和火花的堆疊。


"的 Dataproc 大的特點之一是,我們正試圖回答想要更多地控制群集的客戶的需求,"馬龍告訴平臺。"客戶有他們的資料和工作流對 Hadoop 和火花,但他們不想花幾小時設置 Vm,分發二進位檔案,等等。開放源碼軟體是偉大的但它通常配備了數以百計的開關和旋鈕微調和撥號。我們試圖用 Dataproc 做的事情是有一個大的開關和它,而且當你完成你可以將它關閉。


馬龍說雲 Dataproc 服務可以從三個到上百個虛擬節點擴展,並與谷歌雲存儲,用計算引擎工作物件存儲服務集成。(預設複製資料設置兩個,不在 Hadoop 集群中使用正常三)。這種存儲具有混合磁片磁碟機和快閃記憶體的策略性污水排放計畫以確保良好的性能,和重要的是,如果資料存儲在雲存儲,甚至當你關閉雲 Dataproc 群集,此資料將持續被再次使用。所以,在某種意義上,而不是在早期的雲計算,是常見的短暫存儲這可以被認為是短暫計算的持久存儲。馬龍告訴我們,客戶可以設置 HDFS 上的本地磁片或快閃記憶體存儲在它們的計算實例,但一旦群集處於關閉狀態的資料就丟失了。谷歌建議 HDFS 放雲存儲,因為這一原因。


這就是說,雲 Dataproc 群集還會堅持,只要你支付支撐這虛擬的 Hadoop 和火花群集的計算引擎實例。谷歌警告不雲 Dataproc 群集是限於最多 24 個 Cpu 和 240 的 VM 實例,像其他計算引擎資源,和你要問那任何能力。如果你需要鵝性能,您可以選擇計算引擎實例與本地策略性污水排放計畫。


雲 Dataproc 並不只是支援 MapReduce 批次處理作業和引發記憶體中處理,但也可以頂蜂巢資料倉儲層之上 Hadoop 分散式檔案系統上運行的支援應用程式以及應用程式使用豬腳本工具來並行化他們 MapReduce 查詢。任何一種語言所支援的 Hadoop 和火花 — — JAVA、 Scala,Python 和 R-支援雲 Dataproc 服務。這項服務還沒有官方的服務等級協定,但將它變為一般可用時。所有區域和區域在谷歌公共雲,雲 Dataproc 都是可用。馬龍不是隨便說當雲 Dataproc 將一般可用。


雲 Dataproc 堆疊已在 Alpha 測試了幾個月,並推出測試版今天支援 Hadoop 2.7.1 和火花 1.5。程式師可以創建和銷毀雲 Dataproc 集群從一組 Api,從谷歌雲 SDK,或從谷歌開發人員主控台。


谷歌並不期望為客戶一定使用雲 Dataproc 而不是其 BigQuery 和雲 Bigtable 的服務,我們在這裡所報導。(雲 Bigtable 是反映內部資料庫覆蓋啟發蜂巢,谷歌檔案系統服務和 BigQuery 是唯讀工作的啟發,除其他外,亞馬遜 DynamoDB 和 Facebook 的卡珊多拉,谷歌創建點對點查詢服務)。因為雲 Dataproc 可以連結到雲 Bigtable 和 BigQuery,它可用於,例如,做按摩之前的日誌檔的資料和其他的遙測系統和應用程式裡出來是倒入服務,比如 BigQuery 和雲 Bigtable 也許視覺化在畫面之類的工具。馬龍說雲 Dataproc 阿爾法程式中的一些客戶尋找更多的規模或其 Hadoop 和火花的基礎設施,降低成本,而一些看起來,使開發人員更易於啟動群集來測試他們的資料和演算法。


谷歌的競爭對手亞馬遜網路服務的 Beta 版以 2009 年 4 月,作為一種服務提供 Hadoop 在撲滅其彈性 MapReduce 服務,可供生產使用不久之後。AWS 提供其虛擬叢集,Hadoop 的 Apache 分佈,並且還允許客戶使用 Hadoop 分佈從 MapR 技術。亞馬遜的定價是相當高的 EMR 託管服務比谷歌充電為雲 Dataproc、 實例,會讓人變的底層 EC2 費用使用。EC2 實例運行從每小時 4.4 美分至高的美元為 d2.8xlarge 存儲優化實例; 每小時 5.52 m1.small 實例EMR 服務添加 1.1 至 27 美分每小時另這些 EC2 費用。(這些都是在美國東部地區的按需實例; 你可以降低成本,保留實例)。亞馬遜只支援火花 EMR 六月份的時候,加上 7 月改造電子病歷,包括 Hadoop 2.6.0、 火花 1.4.1、 蜂巢 1.0 和豬 0.14 4.0 版。


微軟將 Hadoop 服務同樣對其 Azure 的雲,它稱之為 HDInsight,這基於 Hortonworks 資料平臺分佈的分析平臺。除了 Hadoop,Microsoft 支援火花記憶體中處理和風暴流處理載入項。客戶可以部署 HDInsight 在 Windows 或 Linux 的 Azure 的雲,和微軟捆綁價格的計算和一起在定價,範圍從每小時為 A1 實例 8 美分至 1.41 美元每小時為 A7 實例的服務。如果你買了這些實例在 Azure 上的原始運行 Linux,他們成本從 A1 實例為每小時 1.8 美分至 1 美元每小時為 A7 實例。所以微軟同樣充電託管服務,Hadoop/火花比谷歌更高的溢價。


標籤: 139755-83-2,西地那非利,167933-07-5,他達拉非,犀利士,171596-29-5,鹽酸伐地那非,224785-91-5,


產品類別
聯繫我們
位址: 佛潭工業中心、 26-28 坳背灣街、 火炭、 沙田、 香港 6 F
電話: 00852-64872529
 傳真:00852-54852411
 電子郵件:smile@ok-biotech.com
Share: