Hadoop的優(yōu)點(diǎn)和缺點(diǎn)是什么
Hadoop的優(yōu)點(diǎn):
1、Hadoop具有按位存儲(chǔ)和處理數(shù)據(jù)能力的高可靠性。
2、Hadoop通過可用的計(jì)算機(jī)集群分配數(shù)據(jù),完成存儲(chǔ)和計(jì)算任務(wù),這些集群可以方便地?cái)U(kuò)展到數(shù)以千計(jì)的節(jié)點(diǎn)中,具有高擴(kuò)展性。
3、Hadoop能夠在節(jié)點(diǎn)之間進(jìn)行動(dòng)態(tài)地移動(dòng)數(shù)據(jù),并保證各個(gè)節(jié)點(diǎn)的動(dòng)態(tài)平衡,處理速度非常快,具有高效性。
4、Hadoop能夠自動(dòng)保存數(shù)據(jù)的多個(gè)副本,并且能夠自動(dòng)將失敗的任務(wù)重新分配,具有高容錯(cuò)性。
Hadoop的缺點(diǎn):
1、Hadoop不適用于低延遲數(shù)據(jù)訪問。
2、Hadoop不能高效存儲(chǔ)大量小文件。
3、Hadoop不支持多用戶寫入并任意修改文件。
hdfs的副本個(gè)數(shù)
hdfs的副本個(gè)數(shù)為3個(gè)。
HDFS是Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System)的簡(jiǎn)稱,它的設(shè)計(jì)目標(biāo)是把超大數(shù)據(jù)集存儲(chǔ)到網(wǎng)絡(luò)中的多臺(tái)普通計(jì)算機(jī)上,并提供高可靠性和高吞吐率的服務(wù)。數(shù)據(jù)自動(dòng)保存多個(gè)副本,hdfs默認(rèn)的副本數(shù)量是3。
HDFS能夠處理GB、TP甚至BP級(jí)別的數(shù)據(jù),能夠處理百萬(wàn)規(guī)模以上的文件數(shù)量,可構(gòu)建在廉價(jià)機(jī)器上。hdfs無(wú)法實(shí)現(xiàn)毫秒級(jí)別的數(shù)據(jù)存儲(chǔ)和訪問,hdfs提供高吞吐量但無(wú)法提供低延遲數(shù)據(jù)訪問。大量小文件會(huì)占用namenode大量的內(nèi)存來(lái)存儲(chǔ)元數(shù)據(jù),且會(huì)導(dǎo)致尋址時(shí)間過長(zhǎng)。
hdfs的應(yīng)用領(lǐng)域
互聯(lián)網(wǎng)搜索引擎需要處理和存儲(chǔ)海量的網(wǎng)絡(luò)數(shù)據(jù),HDFS作為底層存儲(chǔ)系統(tǒng),提供了高容量、高可靠性的存儲(chǔ)能力。搜索引擎可以將爬取的網(wǎng)頁(yè)數(shù)據(jù)存儲(chǔ)在HDFS中,然后通過MapReduce等計(jì)算框架進(jìn)行數(shù)據(jù)處理和索引構(gòu)建,從而實(shí)現(xiàn)高效的搜索和查詢。
在網(wǎng)絡(luò)服務(wù)和系統(tǒng)運(yùn)維中,日志分析是一個(gè)重要的任務(wù)。HDFS可以用來(lái)存儲(chǔ)服務(wù)器產(chǎn)生的大量日志數(shù)據(jù),通過MapReduce等計(jì)算框架,可以對(duì)日志數(shù)據(jù)進(jìn)行實(shí)時(shí)或離線的分析,從中發(fā)現(xiàn)潛在的問題和異常。日志分析可以幫助企業(yè)提高系統(tǒng)的穩(wěn)定性和性能,提升用戶體驗(yàn)。
hadoop可以單副本運(yùn)行嗎
可以。根據(jù)查詢51CTO博客網(wǎng)顯示,Hadoop的單機(jī)運(yùn)行很簡(jiǎn)單,只要最基本的安裝包解壓后配置jdk和必要的環(huán)境變量就可以直接運(yùn)行。Hadoop是一個(gè)由Apache基金會(huì)所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進(jìn)行高速運(yùn)算和存儲(chǔ)。
hadoop默認(rèn)存儲(chǔ)文件副本數(shù)為
默認(rèn)為副本數(shù)為3
第一個(gè)副本:放置在上傳文件的數(shù)據(jù)節(jié)點(diǎn);如果是集群外提交,則隨機(jī)挑選一臺(tái)磁盤不太滿. CPU不太忙的節(jié)點(diǎn)。
第二個(gè)副本:放置在與第一個(gè)副本不同的機(jī)架的節(jié)點(diǎn)上。
第三個(gè)副本:與第二個(gè)副本相同機(jī)架的其他節(jié)點(diǎn)上。
更多副本:隨機(jī)節(jié)點(diǎn)