之前我分享了《大數(shù)據(jù)分析面試題庫—基本的大數(shù)據(jù)分析面試問題》,這個是針對基本的大數(shù)據(jù)分析問題,如果您在大數(shù)據(jù)分析世界中有相當(dāng)豐富的工作經(jīng)驗,那么根據(jù)您以前的經(jīng)驗,您將在大數(shù)據(jù)分析采訪中被問到許多問題。這些問題可能只是與您的經(jīng)驗或場景有關(guān)。因此,AAA教育為您準(zhǔn)備好這些最佳的大數(shù)據(jù)分析面試問題和答案。
11.您有大數(shù)據(jù)分析經(jīng)驗嗎?
如何處理: 由于該問題是主觀問題,因此沒有具體答案,并且答案取決于您以前的經(jīng)驗。在大數(shù)據(jù)分析采訪中問這個問題時,采訪者想了解您以前的經(jīng)驗,并且還試圖評估您是否適合項目要求。
那么,您將如何處理這個問題?如果您以前有經(jīng)驗,請從以前的職務(wù)開始,然后慢慢地在對話中添加細(xì)節(jié)。告訴他們您使項目成功的貢獻(xiàn)。這個問題通常是面試中問到的第二個 或第三個問題。后面的問題基于此問題,因此請仔細(xì)回答。您還應(yīng)該注意不要過度處理以前的工作。保持簡單明了。
12.您喜歡好的數(shù)據(jù)還是好的模型?為什么?
如何處理: 這是一個棘手的問題,但通常在大數(shù)據(jù)分析面試中會問到。它要求您在良好的數(shù)據(jù)或良好的模型之間進(jìn)行選擇。作為候選人,您應(yīng)該嘗試根據(jù)自己的經(jīng)驗來回答。許多公司希望遵循嚴(yán)格的數(shù)據(jù)評估流程,這意味著他們已經(jīng)選擇了數(shù)據(jù)模型。在這種情況下,擁有良好的數(shù)據(jù)可能會改變游戲規(guī)則。另一種方法是根據(jù)良好的數(shù)據(jù)選擇模型。
如前所述,請根據(jù)您的經(jīng)驗進(jìn)行回答。但是,不要說擁有良好的數(shù)據(jù)和良好的模型很重要,因為在現(xiàn)實生活中很難同時擁有兩者。
13.您是否會優(yōu)化算法或代碼以使其運行更快?
如何處理: 這個問題的答案應(yīng)該始終是“是”。真實世界的性能很重要,它并不取決于您在項目中使用的數(shù)據(jù)或模型。
面試官也可能想知道您以前是否有代碼或算法優(yōu)化方面的經(jīng)驗。對于初學(xué)者而言,這顯然取決于他過去從事的項目。經(jīng)驗豐富的候選人也可以相應(yīng)地分享他們的經(jīng)驗。但是,請誠實對待您的工作,如果您過去沒有優(yōu)化代碼,那也很好。只要讓面試官知道您的真實經(jīng)驗,您就可以破解大數(shù)據(jù)分析面試。
14.您如何進(jìn)行數(shù)據(jù)準(zhǔn)備?
如何進(jìn)行: 數(shù)據(jù)準(zhǔn)備是大數(shù)據(jù)分析項目中的關(guān)鍵步驟之一。大數(shù)據(jù)分析采訪可能涉及基于數(shù)據(jù)準(zhǔn)備的至少一個問題。當(dāng)面試官問您這個問題時,他想知道您在數(shù)據(jù)準(zhǔn)備過程中采取了哪些步驟或預(yù)防措施。
如您所知,需要進(jìn)行數(shù)據(jù)準(zhǔn)備才能獲得必要的數(shù)據(jù),然后可以將這些數(shù)據(jù)進(jìn)一步用于建模目的。您應(yīng)該將此信息傳達(dá)給面試官。您還應(yīng)該強(qiáng)調(diào)要使用的模型的類型以及選擇該特定模型的原因。最后但并非最不重要的一點,您還應(yīng)該討論重要的數(shù)據(jù)準(zhǔn)備術(shù)語,例如轉(zhuǎn)換變量,離群值,非結(jié)構(gòu)化數(shù)據(jù),識別差距等。
15.如何將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)?
如何處理: 非結(jié)構(gòu)化數(shù)據(jù)在大數(shù)據(jù)分析中非常常見。應(yīng)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),以確保進(jìn)行正確的數(shù)據(jù)分析。您可以通過簡要區(qū)分兩者來開始回答問題。完成后,您現(xiàn)在可以討論將一種形式轉(zhuǎn)換為另一種形式的方法。您也可能會分享實際情況。如果您剛畢業(yè),則可以共享與您的學(xué)術(shù)項目有關(guān)的信息。
通過正確回答此問題,表示您了解結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)類型,并且具有處理這些數(shù)據(jù)的實踐經(jīng)驗。如果您具體回答該問題,那么您肯定可以破解大數(shù)據(jù)分析采訪。
16.哪種硬件配置最適合Hadoop作業(yè)?
配置4/8 GB RAM和ECC內(nèi)存的雙處理器或核心計算機(jī)是運行Hadoop操作的理想選擇。但是,硬件配置會根據(jù)特定于項目的工作流和處理流程而有所不同,因此需要進(jìn)行相應(yīng)的自定義。
17、當(dāng)兩個用戶嘗試訪問HDFS中的相同文件時會發(fā)生什么?
HDFS NameNode僅支持獨占寫入。因此,只有第一個用戶將獲得文件訪問許可,而第二個用戶將被拒絕。
18、NameNode出現(xiàn)故障時如何恢復(fù)?
需要執(zhí)行以下步驟以使Hadoop集群啟動并運行:
使用文件系統(tǒng)元數(shù)據(jù)副本FsImage來啟動新的NameNode。
配置數(shù)據(jù)節(jié)點以及客戶端,以使它們確認(rèn)新啟動的名稱節(jié)點。
一旦新的NameNode完成加載最后一個從DataNode接收到足夠阻止報告的檢查點FsImage,它將開始為客戶端提供服務(wù)。
在大型Hadoop集群的情況下,NameNode恢復(fù)過程會耗費大量時間,這對于例行維護(hù)而言是一個更大的挑戰(zhàn)。
19、您對Hadoop中的Rack Awareness了解什么?
這是應(yīng)用于NameNode的算法,用于確定如何放置塊及其副本。根據(jù)機(jī)架定義,可將同一機(jī)架內(nèi)各DataNode之間的網(wǎng)絡(luò)流量最小化。例如,如果我們考慮復(fù)制因子為3,則將兩個副本放在一個機(jī)架中,而將第三副本放在一個單獨的機(jī)架中。
20、“ HDFS塊”和“輸入分割”之間有什么區(qū)別?
HDFS將輸入數(shù)據(jù)物理上劃分為塊進(jìn)行處理,這稱為HDFS塊。
輸入拆分是映射器對數(shù)據(jù)的邏輯劃分,用于映射操作。
填寫下面表單即可預(yù)約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費! 怕學(xué)不會?助教全程陪讀,隨時解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!
?2007-2022/ mwtacok.cn 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc