旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國(guó)統(tǒng)一咨詢熱線:010-5367 2995
首頁(yè) > 熱門(mén)文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析命令行使用教程

大數(shù)據(jù)分析命令行使用教程

時(shí)間:2020-06-04來(lái)源:mwtacok.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-06-04點(diǎn)擊量:作者:Sissi


  在與數(shù)據(jù)科學(xué)緊密聯(lián)系的計(jì)算機(jī)科學(xué)領(lǐng)域,像開(kāi)發(fā)人員一樣控制計(jì)算機(jī)是一項(xiàng)非常寶貴的資產(chǎn)。Unix命令行界面(CLI;您還將看到它稱為終端或bash,shell等),它使我們能夠執(zhí)行更多操作。


  因此,我們推出了兩門(mén)全新的課程,涵蓋了Python中的數(shù)據(jù)分析師和Python路徑中的大數(shù)據(jù)分析的命令行基礎(chǔ)知識(shí):


  1)命令行元素
  2)命令行中的文本處理


  參加這些課程不需要先決條件知識(shí)。


  你會(huì)學(xué)什么?


  在這兩個(gè)命令行課程中,您將學(xué)習(xí)如何使用Mac和Linux計(jì)算機(jī)上內(nèi)置的Unix終端界面。不用擔(dān)心,我們還將為Windows用戶提供充分利用內(nèi)容所需的工具。


  在第一門(mén)課程中,您將學(xué)習(xí)命令行界面是什么,為什么它在數(shù)據(jù)科學(xué)工作流程中很重要,以及如何通過(guò)給計(jì)算機(jī)提供稱為命令的指令來(lái)導(dǎo)航和管理計(jì)算機(jī)。您還將了解通配符和如何將它們連同像命令使用ls,mv,cp,mkdir,多為更快的搜索和工作流。


  第二療程的重點(diǎn)是基本的文本處理中的外殼,使用類似的命令head,cat,cut和grep。它涵蓋了如何組合這些命令以從更簡(jiǎn)單的構(gòu)建塊創(chuàng)建功能強(qiáng)大的命令鏈。您還將了解多用戶系統(tǒng)以及輸出重定向的功能。

與所有AAA教育課程一樣,這些新的命令行課程使用交互式命令行環(huán)境和答案檢查功能,使您可以直接在瀏覽器中應(yīng)用和檢查正在學(xué)習(xí)的所有內(nèi)容。


  學(xué)習(xí)命令行的12個(gè)理由


  從圖形用戶界面(GUI)切換到CLI可能會(huì)讓人感到不知所措,但是我們?cè)谶@里為您提供幫助!為了讓您快速入門(mén),以下是一些您應(yīng)該學(xué)習(xí)命令行的原因。


  1.命令行技能很受歡迎并且薪酬豐厚


  根據(jù)2018年Stack Overflow的開(kāi)發(fā)人員調(diào)查,bash / shell(即Linux命令語(yǔ)言解釋器家族)是整體使用頻率排名第六的語(yǔ)言,排在Python和R之前。它的薪水也比Python或R高進(jìn)行調(diào)查。


  它還排在最想要和最喜歡的技術(shù)的列表中,而沒(méi)有列出最令人恐懼的技術(shù)列表。


  盡管StackOverflow的調(diào)查涵蓋了各種軟件開(kāi)發(fā)人員和工程師,但命令行對(duì)于數(shù)據(jù)科學(xué)家而言尤其重要,因?yàn)锽ash / Shell與 Python,IPython / Jupyter,TensorFlow和PyTorch等數(shù)據(jù)科學(xué)技術(shù)有著密切的聯(lián)系。Python Software Foundation進(jìn)行的最新Python開(kāi)發(fā)人員調(diào)查也支持這一點(diǎn)。


  2.命令行技能幫助構(gòu)建可重復(fù)數(shù)據(jù)過(guò)程


  數(shù)據(jù)科學(xué)家的職責(zé)之一是確保經(jīng)常(每天)定期獲取某些信息。大多數(shù)情況下,以相同的方式獲取,處理和顯示此數(shù)據(jù)。


  命令行非常適合此目的,因?yàn)槊钜子谧詣?dòng)化和復(fù)制。


  考慮以下情況。您的雇主決定投資于數(shù)據(jù)分析。幾位數(shù)據(jù)專業(yè)人員將加入該團(tuán)隊(duì)。您的任務(wù)是確保他們的機(jī)器具備啟動(dòng)所需的一切。如果可以使用CLI(命令語(yǔ)言解釋器),則可以編寫(xiě)一些腳本來(lái)自動(dòng)安裝,配置和測(cè)試所有內(nèi)容。否則,您將不得不求助于GUI并使用相同的鼠標(biāo)并在多臺(tái)計(jì)算機(jī)上反復(fù)單擊移動(dòng)。


  這只是終端技能如何幫助使數(shù)據(jù)科學(xué)流程更具可擴(kuò)展性和可重復(fù)性的一個(gè)示例。


  3.命令行技能使您更靈活


  在數(shù)據(jù)科學(xué)領(lǐng)域,您經(jīng)常會(huì)發(fā)現(xiàn),如果您可以使用終端而不用依賴于單擊GUI,則可以擁有更大的靈活性。由于命令行是運(yùn)行其他程序的程序(因此稱為“ shell”),因此程序之間的交互通常更容易在命令行中進(jìn)行調(diào)整。掌握了命令行命令后,編寫(xiě)腳本就相對(duì)容易了,而Shell腳本使構(gòu)建各種數(shù)據(jù)管道和工作流變得更加簡(jiǎn)單。


  更廣泛地講,了解如何使用外殼為您提供了與計(jì)算機(jī)交互的第二種選擇。您隨時(shí)可以根據(jù)需要使用GUI,但是在需要的時(shí)候,命令行可以為您提供更多直接的功能和控制。


  4.使用文本文件更容易


  文本文件是存儲(chǔ)和處理數(shù)據(jù)的最常用方法之一,幾乎任何數(shù)據(jù)科學(xué)項(xiàng)目都將涉及文本文件的某些工作。因此,對(duì)于數(shù)據(jù)科學(xué)家而言,能夠快速有效地處理文本文件是一項(xiàng)非常有用的技能。


  該外殼程序具有非常強(qiáng)大的文本處理工具,例如AWK和sed,可幫助您熟悉文件并方便數(shù)據(jù)清理。


  例如,以下代碼使用AWK來(lái)打印名為的文件的第一和第三列a_csv_file,其中第二個(gè)字段的值為AAA教育,并使用逗號(hào)作為字段分隔符。

大數(shù)據(jù)分析

  只需要一行代碼!


  5.資源消耗少


  當(dāng)您使用有限的計(jì)算資源或僅想最大化速度時(shí),使用命令行實(shí)際上總是比使用GUI更好,因?yàn)槭褂肎UI意味著資源必須專用于呈現(xiàn)圖形輸出。


  對(duì)于本地和遠(yuǎn)程工作都是如此。遠(yuǎn)程連接時(shí),GUI消耗的帶寬比終端多得多,從而浪費(fèi)資源。此外,使用GUI時(shí),潛伏期(即“刺激和響應(yīng)之間的時(shí)間間隔”)會(huì)更長(zhǎng),如果您要控制的鼠標(biāo)落后于實(shí)際動(dòng)作一兩秒,這會(huì)特別令人沮喪。如果您只是在命令行中輸入,則延遲可能會(huì)更短,并且也將更容易處理,因?yàn)槟梢詼?zhǔn)確地知道任意給定時(shí)間的光標(biāo)位置。


  6.您需要針對(duì)云的命令行技能


  云服務(wù)通常連接到命令行界面并通過(guò)命令行界面進(jìn)行操作。對(duì)于深度學(xué)習(xí)等更高級(jí)的數(shù)據(jù)科學(xué)工作而言,這尤其重要,在該工作中,本地計(jì)算資源可能不足以完成您想執(zhí)行的任務(wù)。


  7. Unix Shell技能可以很好地移植到其他Shell


  僅有一些流行的shell(bash,zsh,fish,ksh,tcsh,cmd,Windows PowerShell等),它們比其他的相似得多,因此可以輕松地在它們之間進(jìn)行切換。當(dāng)您使用需要某種CLI的在線服務(wù)時(shí),此功能特別有用。另一方面,GUI是無(wú)止境的,學(xué)習(xí)一個(gè)GUI并不一定能幫助您學(xué)習(xí)其他GUI。


  8.您鍵入的速度可能比單擊速度快


  研究表明,鼠標(biāo)使用速度相當(dāng)快,而鍵盤(pán)的使用盡管學(xué)習(xí)曲線陡峭,但效率更高。

  換句話說(shuō):即使您覺(jué)得通過(guò)GUI快速工作,也很有可能至少在某些任務(wù)上在命令行中會(huì)更高效。


  9.審核和調(diào)試更容易


  由于在命令行上跟蹤所有活動(dòng)非常容易,因此審核和調(diào)試要容易得多。您可以輕松地瀏覽日志以跟蹤您在外殼程序中執(zhí)行的每個(gè)操作,而如果在使用GUI時(shí)單擊不正確會(huì)導(dǎo)致錯(cuò)誤,則可能沒(méi)有任何記錄。


  10. Unix Shell隨處可用


  盡管它僅內(nèi)置在Mac和Linux計(jì)算機(jī)上,但Windows用戶仍然可以通過(guò)WSL,Cygwin和MinGW之類的工具來(lái)享受樂(lè)趣。這意味著您在這些課程中學(xué)習(xí)的命令行技能幾乎可以在您遇到的每臺(tái)計(jì)算機(jī)上使用(包括您的個(gè)人計(jì)算機(jī),無(wú)論使用哪種操作系統(tǒng))。


  11.您可以利用語(yǔ)言的力量


  通過(guò)終端窗口與計(jì)算機(jī)交互時(shí),我們使用命令。這些命令是語(yǔ)言的一部分,語(yǔ)言具有巨大的表達(dá)能力。


  命令行允許我們使用語(yǔ)言的力量以更精致,優(yōu)雅和有效的方式與計(jì)算機(jī)交互。


  作者在總結(jié)類比時(shí)說(shuō):“真正的表達(dá)能力來(lái)自語(yǔ)言,示例和指向的結(jié)合。” 換句話說(shuō),如果可以使用CLI和GUI的健康組合,您將更有效率。這些命令行課程的重點(diǎn)并不是讓您完全放棄GUI,而是為您提供了另一個(gè)工具庫(kù),可以使您在執(zhí)行特定任務(wù)和工作流時(shí)更加高效。


  12.命令行比您想象的要簡(jiǎn)單


  有一個(gè)誤解,使用命令行需要您知道數(shù)百條命令。實(shí)際上,盡管有數(shù)百種命令可供使用,但是您可能只需要這些命令中的一小部分即可完成大多數(shù)常見(jiàn)的數(shù)據(jù)科學(xué)任務(wù)。

預(yù)約申請(qǐng)免費(fèi)試聽(tīng)課

填寫(xiě)下面表單即可預(yù)約申請(qǐng)免費(fèi)試聽(tīng)!怕錢(qián)不夠?可先就業(yè)掙錢(qián)后再付學(xué)費(fèi)! 怕學(xué)不會(huì)?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動(dòng)者教育科技有限公司版權(quán)所有
備案號(hào):京ICP備12034770號(hào)

?2007-2022/ mwtacok.cn 北京漫動(dòng)者數(shù)字科技有限公司 備案號(hào): 京ICP備12034770號(hào) 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號(hào)

網(wǎng)站地圖