旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實(shí)習(xí)/?A計(jì)劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測SARIMAX模型教程

大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測SARIMAX模型教程

時(shí)間:2020-07-16來源:mwtacok.cn點(diǎn)擊量:作者:Sissi
時(shí)間:2020-07-16點(diǎn)擊量:作者:Sissi



  什么是SARIMAX模型?
 

SARIMAX模型
 

  盡管我們針對時(shí)間序列模型專門撰寫了一系列大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測SARIMAX模型教程文章,但我們尚未討論一個(gè)非常重要的主題-季節(jié)性。

 

  到目前為止,我們檢查的每個(gè)模型-ARMA,ARMA,ARIMAARIMAX都有季節(jié)性等效項(xiàng)。

 

  您可能會猜到,這些對應(yīng)項(xiàng)的名稱分別是SARMASARIMASARIMAX,其中“ S”代表季節(jié)性。

 

  因此,模型的全名將是季節(jié)性自回歸綜合移動平均外生模型。

 

  我們都可以同意這是一個(gè)嘴,所以我們會堅(jiān)持使用縮寫。

 

  此外,SARMASARIMA可以看作是SARIMAX的簡單案例,在這里我們不使用積分或外生變量,因此在大數(shù)據(jù)分析培訓(xùn)課程python時(shí)間序列預(yù)測SARIMAX模型教程中,我們將主要關(guān)注SARIMAX。

 

  什么是季節(jié)性?

 

  如果需要提示,當(dāng)某些模式不一致時(shí)會發(fā)生季節(jié)性變化,但會周期性出現(xiàn)。例如,每周查看YouTube搜索的圣誕節(jié)歌曲,例如“ Jingle Bells ”。
 

SARIMAX模型
 

  在每年的12月的節(jié)日期間,這種情況的發(fā)生頻率更高。但是,這些歌曲的播放次數(shù)通常在6月或7月要低得多。

 

  因此,簡單的自回歸組件不能很好地描述數(shù)據(jù)。

 

  詳細(xì)地說,一個(gè)簡單的AR組件會嚴(yán)重地低估基于11(滯后1)的統(tǒng)計(jì)數(shù)據(jù),圣誕節(jié)歌曲在12月播放的次數(shù)。同時(shí),它也將大大夸大1月份的數(shù)字,以12月份記錄的數(shù)值為基礎(chǔ),因?yàn)檫@種類型通常在圣誕節(jié)后有所下降。

 

  我們?nèi)绾翁幚砑竟?jié)性問題?

 

  為了說明這種模式,我們需要將上一個(gè)節(jié)日期間記錄的值包括到模型中。在此特定示例中,這意味著要依賴于去年12月播放歌曲的次數(shù)。當(dāng)然,我們還可以包含兩個(gè)12月甚至更晚的數(shù)據(jù)。
 

SARIMAX模型

  有點(diǎn)像有另一個(gè)系列比我們最初的系列在時(shí)間上進(jìn)一步擴(kuò)展?;氐揭魳肥纠?,原始時(shí)間序列包含相隔一個(gè)月的值,而季節(jié)性序列包含相隔12個(gè)月的值。
 

SARIMAX模型

  SARIMAX模型定義

 

  現(xiàn)在我們已經(jīng)熟悉了季節(jié)性模型的一般概念,接下來讓我們看看我們使用的符號以及每個(gè)值的含義。與ARIMAX相比,SARIMAX需要另外4個(gè)訂單。
 

SARIMAX模型

  這聽起來可能很多,但無需擔(dān)心!

 

  這4個(gè)訂單中的前3個(gè)只是ARIMA訂單的季節(jié)性版本。
 

SARIMAX模型
 

  換句話說,我們有一個(gè)以大寫字母P表示的季節(jié)性自回歸階,以大寫字母D表示的季節(jié)性積分階和以大寫Q表示的季節(jié)性移動平均階。為便于區(qū)分,計(jì)量經(jīng)濟(jì)學(xué)家同意使用小寫字母表示非季節(jié)性的字母。
 

SARIMAX模型
 

  第四個(gè)也是最后一個(gè)順序是循環(huán)的長度。例如,如果我們有每小時(shí)的數(shù)據(jù),并且周期長度為24,則季節(jié)性模式每24小時(shí)出現(xiàn)一次。

 

  季節(jié)性模型的周期長度是多少?

 

  另一種思考的方式是趨勢重新出現(xiàn)之前必須經(jīng)過的時(shí)間段數(shù)。如果要檢查季節(jié)性趨勢,則需要確保設(shè)置適當(dāng)?shù)闹芷陂L度。我們用小寫的“ s”表示最后一個(gè)訂單,因?yàn)樗O(shè)置了每個(gè)季節(jié)的時(shí)長。

 

  我們?nèi)绾谓忉尲竟?jié)性訂單?

 

  讓我們快速解釋這四個(gè)新訂單如何協(xié)同工作。

 

  本質(zhì)上,長度“ s”表示季節(jié)要素與當(dāng)前期間的距離。因此,如果我們有一個(gè)季節(jié)順序?yàn)?span lang="EN-US">(2,0,15)的模型,那么我們將包括510個(gè)周期之前的滯后值以及5個(gè)周期之前的誤差項(xiàng)。每個(gè)周期為“ 5”個(gè)周期,我們采用2個(gè)滯后的季節(jié)性值。因此,我們僅包括510個(gè)周期前的值。同樣,我們添加了5個(gè)周期前的誤差項(xiàng)。
 

SARIMAX模型

  概括地說,我們對每個(gè)“ s”值都感興趣。我們從第“ s”個(gè)開始,一直到“ s,乘以p”。季節(jié)性積分值和季節(jié)性誤差也是如此。
 

SARIMAX模型
 

  SARIMAX模型的方程是什么?

 

  讓我們看看階(1,0,1)和季節(jié)性階(2,0,1,5)SARIMAX模型的方程是什么樣的。
 

SARIMAX模型
 

  有趣的是,每個(gè)季節(jié)性要素還包含其他滯后值。如果要了解原因,可在此處找到SARIMAX模型背后數(shù)學(xué)的詳細(xì)說明。

 

  那么,從方程式中我們可以看到什么呢?我們估計(jì)的系數(shù)總數(shù)等于季節(jié)性和非季節(jié)性ARMA訂單的總和。換句話說,我們正在查看“ PQ,加pq”的總數(shù)許多系數(shù)。
 

SARIMAX模型
 

  非季節(jié)性的用小寫的?θ表示; 而其季節(jié)性對應(yīng)物分別用大寫ΦΘ表示。就像訂單一樣,大寫字母表示季節(jié)性成分,小寫字母表示非季節(jié)性成分。

 

  因此,這是您需要的季節(jié)性模型的基本知識。但是,如果您想了解有關(guān)時(shí)間序列和時(shí)間序列數(shù)據(jù)的更多信息,請務(wù)必查看有關(guān)該主題的文章。

 

  如果您不熟悉 Python,并且熱衷于了解更多信息,那么這篇有關(guān)學(xué)習(xí)Python編程的綜合文章將指導(dǎo)您從安裝到Python IDE,庫和框架,再到最佳Python職業(yè)發(fā)展道路,以及工作前景。


 

預(yù)約申請免費(fèi)試聽課

填寫下面表單即可預(yù)約申請免費(fèi)試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費(fèi)! 怕學(xué)不會?助教全程陪讀,隨時(shí)解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動者教育科技有限公司版權(quán)所有
備案號:京ICP備12034770號

?2007-2022/ mwtacok.cn 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號

網(wǎng)站地圖