时间数列数据分析与预测之Python工具汇总
永安娱乐新闻网 2025-09-02
它赞成来自各种文件有时候的数据库回传,基本功能箱括 CSV、JSON、Parquet、SQL 数据库纳注记和查询以及 Microsoft Excel。此外,Pandas 准许各种数据库操作功用,例如分拆、重塑、选择以及数据库清理和整理。
一些惯用的时长数列有所不同之处是:
迟于范围转换成和频率转成 移动售票处总和 移动售票处线病态复归 迟于转成 滞后等等 NumPy 的时长数列拒绝执行NumPy 是一个 Python 纳,它增加了对巨大的多维操作符和矩阵的赞成,以及可以在这些操作符上惯用大量见习数学演算的算孙子。它的句法与 MATLAB 相当相似,基本功能箱括一个新技术的多维操作符;也以及拒绝执行这些操作符的能力。
NumPy 的 datetime64 数据库有时候和操作符可以相当简便地注记示时长数列中的的迟于。惯用 NumPy 还可以总能地惯用几何学演算同步进行各种时长数列演算。
Datetime 的时长数列拒绝执行
Datetime 是一个 Python 孙子种系统,它准许我们拒绝执行迟于和时长。该孙子种系统基本功能箱含拒绝执行场景所须要的基本功能和功用,例如:
迟于和时长的注记示 迟于和时长的算术 迟于和时长的相对惯用此基本功能拒绝执行时长数列很比较简单。它准许用户将迟于和时长转成为;也并对其同步进行操作。例如,只须要要几行字符,就可以从一种 DateTime 编解码机转成为另一种编解码机,移除到迟于的天数、月数或年数,或者测算两个时长;也彼此间的的单位差异。
Tsfresh 的时长数列拒绝执行
Tsfresh 是一个 Python 基本功能箱。它亦会相应测算大量的时长数列有所不同之处,统称有所不同之处。该插件基本功能箱将来自总和、时长数列统计分析、信号拒绝执行和非线病态动力学的既定插值与有力的有所不同之处选择插值辅以,以提仅供者种系统的时长数列有所不同之处提炼出。
Tsfresh 基本功能箱基本功能箱括一个过滤服务机上端,以防止提炼出不就其的有所不同之处。此过滤服务机上端评估每个有所不同之处对复归或类群远距离的解读能力和最主要病态。
见习时长数列功用的一些解释机是:
傅里叶叠加组件 小的卡叠加组件 偏自就其等 数据库统计分析和可视化基本功能箱数据库统计分析和可视化基本功能箱是试由此可知数据库统计分析曾随他们的数据库中的始创可视化和数学公式的基本功能。数据库统计分析被判别为清理、转成和建模数据库的每一次,以便发现对业务议程精确的接收者。数据库统计分析的远距离是从数据库中的提炼出精确的接收者并根据该接收者花钱出议程。
数据库的可视化注记示统称数据库可视化。惯用数学公式和可视化等可视化原素的数据库可视化基本功能提仅供者了一种提示和理解数据库趋向和种种系统的简便基本功能。
时长数列有大量的数据库统计分析和可视化基本功能箱,这里总结了其中的的一些惯用的基本功能。
Matplotlib 的时长数列可视化
主要用途数据库可视化的最风靡一时的 Python 基本功能箱可能会是 Matplotlib。它主要用途始创静态、OVA和交互式可视化。惯用 Matplotlib 可以花钱一些不想,例如:
制作适合出版的地块
始创可以放大、翻转和非常新的交互式可视化
改变视觉音乐风格和布局
Plotly 时长数列可视化
Plotly 是一个交互式、Ubuntu和基于JavaScript的 Python 和 R 可视化纳。它是一个见习的声明病态数学公式纳,具 30 多种数学公式有时候,基本功能箱括科学研究课题数学公式、3D 数学公式、总和数学公式、SVG 地由此可知、金融本机构数学公式等等。
除此正因如此,惯用 Plotly 还可以所画基于时长数列的交互式数学公式,例如折线由此可知、甘特由此可知、散点由此可知等。
Statsmodels 时长数列可视化
Statsmodels 是一个 Python 基本功能箱,它提仅供者了主要用途至少各种总和静态以及接入总和测试者和总和数据库统计分析的类和算孙子。
它为时长数列氧化及其可视化提仅供者了一种相当简便的基本功能。惯用这个基本功能箱,可以总能氧化任何时长数列并统计分析其交汇点,例如趋向、冬天交汇点以及残差或噪声。
statsmodels 纳在名为seasonal_decompose的算孙子中的提仅供者了比较简单或当代氧化基本功能的借助。它要求你指定静态是加法还是乘法。 seasonal_decompose 算孙子留在一个结果;也。结果;也以操作符范例提仅供者对趋向和冬天复刻版的采访。它还提仅供者了对残差的采访,残差是趋向之后的时长数列,并且去除了冬天化学成分。
时长数列预期基本功能箱
时长数列单项中的不可忽视的之外可能会是预期。预期是根据当前和过去的数据库预期未来政治事件的每一次。它基于这样一种方法论上,即未来可以从过去借助。此外,它方法论上数据库中的有一些种种系统可主要用途预期年中亦会牵涉到什么。
时长数列预期的基本功能很多种,从比较简单的线病态复归和基于 ARIMA 的基本功能开始,到复杂的多层人脑或自带静态。在这里,我们将展示一些赞成有所不同有时候静态的基本功能箱。
惯用 Statsmodels 同步进行时长数列预期
Statsmodels 是我们在数据库可视化基本功能一节中的并未写到的一个基本功能箱。但是,这是一个非常就其的预期基本功能箱。实质上,这个基本功能箱提仅供者了一复刻版总和静态和方法论上检验。
Statsmodels 基本功能箱则有主要用途时长数列统计分析的静态类和算孙子。自复归移动平均静态 (ARMA) 和内积自复归静态 (VAR) 是基本静态的解释机。马尔可夫读取一个种系统复归和自复归是非线病态静态的解释机。它则有时长数列揭示病态总和,例如自就其、偏自就其算孙子和天数由此可知,以及 ARMA 或就其每一次的方法论病态质。
Statsmodels[8] 揭示了如何惯用 Statsmodels 基本功能箱开始惯用时长数列。
惯用 Pmdarima 同步进行时长数列预期
Pmdarima 是一个总和纳,有助于惯用基于 ARIMA 的基本功能对时长数列同步进行建模。除此正因如此,它还具其他功用,例如:
一个大平稳病态和冬天的总和检验 各种内生和外生变压机,基本功能箱括 Box-Cox 和傅里叶叠加 冬天时长数列、斜向证明实用服务机上端和其他基本功能的氧化也许这个纳最精确的基本功能是 Auto-Arima 孙子种系统,它在提仅供者的约束内提示所有可能会的 ARIMA 静态,并根据 AIC 或 BIC 系数留在最佳静态。
这个基本功能箱不是很常见于,这里给出一个比较简单的例孙子:
上下滑动提示非常多源码
importpmdarima aspm
frompmdarima importmodel_selection
importmatplotlib.pyplot asplt
importnumpy asnp
# 初始化数据库并将其拆分为单独的之外
data = pm.datasets.load_lynx
train, test = model_selection.train_test_split(data, train_size= 100)
# fit一些证明(cv)采样
arima = pm.auto_arima(train, start_p= 1, start_q= 1, d= 0, max_p= 5, max_q= 5,
out_of_sample_size= 10, suppress_warnings= True,
stepwise= True, error_action= 'ignore')
# 如今所画测试者集的结果和预期
preds, conf_int = arima.predict(n_periods=test.shape[ 0],
return_conf_int= True)
fig, axes = plt.subplots( 2, 1, figsize=( 12, 8))
x_axis = np.arange(train.shape[ 0] + preds.shape[ 0])
axes[ 0].plot(x_axis[:train.shape[ 0]], train, alpha= 0.75)
axes[ 0].scatter(x_axis[train.shape[ 0]:], preds, alpha= 0.4, marker= 'o')
axes[ 0].scatter(x_axis[train.shape[ 0]:], test, alpha= 0.4, marker= 'x')
axes[ 0].fill_between(x_axis[-preds.shape[ 0]:], conf_int[:, 0], conf_int[:, 1],
alpha= 0.1, color= 'b')
# 填写在静态中的"held out"采样的之外
axes[ 0].set_title( "Train samples & forecasted test samples")
# 如今将实际采样移除到静态中的并始创NEW预期
arima.update(test)
new_preds, new_conf_int = arima.predict(n_periods= 10, return_conf_int= True)
new_x_axis = np.arange(data.shape[ 0] + 10)
axes[ 1].plot(new_x_axis[:data.shape[ 0]], data, alpha= 0.75)
axes[ 1].scatter(new_x_axis[data.shape[ 0]:], new_preds, alpha= 0.4, marker= 'o')
axes[ 1].fill_between(new_x_axis[-new_preds.shape[ 0]:],
new_conf_int[:, 0], new_conf_int[:, 1],
alpha= 0.1, color= 'g')
axes[ 1].set_title( "Added new observed values with new forecasts")
plt.show
惯用 Sklearn 同步进行时长数列预期
Sklearn 或 Scikit-Learn 不可否认是 Python 中的最惯用的方法学基本功能箱之一。它提仅供者了各种类群、复归和聚类基本功能,基本功能箱括随本机雨林、赞成内积本机、k-means 等。除此正因如此,它还提仅供者了一些与降维、静态选择、数据库预拒绝执行等就其的实用服务机上端。
除了各种静态正因如此,对于时长数列,还有一些精确的功用,例如的水、时长数列斜向证明算孙子、主要用途测量结果的各种当前等。
惯用 PyTorch 同步进行时长数列预期
PyTorch 是一个基于 Python 的广度自学纳,主要用途快速轻松的实验。它最初由 Facebook 人工智能研究课题的团队的研究课题技术人员和工程项目师种系统设计开发,然后Ubuntu。Tesla Autopilot、Uber 的 Pyro 和 Hugging Face 的 Transformers 等广度自学插件都建立在 PyTorch 从前。
惯用 PyTorch,可以框架有力的循环人脑静态,例如 LSTM 和 GRU 以及预期时长数列。此外,还有一个具最精良网络架构的 PyTorch 预期基本功能箱(PyTorch Forecasting )。它则有一个时长数列数据库集类,主要用途抽象化拒绝执行函数转成、纠正系数、随本机孙子采样、多个历史背景大小和其他类似疑虑。
PyTorch Forecasting 旨在通过人脑简化最精良的时长数列预期,以主要用途现实世界的案例和研究课题等。远距离是为私人本机构提仅供者具小得多轻松病态并为入门提仅供者充分默认系数的见习 API。就其来说,该插件基本功能箱提仅供者
一个时长数列数据库集类,它抽象化拒绝执行函数转成、纠正系数、随本机孙子采样、多个历史背景大小等。
一个基本静态类,它提仅供者时长数列静态的基本训练以及登录标量板和通用可视化,例如实际与预期和依赖由此可知
主要用途时长数列预期的多个人脑架构,已针对实际地面部队同步进行了弱化,并具内置的解读功用
多技术水平时长数列当前
Ranger 优化机主要用途较慢的静态训练
惯用optuna同步进行极限数值修改
惯用 Tensorflow (Keras) 同步进行时长数列预期TensorFlow 是一个基于数据库流由此可知的方法学Ubuntu插件纳。它最初由 Google Brain 的团队种系统设计开发仅供内部惯用,但后来作为Ubuntu单项刊发。该插件纳提仅供者了一个大见习数据库流算孙子,可以组合上去以人为的方式为注记达牵涉多维数据库操作符、矩阵和高级标量的复杂测算。它还提仅供者了一些高级别的原语,例如主要用途构造自判别演算符或加速拒绝执行常见于操作的内核。
Keras 是框架在 TensorFlow 从前的见习 API。惯用 Keras 和 TensorFlow,可以框架主要用途时长数列预期的人脑静态。下面的手册解读了惯用天气时长数列数据库集的时长数列单项的一个解释机:
惯用 Sktime 同步进行时长数列预期
Sktime 是一个主要用途时长数列和方法学的Ubuntu Python 纳。它基本功能箱括有效解决时长数列复归、预期和类群远距离所须要的插值和转成基本功能。始创 Sktime 是为了与 scikit-learn 一起指导工作,并且可以总能地为两者之间相关联的时长数列远距离修改插值以及框架相联静态。
总体而言,此基本功能箱提仅供者:
最精良的时长数列预期插值
时长数列的转成,例如去趋向或去干季化等
静态和转成、静态修改实用服务机上端和其他精确功用的的水
惯用 Prophet 同步进行时长数列预期Prophet 是 Facebook 核心数据库科学研究课题的团队刊发的Ubuntu纳。与此相反,它基本功能箱含一个预期时长数列数据库的服务机上端,该服务机上端基于一个加病态静态,该静态将一些非线病态趋向与年度、每周和每日冬天以及假日不稳定性辅以。它最适主要用途具强烈冬天受到影响的时长数列和来自多个干季的历史背景数据库。它不一定能够拒绝执行纠正数据库、趋向推移和诱发系数。
惯用 Pycaret 同步进行时长数列预期
PyCaret 是 Python 中的的一个Ubuntu方法学纳,可相应拒绝执行方法学指导工作流。惯用 PyCaret,可以用最少的指导工作和几行字符来框架和测试者多个方法学静态。一般用最少的字符,不须要要险恶细节,就可以框架一个从 EDA 到地面部队的上端到上端方法学单项。
这个纳有一些精确的时长数列静态,其中的基本功能箱括:
冬天高雅预期机
ARIMA
多项式趋向预期机
Lasso Net 具去干季化和去趋向默认以及许多其他默认
惯用 AutoTS 同步进行时长数列预期
AutoTS 是 Python 的时长数列基本功能箱,旨在相应化时长数列预期。它可主要用途为单函数和多函数时长数列寻找最佳时长数列预期静态。此外,AutoTS 本身亦会从数据库中的清洗任何纠正系数或诱发系数。
多达 20 个预判别静态(如 ARIMA、ETS、VECM)可用,并且惯用遗传插值,它可以为给定数据库集同步进行预拒绝执行、寻找最佳静态和静态自带。
惯用 Darts 同步进行时长数列预期
Darts 是一个 Python 纳,准许对时长数列同步进行比较简单的操作和预期。它基本功能箱括范围普遍的静态,从当代的 ES 和 ARIMA 到 RNN 和transformers。所有静态都可以以与 scikit-learn 基本功能箱中的完全相同的方式为惯用。
该纳还准许总能地对静态同步进行回测、组合来自多个静态的预期以及分拆受控数据库。它赞成单函数和多函数静态。可以在此处寻找所有可用静态的注记以及几个解释机:
# TimeSeries从 Pandas DataFrame始创一个;也,并将其拆分为训练/证明复刻版:
importpandas aspd
importmatplotlib.pyplot asplt
fromdarts importTimeSeries
fromdarts.models importExponentialSmoothing
df = pd.read_csv( 'AirPassengers.csv', delimiter= ",")
series = TimeSeries.from_dataframe(df, 'Month', '#Passengers')
train, val = series[: -36], series[ -36:]
# 拟合指数平滑静态,并对证明复刻版的持续时长同步进行(可能性)预期:
model = ExponentialSmoothing
model.fit(train)
prediction = model.predict(len(val), num_samples= 1000)
# 所画中的位数、第 5 和第 95 个百分位数:
series.plot
prediction.plot(label= 'forecast', low_quantile= 0.05, high_quantile= 0.95)
plt.legend
惯用 Kats 同步进行时长数列预期
Kats 是 Facebook 工程项目建设数据库科学研究课题的团队刊发的一个基本功能箱,旨在拒绝执行时长数列统计分析。这个基本功能箱的远距离是提仅供者时长数列统计分析所须要的一切,基本功能箱括检测、预期、有所不同之处提炼出/嵌入、多函数统计分析等。
Kats 提仅供者了一套全面的预期基本功能,例如自带、元自学静态、回测、极限数值修改和知识预期发车。此外,它则有主要用途检测时长数列数据库中的的冬天、诱发系数、推移点和缓慢趋向推移的功用。惯用 TSFeature 默认,可以转换成 65 个具细致总和判别的有所不同之处,这些有所不同之处可主要用途大多数方法学静态。
fromkats.models.sarima importSARIMAModel, SARIMAParams
# create SARIMA param class
params = SARIMAParams(p = 2, d= 1, q= 1,
trend = 'ct', seasonal_order=( 1, 0, 1, 12))
# initiate SARIMA model
m = SARIMAModel(data=air_passengers_ts, params=params)
# fit SARIMA model
m.fit
# generate forecast values
fcst = m.predict(steps= 30, freq= "MS")
m.plot
预期纳相对
这里提仅供者了一个基本功能箱含一些常见于功用的注记格来相对预期基本功能箱。注记中的显示了一些当前,例如 GitHub 星数、刊发迟于、赞成功用等。
上架迟于 GitHub 白日 总和与计量社会学 方法学 广度自学 Statsmodels 2010 7200 ✅ ✅ ✅ Pmdarima 2018 1100 ✅ ✅ Sklearn 2007 50000 ✅ ✅✅ ✅ PyTorch 2016 55000 ✅ ✅✅ TensorFlow 2015 164000 ✅ ✅✅ Sktime 2019 5000 ✅ Prophet 2017 14000 ✅ ✅ PyCaret 2020 5500 ✅ ✅ ✅ AutoTS 2020 450 ✅ ✅ Darts 2021 3800 ✅ ✅ ✅ Kats 2021 3600 ✅ ✅论断
在这书评中的,我们揭示了时长数列单项最惯用的基本功能、基本功能箱和纳。惯用此基本功能列注记,可以涵盖几乎所有与时长数列就其的单项。不可忽视的是,我们提仅供者了主要用途预期的纳的相对,其中的显示了一些有趣的总和数据库,例如刊发迟于、受欢迎以往以及它赞成的静态有时候。
上下滑动提示非常多
参考资料
[1]
Pandas: _guide/timeseries.html
[2]
NumPy:
[3]
Datetime: #module-datetime
[4]
Tsfresh:
[5]
Matplotlib:
[6]
Plotly:
[7]
Statsmodels: _decompose.html
[8]
Statsmodels:
[9]
pmdarima:
[10]
Sklearn:
[11]
PyTorch:
[12]
TensorFlow: _data/time_series
[13]
Sktime:
[14]
Prophet:
[15]
PyCaret: _series/api/time_series.html
[16]
autots_1280:
[17]
Darts:
[18]
smaimr1:
[19]
smaimr2:
点这里👇重视我,记得标星哦~
CDA教学咨询
。海露滴眼液开封后可以使用多久厦门白癜风医院怎么去
汉中白癜风医院那家比较好
广州看男科哪间医院好
天津男科专科医院哪个好
小孩便秘怎么办
解表药
儿科
肿瘤外科
抗心律不齐药
-
关于A-level工程学,那些不得不说的“小秘密”…
写真 2025-09-02、政治经济、英语等学门 (*非常少展示部份,全部文献资料再三扫码补发) 回复暗号【A-levelAndrewIG返校预习文献资料包】 立即获取福利补发方式!
-
告别失眠!8H Feel智能真皮电动床X Pro助力优质清醒,这下舒服了
八卦 2025-09-02俗话说得好,到根本无法的区域内都被称作看得见,回不去的区域内都被称作故乡,家是最吹拂的港湾。虽然说回家的事实有很多种,但是很难什么比昏倒自己的睡上更为不快的事了。随着电脑睡的普及,睡也被特别强调了更为
-
科大讯飞智能办公本Air正式发布,用AI之后定义记录
图片 2025-09-02能录音、能拉丁、能翻译……5月23日,以“专业课程,轻而易写”为主题的2022年科大资挥智能化宾馆本新品记者会同年举行,科大资挥智能化宾馆本Air在本次记者会上同年登场,智能化宾馆本后裔新作迎来
-
曝智能手机将于6月推出Nova 10系列5G套装版
资讯 2025-09-02集微网消息,据欧美国家数码博主爆料,三星 6 月末的新品人民网上,不仅有三星 nova 10 前传5G套装版 ,还有换装摩托罗拉笔记本电脑的三星智能手机,高刷等配置齐全。 p
-
能打的不只是颜值,杜伽K330w Plus初学者体验
影视 2025-09-02调校却是很拿手,杜伽K330w Plus的都只展现不太好,大键比较稳定不嘉芙莲,上方假径向周边地区也不曾有经常出现物料渗出的缺陷。径向体可用寿命高近8000万次,比较的耐用。由于平时码字比较多,在六种