
Habr, halo!
Di laboratorium untuk pemodelan sistem alami di Pusat Pengembangan Kognitif Nasional di ITMO University, kami secara aktif meneliti penggunaan pembelajaran mesin otomatis untuk berbagai tugas. Pada artikel ini, kami ingin berbicara tentang penggunaan AutoML untuk perkiraan deret waktu yang efisien, serta bagaimana penerapannya dalam kerangka kerja sumber terbuka FEDOT . Ini adalah artikel kedua dari serangkaian publikasi yang ditujukan untuk perkembangan ini (yang pertama dapat ditemukan di sini ).
Semua detail ada di bawah potongan!
Pembelajaran mesin otomatis (AutoML)
Ilmu Data Modern telah menjadi bagian yang sangat populer di bidang TI. Para ahli mengumpulkan data, membersihkannya, mencoba model yang berbeda, melakukan validasi, dan memilih yang terbaik. Dan semua ini untuk memberikan solusi yang akan memberikan nilai maksimal bagi bisnis. Pada saat yang sama, beberapa tahapan untuk mendapatkan solusi tersebut semakin otomatis setiap tahun. Biasanya, ini berlaku untuk bagian paling rutin. Ini membebaskan waktu para ahli untuk tugas yang lebih penting.
Jadi, mari kita bayangkan bahwa seorang spesialis dihadapkan pada tugas membangun model pembelajaran mesin dan "membungkusnya" dalam layanan web sehingga model ini melakukan pekerjaan yang berguna - memprediksi sesuatu. Namun sebelum Anda masuk ke tahap pelatihan model, Anda perlu melalui beberapa langkah, antara lain:
- mengumpulkan data dari banyak sumber, bersihkan;
- , , ;
- , ;
- .
, , . , , , , . , - , . — MLFlow, Apache AirFlow . — - workflow management system (WMS) . .
, ?
, “”, . “” ML .
. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML “ , ( ) ”. , . ( ) , : TPOT FEDOT.
SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.
, AutoML : . , , . , .
, , open-source . , — ( ).
, . : , . : , , — . AutoML legacy — , ( “ ”) : , .
, - , — . open-source — AutoTS. “” — AR ARIMA. “” , ( ), . , , pmdarima.
— AutoML- . . , , H2O, . , open-source , , , . .
AutoML-?
, , . :
- (, , — , — );
- ;
- () ;
- ( -);
- in-sample out-of-sample ;
- — ?
, , , — .
AutoML . , , data-driven , .. , .. - .
AutoML, . , open-source AutoML , — FEDOT.
, , — . , , , (, ). .
, , . , , .. , , , . , , baseline .
, , (, , ).
. , , . FEDOT, , .
, FEDOT , :
- — , : (, , ) , ;
- — , . . Primary , Secondary — ;
- — , . FEDOT ( Chain).
:
, FEDOT
, , , .
. “”, — . — . — “” AutoML. , . , — .
FEDOT
, . FEDOT- . ? , , ? ?
! .
. — , . , . , , :

“lagged-“ . FEDOT “lagged”. — .
1 . , . muli-target . :

. 3 lagged
. , AR ARIMA. , .
: — . — . ⋅.

, , . — , , . , .
14 . , — .
, . , . , , jupyter notebook’.
— . FEDOT :
- , ;
- ;
- .
, , , . . . . .
, ,
lagged-, , ridge- (. ), “”.
, — “”. , , .
. , , . , , . ( ) . — — . . , , , . ( ) , — .
:
! “” . . . () (). FEDOT.
, :
(, — )
.
AutoML. FEDOT , API.
, “”. AutoML :
- — . , , . , , “” . ;
- — , , . , .
:
.
. : (MAE) (RMSE): MAE — 100.52, RMSE — 120.42.
, : ?
: . . 14 . 14 ( 42). in-sample .
, out-of-sample in-sample :
. in-sample out-of-sample
, 14 . 28 — 2 14 . , (out-of-sample).
, in-sample . ( ). , , .
FEDOT — 3- 14 . . . , , .
14 .
. , , .
( ). , ,
, . , , , . , .
— K- , . , . K- . — .
, , , .
, “” ,
, — , 1000 ⋅, 0. . (, ) . K-nn . , , : MAE — 88.19 RMSE — 177.31.
, - . 5 . , , .
: . , , . , -, ( ). : . , FEDOT , . !
FEDOT open-source — AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):
| ∓ | RMSE∓CKO | |
|---|---|---|
| pmdarima | 155∓1 | 196∓1 |
| AutoTS | 198∓22 | 236∓41 |
| FEDOT | 110∓14 | 170∓26 |
:

, FEDOT “ ”.
, , AutoML. , ML-, .
AutoML FEDOT: , . FEDOT .
:
AutoML, FEDOT!
Bekerja pada artikel: Mikhail Sarafanov , Pavel Vychuzhanin dan Nikolai Nikitin .
