HSOF

feature-selectionjuliamachine-learningmctsdimensionality-reductiondata-science

Opis Link to heading

HSOF to system doboru cech oparte na hybrydowym wyszukiwaniu, zaimplementowane w języku Julia. Narzędzie realizuje trójstopniowy proces redukcji wymiarowości danych. Pierwszy etap to szybkie filtrowanie cech na podstawie korelacji, wariancji i informacji wzajemnej. Drugi etap wykorzystuje algorytm Monte Carlo Tree Search (MCTS) do selekcji podzbioru cech. Trzeci etap przeprowadza ostateczną ewaluację przy użyciu modeli XGBoost, RandomForest i LightGBM. System konfiguruje się za pomocą plików YAML i obsługuje dane z baz SQLite. Projekt zawiera przykładową konfigurację dla zbioru danych Titanic. Kod jest podzielony na moduły odpowiadające poszczególnym etapom pipeline’u. Dostępne są testy jednostkowe dla każdego etapu procesu.

Linki Link to heading