HSOF
Opis Link to heading
HSOF to system doboru cech oparte na hybrydowym wyszukiwaniu, zaimplementowane w języku Julia. Narzędzie realizuje trójstopniowy proces redukcji wymiarowości danych. Pierwszy etap to szybkie filtrowanie cech na podstawie korelacji, wariancji i informacji wzajemnej. Drugi etap wykorzystuje algorytm Monte Carlo Tree Search (MCTS) do selekcji podzbioru cech. Trzeci etap przeprowadza ostateczną ewaluację przy użyciu modeli XGBoost, RandomForest i LightGBM. System konfiguruje się za pomocą plików YAML i obsługuje dane z baz SQLite. Projekt zawiera przykładową konfigurację dla zbioru danych Titanic. Kod jest podzielony na moduły odpowiadające poszczególnym etapom pipeline’u. Dostępne są testy jednostkowe dla każdego etapu procesu.