HSOF

feature-selectionjuliamachine-learningmctsdimensionality-reductiondata-science

Opis Link to heading

HSOF, czyli Hybrid Search for Optimal Features, to eksperymentalny system selekcji cech napisany w Julii. Pipeline składa się z trzech etapów: szybkiego filtrowania, wyboru podzbioru cech metodą Monte Carlo Tree Search oraz końcowej ewaluacji modelami XGBoost, RandomForest i LightGBM. Konfiguracja jest oparta na plikach YAML, a dane mogą być czytane z SQLite. Repozytorium zawiera przykład dla zbioru Titanic oraz testy jednostkowe dla głównych etapów przetwarzania.

Linki Link to heading