mdm

machine-learningdataset-managementdata-engineeringpythoncli-toolfeature-engineeringdata-science

Opis Link to heading

MDM (ML Data Manager) porządkuje pracę ze zbiorami danych w projektach uczenia maszynowego. Obsługuje SQLite, DuckDB i PostgreSQL, wykrywa typy kolumn oraz rozpoznaje typowe struktury danych z Kaggle. Udostępnia CLI i API w Pythonie, eksport do CSV, Parquet i JSON oraz hierarchiczną konfigurację z nadpisywaniem przez zmienne środowiskowe. Projekt zawiera warstwę inżynierii cech, przetwarzanie wsadowe i śledzenie postępu operacji. Repozytorium jest nastawione na powtarzalną pracę z dużymi datasetami.

Linki Link to heading