Losowe generowanie danych o znanej strukturze klas w pakiecie clusterSim
Abstract
W artykule zaprezentowana zostanie funkcja cluster.Gen pakietu clusterSim służąca do losowego generowania zbiorów danych o znanej strukturze klas, pracująca w środowisku R, która ma następujące zalety:
- pozwala na generowanie danych metrycznych (ilorazowych i przedziałowych), porządkowych oraz symbolicznych przedziałowych dla danej liczby wymiarów (zmiennych) - np. pięciu skupień w przestrzeni trójwymiarowej,
- położenie i jednorodność skupień zadaje się za pomocą wektorów wartości przeciętnych (środki ciężkości skupień) i macierzy kowariancji (rozproszenie obiektów),
- istnieje możliwość wygenerowania klas o różnej gęstości i kształcie, -istnieje możliwość uwzględnienia zmiennych zakłócających strukturę klas (noisy variabies) oraz obserwacji odstających (outliers).
Collections
- Artykuły / Articles [16165]
Using this material is possible in accordance with the relevant provisions of fair use or other exceptions provided by law. Other use requires the consent of the holder.