poniedziałek, 7 lipca 2014

Darmowe Data Mining? Rattle + R

Chciałbym podzielić się ciekawostką dotyczącą DataMining.
przydatną do samokształcenia, analiz biznesowych, poszukiwania zależności między zmiennymi.

Funkcje analityczne, data mining oferują głównie
drogie pakiety korporacyjne z licencjami stanowiskowymi - SAS, Statistica, MS SQL Analysis Toolpack. Jest jednak coś równie funkcjonalnego i za darmo, co można zabrać do domu - Rattle plus R.

R to pakiet statystyczny open source, bardzo popularny na uczelniach.
Wymaga znajomości dość rozbudowanej składni R i programowania. Natomiast Rattle to nakładka na R, UI, służąca do Data Mining i nie wymaga ani linijki kodu.

Do czego służy:  Np chciałbym zobaczyć czy między kilkoma zmiennymi jest prosta zależność
w postaci skupień i zaprezentować je w postaci wykresu. To mogą być dowolne zależności, np.  występujące przy analizie cen, rabatów, danych medycznych. Excel tego nie oferuje, udostępnia jedynie prostą analizę regresji.
________________________________________
Film poniższy (bardzo polecam) pokazuje przykład analizy w Rattle.

https://www.youtube.com/watch?v=OBilaZZpvGs
________________________________________


Linki do oprogramowania R i Rattle:

http://rattle.togaware.com/
http://www.r-project.org/

Wersje R i R-studio przenośne w formacie paf (portableapps) na klucz USB :-)
do zabawy w domu.
(bez zaśmiecania komputerów)
http://sourceforge.net/projects/rportable/?source=directory

Brak komentarzy:

Prześlij komentarz