piątek, 24 czerwca 2016

TED: Peter donnelly shows how stats fool juries

Especially starting from 11th minute... reminds me about the need to review the measures of the model: specificity, sensitivity... more here: https://en.wikipedia.org/wiki/Sensitivity_and_specificity

czwartek, 23 czerwca 2016

xgboost, caret, cleaning, time series - a reading list for next weeks.

Go through this to learn xgboost:
https://github.com/dmlc/xgboost/blob/master/R-package/vignettes/discoverYourData.Rmd
https://cran.r-project.org/web/packages/xgboost/vignettes/discoverYourData.html
https://github.com/dmlc/xgboost/blob/master/R-package/vignettes/xgboostPresentation.Rmd

https://github.com/dmlc/xgboost/tree/master/R-package/demo
https://rpubs.com/flyingdisc/practical-machine-learning-xgboost

http://courseprojects.souravsengupta.com/tag/xgboost/
http://xgboost.readthedocs.io/en/latest/R-package/xgboostPresentation.html
https://www.kaggle.com/jkapila/caterpillar-tube-pricing/0-24-with-xgboost-in-r/run/29813
http://www.analyticsvidhya.com/blog/2016/01/xgboost-algorithm-easy-steps/

Material from recent meetup in Warsaw:
https://github.com/mi2-warsaw/SER/blob/master/SER_XIX/xgboost.R


Cleaning and  some interesting packages (editrules, deducorrect):
https://cran.r-project.org/doc/contrib/de_Jonge+van_der_Loo-Introduction_to_data_cleaning_with_R.pdf
http://www.r-bloggers.com/three-quick-and-simple-data-cleaning-helper-functions-december-2013/
http://www.meetup.com/amst-R-dam/events/57161682/ and especially:
http://cran.r-project.org/web/packages/editrules/index.html
http://cran.r-project.org/web/packages/deducorrect/index.html
Very good examples: https://github.com/data-cleaning
 http://www.r-bloggers.com/deductive-imputation-with-the-deducorrect-package/

Time Series:
http://www.r-bloggers.com/time-series-analysis-and-mining-with-r/

Ensemble:
https://cran.r-project.org/web/packages/caretEnsemble/vignettes/caretEnsemble-intro.html

Caret: (very good stuff): https://github.com/pbiecek/DataMining/tree/master/MINI_2015


Other:  
http://www.datasciencecentral.com/m/blogpost?id=6448529%3ABlogPost%3A352821

Github new tools (also offline):
Write a book:  
https://www.gitbook.com/
Collect and share snippets of code:
https://gist.github.com/


 

niedziela, 19 czerwca 2016

Prośba o głos na projekty dot. szkoły podstawowej SP312

 Rodzice i dzieci SP312 (Warszawa Gocław)  proszą o głosy. Można głosować na kilka projektów!Najłatwiej przez internet: https://app.twojbudzet.um.warszawa.pl/2017/voting/voter

DZIELNICA: PRAGA POŁUDNIE OBSZAR: OGÓLNODZIELNICOWE
NR 22 BEZPIECZEŃSTWO DZIECI W DRODZE DO SZKOŁY SP312, W JEJ OTOCZENIU
I NA PRZYSZKOLNYCH BOISKACH. (Projektodawca: Jacek Kotowski)-185.400zł
Modernizacja monitoringu szkoły i doświetlenie jej otoczenia i
podłączenie do systemu miejskiego (Straż Miejska/Policja).
To jest projekt ogólnodzielnicowy, głos nie wpływa na projekty dot. dzielnicy Praga Południe.
===================
DZIELNICA: PRAGA POŁUDNIE OBSZAR: GOCŁAW
NR 4 NAUKA I ZABAWA - PRACOWNIE MULTIMEDIALNE W SP NR 312 I WARSZTATY
UMIEJĘTNOŚCI RODZICIELSKICH - 42.700ZŁ
Projekt polega na wyposażeniu trzech sal lekcyjnych Szkoły Podstawowej
nr 312 w zestawy multimedialne. Tablica interaktywna, projektor, laptop.
Zestawy multimedialne będą także wykorzystywane podczas spotkań z
rodzicami i prowadzonych na terenie SP nr 312 warsztatów umiejętności
rodzicielskich otwartych dla wszystkich rodziców z Gocławia. Będzie
to cykl 10 spotkań warsztatowych.
NR 13 REMONT PLACU ZABAW PRZY UL. UMIŃSKIEGO 12, PRZY SP NR 312,
OGÓLNODOSTĘPNEGO POPOŁUDNIAMI I W WEEKENDY. - 192.500ZŁ
Projekt polega na wymianie obecnych urządzeń na placu zabaw i
dokupieniu nowych. Projekt obejmuje również wymianę nawierzchni placu
zabaw z piaskowej na poliuretanową.
NR 16 BEZPŁATNE ZAJĘCIA JĘZYKA ANGIELSKIEGO DLA DZIECI Z GOCŁAWIA
WRAZ Z ODNOWIENIEM I DOPOSAŻENIEM SAL SP 312 - 76.220ZŁ
Projekt obejmuje przeprowadzenie kursu języka angielskiego dla 8 grup
12 osobowych w wymiarze 64 godzin w ciągu roku, doposażenie 4 sal SP
312 w sprzęt multimedialny (rzutnik, ekran, laptop) oraz remont 4 sal
(cyklinowanie podłóg).
NR 5 ŚCIEŻKA PRZYRODNICZA WZDŁUŻ KANAŁKU GOCŁAWSKIEGO NA ODCINKU
UL. FIELDORFA - UL. RECHNIEWSKIEGO. - 187.200ZŁ
Projekt polega na ustawieniu drewnianych tablic edukacyjnych i
światowidów interaktywnych wzdłuż północnej strony kanałku na
odcinku Ul. Fieldorfa - ul. Rechniewskiego. Dodatkowo projekt obejmuje
nasadzenie ozdobnej roślinności wodnolubnej wzdłuż kanałku na w/w
odcinku oraz remont chodnika.

JAK ZAGŁOSOWAĆ?
KROK 1 Wybierz dzielnicę głosowania - Praga Południe. Można
głosować tylko w jednej dowolnej dzielnicy, nie koniecznie tam gdzie
się mieszka. Głosować mogą tylko osoby mieszkające w Warszawie (nie
trzeba być jednak zameldowanym, nie trzeba być mieszkańcem Pragi
Południe). W głosowaniu może wziąć udział każdy mieszkaniec
Warszawy bez względu na wiek. Również dzieci! opiekun prawny
nieletnich musi wypełnić formularz zgody.
KROK 2 Wybierz obszar - Gocław. Dodatkowo, niezależnie od wybranego
(jednego!) obszaru każdy głosujący na Pradze Południe będzie mógł
również zagłosować na projekty ogólnodzielnicowe - można
zagłosować na obu poziomach i na projekty lokalne i na projekty
ogólnodzielnicowe.
KROK 3 Wybierz projekty. Głosując, można wybrać DOWOLNĄ LICZBĘ
PROJEKTÓW, ale trzeba pamiętać, że łączny koszt realizacji
wszystkich wybranych przez Ciebie projektów nie może być większy
niż kwota dostępna w wybranym obszarze i na poziomie
ogólnodzielnicowym (w przeciwnym wypadku Twój głos zostanie policzony
jako nieważny). Kwota na projekty ogólnodzielnicowe na Pradze
Południe to 446 829 zł , kwota na obszar Gocław to 969 245 zł W
NASZYM PRZYPADKU MOŻNA WIĘC GŁOSOWAĆ NA WSZYSTKIE SZKOLNE PROJEKTY.
KROK 4 ZAGŁOSUJ od 14 czerwca do 24 czerwca 2016 r. możesz to zrobić
na kilka sposobów:
1. Najłatwiej jest zagłosować przez Internet poprzez stronę
www.twojbudzet.um.warszawa.pl Należy posiadać adres e-mailowy. Należy
potwierdzić głosowanie w otrzymanym e-mailu potwierdzającym
zagłosowanie przez internet. Inaczej głos będzie nie ważny.
2. Zagłosować można również papierowo przychodząc do wybranego
urzędu dzielnicy (w godzinach jego pracy, pomiędzy 14 a 24 czerwca) i
wrzucając do urny wypełnioną kartę do głosowania.
KROK 5 Namów znajomych i sąsiadów aby również zagłosowali na
szkolne projekty SP 312. Wydrukuj plakat (załącznik i powieś u siebie
w bloku)

wtorek, 14 czerwca 2016

środa, 8 czerwca 2016

Marriage of Data Science (R, Python) with ham radio.

How about building a statistical machine learning model in R on in Python, that decodes Morse code.
If it is possible to teach machines identify whales based on very poor images of patterns on their backs with commonly available library in Python, why not try decode CW transmission from noisy, distorted samples.
It has been tried already in two Kaggle competitions:

Google: morse machine learning kaggle  for more :-)

It may be a good project for high-school intro to signal processing and data mining!