bigdata

R

r-project.org
r-fiddle.org
www.inp.nsk.su/~baldin/DataAnalysis
en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R
pbdR -- Programming with Big Data in R

scikit-learn

scikit-learn.org
pdf-documentation

hadoop/spark

wiki.apache.org/hadoop
spark.apache.org/docs/latest/quick-start.html
coursera.org/learn/hadoop/
bigdata-video-ru
how-to-run-apache-spark-on-windows7
cloudera-quickstart-vm
www.mmds.org -- Mining Massive Datasets (book)

data-science-toolkit-class

dstoolbox.pptx
final-project-guidelines
information-retrieval-2010

jobs

66 job interview questions for data scientists
www.r-users.com (ds job listing)
www.kaggle.com/jobs
Job: Data Scientist (IBM, Moscow)
Job: Postdoc in Biostatistics (Seattle, WA, USA) (H1-B виза вне квот)
Job: Прикладной исследователь (Data Mining, Information Retrieval) (Яндекс, Москва)

Экономика данных - Спецпроект slon.ru

datasets

Awesome public datasets

PAKDD2014 -- Предсказание отказов компонент электронных устройств на основании данных по продажам и отказам
kaggle.com/c/pakdd-cup-2014/data
Черкесов Г.Н. Надежность аппаратно-программных комплексов
Как вычисляется среднее время до отказа и вероятность безотказной работы? habrahabr.ru
Надежность технических систем (под ред. И.А. Ушакова)
Dealing with suspension

MNIST -- использование алгоритма машинного обучения для распознавания рукописных цифр
kaggle.com/c/digit-recognizer/data
en.wikipedia.org/wiki/MNIST_database
rf_benchmark.R
knn_benchmark.R
kaggle.com/c/digit-recognizer/forums/t/5428/what-do-these-digits-look-like

Otto Group Classification Challenge
www.kaggle.com/c/otto-group-product-classification-challenge/data

sequential-analysis

seq-intro-es
seq-intro-ru
lmp-diss

hmm

hmm-seq-data-clustering
hmm-intrusion-detection
hmm-speech-and-finance-(valiev)
HMMtests_two_components_preprint.pdf
sprt-and-cusum-in-hidden-markov-models

main-page