Monthly Archives: December 2013

5 lessons we learned about data science in 2013

A good article I want to share with you: 5 lessons we learned about data science in 2013 1. Data scientist should be creative: we don’t know how to solve the problem until we dig into the data. Maybe there is … Continue reading

Posted in Big Data | Leave a comment

Đánh giá quá trình thực tập

Chào các bạn thực tập viên của Big Data, Sau đây là thống kê tiến độ hoàn thành công việc của các thực tập viên trong thời gian vừa qua. Sau khi các bạn nộp bài thì các bạn vô … Continue reading

Posted in Internship | Tagged , , , | Leave a comment

Đánh giá quá trình thực tập trong tuần thứ tư

Chào các bạn thực tập viên Big Data, Sau đây là thống kê tiến độ hoàn thành công việc của các thực tập viên trong tuần thứ tư.       Thân, Nguyễn Trung Dũng

Posted in Internship | Tagged | Leave a comment

Hướng dẫn cài đặt Hadoop 1.x trên ubuntu – máy đơn

Hadoop là một thư viện mã nguồn mở được viết bằng ngôn ngữ Java dùng để xử lý phân tán một khối lượng dữ liệu vô cùng lớn. Trong bài viết này, mình sẽ hướng dẫn các bạn cài đặt … Continue reading

Posted in Hadoop | 14 Comments

Easy Web Applications In R – Shiny

Shiny is a new package from RStudio that makes it incredibly easy to build interactive web applications with R. You can visit Shiny Homepage. And click on tutorial. Let’s walk through the steps of building a simple Shiny application. A … Continue reading

Posted in R, Visualization | Tagged , | Leave a comment

Issue #025 – Final Project

(Up to 40 hours) Criteria Group work Work up to Issue #24 Pick one of these topics below Topics Data Science London + Scikit-learn (http://www.kaggle.com/c/data-science-london-scikit-learn) Sentiment Analysis on Movie Reviews (http://www.kaggle.com/c/sentiment-analysis-on-movie-reviews) Or any trustful challenges such as Kaggle, Dextra, IBM … Continue reading

Posted in Internship, Python, R | Leave a comment

#024 – Digit Recognizier with Python – SVM

(Expected hours: 8) Preparation Installed python Descriptions: http://www.kaggle.com/c/digit-recognizer. Data: http://www.kaggle.com/c/digit-recognizer/data. SVM algorithm: http://en.wikipedia.org/wiki/Support_vector_machine. SVM in library sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html. One-site support   Helping intern install library sklearn and using it.   Installing relative libraries Verification  Make sure the intern can read data … Continue reading

Posted in Internship, Python | Leave a comment

#023 – Digit Recognizier with Python – RF

(Dự kiến 4h) Chuẩn bị Máy đã cài đặt sẵn Python. Link mô tả bài toán: http://www.kaggle.com/c/digit-recognizer. Link dữ liệu train & test: http://www.kaggle.com/c/digit-recognizer/data. Link về giải thuật RF: http://en.wikipedia.org/wiki/Random_forest. Link về thư viện RF trong sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html. Hỗ trợ … Continue reading

Posted in Internship, Python | Leave a comment

#022 – Digit Recognizer with python – Knn

Preparation Installed python Descriptions: http://www.kaggle.com/c/digit-recognizer. Data: http://www.kaggle.com/c/digit-recognizer/data. Knn algorithm: http://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm. Knn in library sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html. One-site support   Helping intern install library sklearn and using it.   Installing relative libraries Verification Make sure the intern can read data successfully Using … Continue reading

Posted in Internship, Python | Leave a comment

#21 – Titanic Machine Learning Disaster

(Expected hours: 8) Preparation    Installed Ipython Notebook   Installed git.   Description: http://www.kaggle.com/c/titanic-gettingStarted Data: http://www.kaggle.com/c/titanic-gettingStarted/data Source code: https://github.com/agconti/kaggle-titanic One-site support   Helping intern install and use Ipython Notebook   Helping intern install and use git Helping intern fix bugs … Continue reading

Posted in Internship, Python | 1 Comment