Archives
Categories
Meta
Monthly Archives: December 2013
5 lessons we learned about data science in 2013
A good article I want to share with you: 5 lessons we learned about data science in 2013 1. Data scientist should be creative: we don’t know how to solve the problem until we dig into the data. Maybe there is … Continue reading
Posted in Big Data
Leave a comment
Đánh giá quá trình thực tập
Chào các bạn thực tập viên của Big Data, Sau đây là thống kê tiến độ hoàn thành công việc của các thực tập viên trong thời gian vừa qua. Sau khi các bạn nộp bài thì các bạn vô … Continue reading
Đánh giá quá trình thực tập trong tuần thứ tư
Chào các bạn thực tập viên Big Data, Sau đây là thống kê tiến độ hoàn thành công việc của các thực tập viên trong tuần thứ tư. Thân, Nguyễn Trung Dũng
Hướng dẫn cài đặt Hadoop 1.x trên ubuntu – máy đơn
Hadoop là một thư viện mã nguồn mở được viết bằng ngôn ngữ Java dùng để xử lý phân tán một khối lượng dữ liệu vô cùng lớn. Trong bài viết này, mình sẽ hướng dẫn các bạn cài đặt … Continue reading
Posted in Hadoop
14 Comments
Easy Web Applications In R – Shiny
Shiny is a new package from RStudio that makes it incredibly easy to build interactive web applications with R. You can visit Shiny Homepage. And click on tutorial. Let’s walk through the steps of building a simple Shiny application. A … Continue reading
Issue #025 – Final Project
(Up to 40 hours) Criteria Group work Work up to Issue #24 Pick one of these topics below Topics Data Science London + Scikit-learn (http://www.kaggle.com/c/data-science-london-scikit-learn) Sentiment Analysis on Movie Reviews (http://www.kaggle.com/c/sentiment-analysis-on-movie-reviews) Or any trustful challenges such as Kaggle, Dextra, IBM … Continue reading
Posted in Internship, Python, R
Leave a comment
#024 – Digit Recognizier with Python – SVM
(Expected hours: 8) Preparation Installed python Descriptions: http://www.kaggle.com/c/digit-recognizer. Data: http://www.kaggle.com/c/digit-recognizer/data. SVM algorithm: http://en.wikipedia.org/wiki/Support_vector_machine. SVM in library sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html. One-site support Helping intern install library sklearn and using it. Installing relative libraries Verification Make sure the intern can read data … Continue reading
Posted in Internship, Python
Leave a comment
#023 – Digit Recognizier with Python – RF
(Dự kiến 4h) Chuẩn bị Máy đã cài đặt sẵn Python. Link mô tả bài toán: http://www.kaggle.com/c/digit-recognizer. Link dữ liệu train & test: http://www.kaggle.com/c/digit-recognizer/data. Link về giải thuật RF: http://en.wikipedia.org/wiki/Random_forest. Link về thư viện RF trong sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html. Hỗ trợ … Continue reading
Posted in Internship, Python
Leave a comment
#022 – Digit Recognizer with python – Knn
Preparation Installed python Descriptions: http://www.kaggle.com/c/digit-recognizer. Data: http://www.kaggle.com/c/digit-recognizer/data. Knn algorithm: http://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm. Knn in library sklearn: http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html. One-site support Helping intern install library sklearn and using it. Installing relative libraries Verification Make sure the intern can read data successfully Using … Continue reading
Posted in Internship, Python
Leave a comment
#21 – Titanic Machine Learning Disaster
(Expected hours: 8) Preparation Installed Ipython Notebook Installed git. Description: http://www.kaggle.com/c/titanic-gettingStarted Data: http://www.kaggle.com/c/titanic-gettingStarted/data Source code: https://github.com/agconti/kaggle-titanic One-site support Helping intern install and use Ipython Notebook Helping intern install and use git Helping intern fix bugs … Continue reading
Posted in Internship, Python
1 Comment