Learning Blog

預定調和

自學機器學習的四種方法

| Comments

4 Self-Study Machine Learning Projects 原文 中文版

心得

這篇文章主要是提供初學者如何開始學習的方法,我覺得還蠻不錯,目前有些語言提供關於機器學習的函式庫,我這邊主要是用python的scikit-learn,因為可以直接搭配其他函式庫完成我想要的功能,雖然我也有使用R語言不過主要使用在統計跟產生圖表上,python這邊我可以直接搭配Scrapy和NLTK作出分析網路文章的功能。

另外文章有提到挑選一個數據集,然後選擇一種最適合的算法去處理他,目前有不少公開資料可以使用,之前在弄Mahout的時候我也有有找跟電影相關的資料可以使用,但是我比較偏向自然語言處理這部分,去分析這篇留言的評論是負面還是正面以及文章推薦系統,不過我想文章作者想要初學者找一個資料去分析主要是希望能夠了解各種資料都有他適合的算法,而要選擇適合的算法是我覺得最困難的地方,因為不同類型資料有不同的特性,如果不是在那方面有相關知識的人是比較難處理。

Comments