線性代數 - R語言入門
- 時間 : 2018/12/25(二) 12:10 - 13:00
- 地點 : 學思樓040103教室
- 書籍 : Linear algebra in R
- 程式碼 : https://github.com/CaoCharles/Linear_Algebra_R
升碩二前的暑假,正在匆忙的進行實習趕稿,那個時候大概是正在學習怎麼製作聊天機器人的語料吧!突然手機上出現訊息通知,原來是展源在密我,問我有沒有空參加比賽,我就這樣踏進了這趟旅程。
我們第一次討論好像是在新莊的咖啡廳吧,那個時候其實大家也都沒空參加講座,我好像剛忙完實習的樣子?就在那邊討論了一個下午,我們對於初賽的資料其實不太知道怎麼下手,那天大致討論完後,好像就交給展源清理資料,填補遺失值,我們就回去了。
到了要交件的前三天,我才開始趕工分析模型,那個時候算是對Python有點小小成就的新手吧,我就在網路上觀看機器學習的課程,用了超哥教過的隨機森林模型,和暑假跟柏龍討論已久的類神經網路,不過準確率依舊在9成初徘徊,最後在網路上收尋到XGBoost,測試後發現樹模型的建模速度很快,在調校上也容易操作,就這樣在短短幾天中漸漸的將模型訓練出來,不知道為甚麼,我覺得模型總是在半夜的時候會變得準確,就這樣慢慢的習慣熬夜了。
繳件過後其實沒有想太多,畢竟我們連講座都沒有去聽,用的也不是講座裡提供的模型,想說就當作機器學習的練習吧,還好最後順利晉級,沒有拖累隊友,耶!
https://drive.google.com/drive/folders/1jQl4cLGAwekYkz6gSCDlR7wwxA4dqbzP?usp=sharing
參考網址
Maximum Likelihood from Incomplete Data via the EM Algorithm
最大期望演算法(Expectation-maximization algorithm,又稱期望最大化算法)
在資料分析中常用於分群,在給定群數及機率模型下,去尋找觀測值變數間的所隱藏的訊息,可用此演算法來估計機率模型中的參數估計或遺失值填補。