使用jieba套件進行中文tf-idf關鍵字詞提取時,由於.idf檔是用開發者預設的字詞權重,若開發者想對特定產業或是主題進行文字挖掘透過jieba,就必須定義屬於自己的idf權重

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(4) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

#scikit-learn套件

to52016 發表在 痞客邦 留言(0) 人氣()

#視覺化

import pandas as pd

to52016 發表在 痞客邦 留言(0) 人氣()

 

有鑒於近期得到公司APP的使用者紀錄資料,因此我想洞察出一些有用的資訊透過R語言   Sequential Pattern Mining 分析的方法,找出user使用APP的動線,看是否可以加強與改善APP

to52016 發表在 痞客邦 留言(1) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

這次來試試貝式分類~~

to52016 發表在 痞客邦 留言(0) 人氣()