使用jieba套件進行中文tf-idf關鍵字詞提取時,由於.idf檔是用開發者預設的字詞權重,若開發者想對特定產業或是主題進行文字挖掘透過jieba,就必須定義屬於自己的idf權重
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(4) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
#統計資訊
import pandas as pd
to52016 發表在 痞客邦 留言(0) 人氣()
to52016 發表在 痞客邦 留言(0) 人氣()
# 資料擷取與匯入 - CSV
#CSV檔放在jupyter files路徑下 (同一層)
to52016 發表在 痞客邦 留言(0) 人氣()
# numpy
import numpy as np
to52016 發表在 痞客邦 留言(0) 人氣()
#tuple 、list
y=(10,12) #tuple 不可更動
to52016 發表在 痞客邦 留言(0) 人氣()