目前分類:[Python] 資料科學 (12)

瀏覽方式: 標題列表 簡短摘要

 

使用jieba套件進行中文tf-idf關鍵字詞提取時,由於.idf檔是用開發者預設的字詞權重,若開發者想對特定產業或是主題進行文字挖掘透過jieba,就必須定義屬於自己的idf權重

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(4) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

 

#scikit-learn套件

to52016 發表在 痞客邦 留言(0) 人氣()

#視覺化

import pandas as pd

to52016 發表在 痞客邦 留言(0) 人氣()

 

 

to52016 發表在 痞客邦 留言(0) 人氣()

#統計資訊

import pandas as pd

to52016 發表在 痞客邦 留言(0) 人氣()

 

#資料預處理

to52016 發表在 痞客邦 留言(0) 人氣()

# 資料擷取與匯入 - CSV

#CSV檔放在jupyter files路徑下 (同一層)

to52016 發表在 痞客邦 留言(0) 人氣()

# numpy 
import numpy  as np

to52016 發表在 痞客邦 留言(0) 人氣()

#tuple 、list

y=(10,12) #tuple 不可更動

to52016 發表在 痞客邦 留言(0) 人氣()