PIXNET Logo登入

Eason [資料科學//Python學習/資料庫] & [拍片&剪片]

跳到主文

do something funny !

部落格全站分類:職場甘苦

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 7月 09 週一 201810:25
  • [Python] text mining/ jieba-建立jieba-idf權重計算演算法

 
使用jieba套件進行中文tf-idf關鍵字詞提取時,由於.idf檔是用開發者預設的字詞權重,若開發者想對特定產業或是主題進行文字挖掘透過jieba,就必須定義屬於自己的idf權重
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(969)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 17 週四 201714:31
  • [Python] 機器學習(scikit-learn) -- 決策樹(分類)

t1.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(3,976)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 17 週四 201709:54
  • [Python] 機器學習(scikit-learn) --分群 K-means

K.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(6) 人氣(11,218)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201716:14
  • [Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)

l1.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(15,346)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201715:54
  • [Python] 機器學習(scikit-learn) --簡單回歸分析

回歸.PNG
 
#scikit-learn套件
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(8,021)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201714:57
  • [Python] 資料視覺化:matplotlib、pandas

output1.PNG
#視覺化
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('ggplot')
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(7,803)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201715:29
  • [Python] 時間資料型態、時間序列分析

output10.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(5,176)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201715:20
  • [Python] 基礎統計、異常值偵測、相關性分析

output6.PNG
#統計資訊
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('ggplot')
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(4,379)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201713:46
  • [Python] 資料預處理:重複值、遺失值

output3.PNG
 
#資料預處理
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(2,015)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201713:40
  • [Python] 資料擷取與匯入、網路爬蟲

output1.PNG
# 資料擷取與匯入 - CSV
#CSV檔放在jupyter files路徑下 (同一層)
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(1,492)

  • 個人分類:[Python] 資料科學
▲top
12»

個人資訊

to52016
暱稱:
to52016
分類:
職場甘苦
好友:
累積中
地區:

熱門文章

  • (13,164)[oracle SQL] 抓取客戶最後一筆交易日 解法:first_value ()
  • (7,605)<案例>count( 欄位A ) over (partition by 欄位B ) 用法
  • (3,997)ORACLE日期查詢方法
  • (2,903)[R] 資料科學-序列樣式探勘分析(Sequential Pattern Mining)
  • (2,405)oracle partition table測試
  • (2,278)Power Pivot與Power View操作
  • (1,919)查看Oracle資料庫表格的外鍵(foreign key)關係
  • (1,333)改變ORACLE -NLS_DATE_FORMAT中時間顯示格式的顯示
  • (1,319)oracle日常作業--透過flashback table復原資料
  • (145)[Data Visualization] TABLEAU呈現

文章分類

  • 拍片剪片 (0)
  • [Python] 資料科學 (12)
  • [R] 資料科學 (6)
  • DBA日常工作 (8)
  • BI工具 (1)
  • shell script (2)
  • 隨手筆記(系統,ora錯誤處理..) (23)
  • SQL/PLSQL案例 (30)
  • tunning & 效能 (11)
  • 未分類文章 (1)

最新文章

  • [Python] text mining/ jieba-建立jieba-idf權重計算演算法
  • oracle 合併多筆資料為一欄
  • [Python] 機器學習(scikit-learn) -- 決策樹(分類)
  • [Python] 機器學習(scikit-learn) --分群 K-means
  • [Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)
  • [Python] 機器學習(scikit-learn) --簡單回歸分析
  • [Python] 時間資料型態、時間序列分析
  • [Python] 基礎統計、異常值偵測、相關性分析
  • [Python] 資料視覺化:matplotlib、pandas
  • [Python] 資料預處理:重複值、遺失值

最新留言

  • [24/01/08] Kevin 於文章「[R] 資料科學-序列樣式探勘分析(Se...」留言:
    想請問一下,若某客戶的購買行為是其中一個單位時間內重複購買同...
  • [19/02/06] Spencer 於文章「Power Pivot與Power Vi...」留言:
    請問 May 14 Thu 2015 ...
  • [19/02/06] Spencer 於文章「[Python] 機器學習(scikit...」留言:
    您好 對不起 表二如下 , 前一封表二錯誤 ...
  • [19/02/06] Spencer 於文章「[Python] 機器學習(scikit...」留言:
    您好 請問 下面兩個Table(表一 ...
  • [18/07/30] 俊傑 於文章「[Python] 機器學習(scikit...」留言:
    我是個新手,有個很大問題想請教, "from sklear...
  • [18/07/16] to52016 於文章「[Vlog] 花蓮-kid背包客 day...」留言:
    哈哈 因為下集一直沒時間處理 感謝你的喜愛^^...
  • [18/07/14] Markjong001 於文章「[Vlog] 花蓮-kid背包客 day...」留言:
    我是對花蓮不熟的花蓮人~~很高興看到你分享花蓮遊~~ 但怎...
  • [18/05/28] Moe 於文章「[oracle SQL] 抓取客戶最後...」留言:
    範例有錯 first_value(參數) 參數只能是f...
  • [18/03/18] 東吳學生 於文章「[Python] 機器學習(scikit...」留言:
    您好,感謝分享,請問本範例中的StudentJob.csv檔...

動態訂閱

文章精選

文章搜尋

誰來我家

參觀人氣

  • 本日人氣:
  • 累積人氣: