PIXNET Logo登入

Eason [資料科學//Python學習/資料庫] & [拍片&剪片]

跳到主文

do something funny !

部落格全站分類:職場甘苦

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 7月 09 週一 201810:25
  • [Python] text mining/ jieba-建立jieba-idf權重計算演算法

 
使用jieba套件進行中文tf-idf關鍵字詞提取時,由於.idf檔是用開發者預設的字詞權重,若開發者想對特定產業或是主題進行文字挖掘透過jieba,就必須定義屬於自己的idf權重
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(969)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 17 週四 201714:31
  • [Python] 機器學習(scikit-learn) -- 決策樹(分類)

t1.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(3,975)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 17 週四 201709:54
  • [Python] 機器學習(scikit-learn) --分群 K-means

K.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(6) 人氣(11,217)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201716:14
  • [Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)

l1.PNG
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(15,346)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201715:54
  • [Python] 機器學習(scikit-learn) --簡單回歸分析

回歸.PNG
 
#scikit-learn套件
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(8,020)

  • 個人分類:[Python] 資料科學
▲top
  • 8月 16 週三 201714:57
  • [Python] 資料視覺化:matplotlib、pandas

output1.PNG
#視覺化
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('ggplot')
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(7,802)

  • 個人分類:[Python] 資料科學
▲top
  • 7月 13 週四 201713:47
  • [R] 資料科學-序列樣式探勘分析(Sequential Pattern Mining)

 
有鑒於近期得到公司APP的使用者紀錄資料,因此我想洞察出一些有用的資訊透過R語言   Sequential Pattern Mining 分析的方法,找出user使用APP的動線,看是否可以加強與改善APP
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(1) 人氣(2,901)

  • 個人分類:[R] 資料科學
▲top
  • 7月 03 週一 201716:11
  • [R] 資料科學- text mining 文字雲 --以自由時報體育版新聞為例

MLB文字雲
 
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(5,658)

  • 個人分類:[R] 資料科學
▲top
  • 7月 03 週一 201714:30
  • [R] 資料科學- 使用關鍵字字詞頻率資料分類 -使用貝式分類器

BAYES
 
 
再來一個應用情境: 我們要準備各個分類(汽車、運動、科技)的數篇新聞集合,然後比對計算特徵關鍵字字詞頻率向量。
 
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(574)

  • 個人分類:[R] 資料科學
▲top
  • 7月 03 週一 201713:59
  • [R] 資料科學-空氣檢測 -- 使用貝氏分類器(Naive Bayes Classifier)

 
這次來試試貝式分類~~
 
用上一章KNN分類的資料來測試
(繼續閱讀...)
文章標籤

to52016 發表在 痞客邦 留言(0) 人氣(791)

  • 個人分類:[R] 資料科學
▲top
12...10»

個人資訊

to52016
暱稱:
to52016
分類:
職場甘苦
好友:
累積中
地區:

熱門文章

  • (1,919)查看Oracle資料庫表格的外鍵(foreign key)關係
  • (3,996)ORACLE日期查詢方法
  • (2,406)oracle partition table測試
  • (1,333)改變ORACLE -NLS_DATE_FORMAT中時間顯示格式的顯示
  • (7,603)<案例>count( 欄位A ) over (partition by 欄位B ) 用法
  • (2,277)Power Pivot與Power View操作
  • (1,317)oracle日常作業--透過flashback table復原資料
  • (145)[Data Visualization] TABLEAU呈現
  • (13,153)[oracle SQL] 抓取客戶最後一筆交易日 解法:first_value ()
  • (7,802)[Python] 資料視覺化:matplotlib、pandas

文章分類

  • 拍片剪片 (0)
  • [Python] 資料科學 (12)
  • [R] 資料科學 (6)
  • DBA日常工作 (8)
  • BI工具 (1)
  • shell script (2)
  • 隨手筆記(系統,ora錯誤處理..) (23)
  • SQL/PLSQL案例 (30)
  • tunning & 效能 (11)
  • 未分類文章 (1)

最新文章

  • [Python] text mining/ jieba-建立jieba-idf權重計算演算法
  • oracle 合併多筆資料為一欄
  • [Python] 機器學習(scikit-learn) -- 決策樹(分類)
  • [Python] 機器學習(scikit-learn) --分群 K-means
  • [Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)
  • [Python] 機器學習(scikit-learn) --簡單回歸分析
  • [Python] 時間資料型態、時間序列分析
  • [Python] 基礎統計、異常值偵測、相關性分析
  • [Python] 資料視覺化:matplotlib、pandas
  • [Python] 資料預處理:重複值、遺失值

動態訂閱

文章精選

文章搜尋

誰來我家

參觀人氣

  • 本日人氣:
  • 累積人氣: