Eason [資料科學//Python學習/資料庫] & [拍片&剪片]

Jul 09 Mon 2018 10:25
[Python] text mining/ jieba-建立jieba-idf權重計算演算法

使用jieba套件進行中文tf-idf關鍵字詞提取時，由於.idf檔是用開發者預設的字詞權重，若開發者想對特定產業或是主題進行文字挖掘透過jieba，就必須定義屬於自己的idf權重

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [Python] 資料科學

▲top

Aug 17 Thu 2017 14:31
[Python] 機器學習(scikit-learn) -- 決策樹(分類)

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [Python] 資料科學

▲top

Aug 17 Thu 2017 09:54
[Python] 機器學習(scikit-learn) --分群 K-means

(繼續閱讀...)

to52016 發表在痞客邦留言(6) 人氣()

個人分類： [Python] 資料科學

▲top

Aug 16 Wed 2017 16:14
[Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [Python] 資料科學

▲top

Aug 16 Wed 2017 15:54
[Python] 機器學習(scikit-learn) --簡單回歸分析

#scikit-learn套件

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [Python] 資料科學

▲top

Aug 16 Wed 2017 14:57
[Python] 資料視覺化:matplotlib、pandas

#視覺化
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use('ggplot')

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [Python] 資料科學

▲top

Jul 13 Thu 2017 13:47
[R] 資料科學-序列樣式探勘分析(Sequential Pattern Mining)

有鑒於近期得到公司APP的使用者紀錄資料，因此我想洞察出一些有用的資訊透過R語言 Sequential Pattern Mining 分析的方法，找出user使用APP的動線，看是否可以加強與改善APP

(繼續閱讀...)

to52016 發表在痞客邦留言(1) 人氣()

個人分類： [R] 資料科學

▲top

Jul 03 Mon 2017 16:11
[R] 資料科學- text mining 文字雲 --以自由時報體育版新聞為例

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [R] 資料科學

▲top

Jul 03 Mon 2017 14:30
[R] 資料科學- 使用關鍵字字詞頻率資料分類 -使用貝式分類器

再來一個應用情境: 我們要準備各個分類（汽車、運動、科技）的數篇新聞集合，然後比對計算特徵關鍵字字詞頻率向量。

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [R] 資料科學

▲top

Jul 03 Mon 2017 13:59
[R] 資料科學-空氣檢測 -- 使用貝氏分類器(Naive Bayes Classifier)

這次來試試貝式分類~~

用上一章KNN分類的資料來測試

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [R] 資料科學

▲top

Jun 30 Fri 2017 15:21
[R] 資料科學- 判別空氣品質使用KNN分類法

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [R] 資料科學

▲top

Jun 29 Thu 2017 14:22
[R] 資料科學-探討巴哈XX版 GP值與回覆人數的關連(網路爬蟲，ETL，資料視覺，回歸分析)

一時興起想探討巴哈XX版 GP值與回覆數之間有甚麼關聯~

(繼續閱讀...)

to52016 發表在痞客邦留言(0) 人氣()

個人分類： [R] 資料科學

▲top

do something funny !

[Python] text mining/ jieba-建立jieba-idf權重計算演算法

[Python] 機器學習(scikit-learn) -- 決策樹(分類)

[Python] 機器學習(scikit-learn) --分群 K-means

[Python] 機器學習(scikit-learn) --Logistic Regression(羅吉斯迴歸)

[Python] 機器學習(scikit-learn) --簡單回歸分析

[Python] 資料視覺化:matplotlib、pandas

[R] 資料科學-序列樣式探勘分析(Sequential Pattern Mining)

[R] 資料科學- text mining 文字雲 --以自由時報體育版新聞為例

[R] 資料科學- 使用關鍵字字詞頻率資料分類 -使用貝式分類器

[R] 資料科學-空氣檢測 -- 使用貝氏分類器(Naive Bayes Classifier)

[R] 資料科學- 判別空氣品質使用KNN分類法

[R] 資料科學-探討巴哈XX版 GP值與回覆人數的關連(網路爬蟲，ETL，資料視覺，回歸分析)

參觀人氣

do something funny !

參觀人氣

成人內容提醒