作者isolaXCC (isolaXCC)
看板R_Language
標題[分享] PTT資料獲取工具-PTTmineR
時間Tue Dec 3 12:56:56 2019
嗨大家好!想來這邊跟大家分享小弟自製的套件 PTTmineR!
PTTmineR 開發的目的是希望以 PTT 為材料的輿情、SNA以及文字探勘分析人員可以不用
寫爬蟲專注在分析工作上,相較於一般的爬蟲 PTTmineR 有以下特色:
- 友善使用者的語意化使用方式
- 整合多種 PTT 文章搜尋方式
- 內部高效率的資料處理(使用data.table)
- 支持平行運算(使用future)
以上特色可以讓使用者簡單快速地獲取 PTT 的文本,相關使用方法都可以先參考 repo
首頁的文件,如果有相關建議或是想回報 bug,可以直接跟我說或是在 issue 中做討論
!謝謝!(如果覺得這個套件有幫助到你也請幫我點個星星XDD)
github repo:
https://github.com/shihjyun/PTTmineR
如果有任何問題或是建議,可以在 issue 中讓我知道!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.141.210 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/R_Language/M.1575349019.A.638.html
1F:推 locka: 先推一個!之後來用看看 12/03 14:52
2F:推 cywhale: 感謝分享~~ 12/03 15:25
3F:推 TreeMan: 推~~ 12/03 16:17
4F:推 hank830214: 推! 12/03 18:16
5F:推 Gjerry: 推一個 12/03 19:33
6F:推 andrew43: 讚讚。感謝分享。 12/03 21:09
7F:推 Edster: 推推! 12/03 22:12
8F:推 Edster: 然後 cli_text 是不是該用 cliapp 而不是 cli ? 12/03 23:04
9F:→ isolaXCC: 如果顯示有問題的話我猜您應該之前有裝過 CRAN 上的 cli 12/03 23:32
10F:→ isolaXCC: 目前因為某些特殊顯示的需求我是用 開發版的 cli 版本 12/03 23:32
11F:→ isolaXCC: (已整合各種 cli extension) 12/03 23:32
12F:→ isolaXCC: 如果遇到顯示問題的話 可能要麻煩安裝 cli 的開發版 12/03 23:33
13F:推 Stat109: 推 12/04 17:36
14F:推 liangniko: 推推 12/06 00:57
15F:推 xrcjosh: 先推,太強 12/07 10:42
16F:推 FA88124: 推 12/08 14:44
17F:→ HumuHumu: 推 12/12 19:32
18F:推 HumuHumu: 推推 12/12 19:34
19F:推 qaz0101: 先推 12/13 09:04
20F:推 filialpiety: 推 12/14 11:43
21F:推 gbd37: 推 強者 12/25 13:37
22F:推 woowolf: 推一個 01/08 09:59
23F:推 cuqote4: 推推 02/13 18:04
24F:推 jezi1878: 大推呀 02/14 23:52
25F:推 shifa: 強!!! 02/20 18:08