作者isolaXCC (isolaXCC)
看板R_Language
标题[分享] PTT资料获取工具-PTTmineR
时间Tue Dec 3 12:56:56 2019
嗨大家好!想来这边跟大家分享小弟自制的套件 PTTmineR!
PTTmineR 开发的目的是希望以 PTT 为材料的舆情、SNA以及文字探勘分析人员可以不用
写爬虫专注在分析工作上,相较於一般的爬虫 PTTmineR 有以下特色:
- 友善使用者的语意化使用方式
- 整合多种 PTT 文章搜寻方式
- 内部高效率的资料处理(使用data.table)
- 支持平行运算(使用future)
以上特色可以让使用者简单快速地获取 PTT 的文本,相关使用方法都可以先参考 repo
首页的文件,如果有相关建议或是想回报 bug,可以直接跟我说或是在 issue 中做讨论
!谢谢!(如果觉得这个套件有帮助到你也请帮我点个星星XDD)
github repo:
https://github.com/shihjyun/PTTmineR
如果有任何问题或是建议,可以在 issue 中让我知道!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.45.141.210 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1575349019.A.638.html
1F:推 locka: 先推一个!之後来用看看 12/03 14:52
2F:推 cywhale: 感谢分享~~ 12/03 15:25
3F:推 TreeMan: 推~~ 12/03 16:17
4F:推 hank830214: 推! 12/03 18:16
5F:推 Gjerry: 推一个 12/03 19:33
6F:推 andrew43: 赞赞。感谢分享。 12/03 21:09
7F:推 Edster: 推推! 12/03 22:12
8F:推 Edster: 然後 cli_text 是不是该用 cliapp 而不是 cli ? 12/03 23:04
9F:→ isolaXCC: 如果显示有问题的话我猜您应该之前有装过 CRAN 上的 cli 12/03 23:32
10F:→ isolaXCC: 目前因为某些特殊显示的需求我是用 开发版的 cli 版本 12/03 23:32
11F:→ isolaXCC: (已整合各种 cli extension) 12/03 23:32
12F:→ isolaXCC: 如果遇到显示问题的话 可能要麻烦安装 cli 的开发版 12/03 23:33
13F:推 Stat109: 推 12/04 17:36
14F:推 liangniko: 推推 12/06 00:57
15F:推 xrcjosh: 先推,太强 12/07 10:42
16F:推 FA88124: 推 12/08 14:44
17F:→ HumuHumu: 推 12/12 19:32
18F:推 HumuHumu: 推推 12/12 19:34
19F:推 qaz0101: 先推 12/13 09:04
20F:推 filialpiety: 推 12/14 11:43
21F:推 gbd37: 推 强者 12/25 13:37
22F:推 woowolf: 推一个 01/08 09:59
23F:推 cuqote4: 推推 02/13 18:04
24F:推 jezi1878: 大推呀 02/14 23:52
25F:推 shifa: 强!!! 02/20 18:08