作者empireisme (empireisme)
看板DataScience
标题[问题]评分的文字探勘模型
时间Sat Mar 7 17:55:51 2020
小弟文字探勘新手
最近想要分析一笔资料
Y是APP的评分 1到5
我有每个APP的官方英文叙述
就是APP的功能是啥
以下是文字叙述的范例
The eBay app is the best way to find anything you need, from dresses,
handbags and fashion accessories to new & used cars. Browse our inventory of
millions of products from sellers locally and globall.
请问有甚麽文字探勘的模型可以做到吗
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 219.91.75.186 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1583574957.A.A0F.html
1F:推 xiangying: 目的是要做什麽?03/07 19:00
2F:→ empireisme: 预测评分,找出评分高的关键字03/07 19:17
3F:推 ddavid: 我怎麽觉得这问题定义就很奇怪03/08 04:08
4F:→ ddavid: App的评分是评功能而不是评说明文字啊XD03/08 04:08
5F:→ ddavid: 两个App可以有超级接近的关键字集,因为做的是同一个功能03/08 04:09
6F:→ ddavid: ,但是使用者评分可以天差地远,因为实际用起来的好坏03/08 04:09
7F:→ ddavid: 如果你要硬套 说明文字 -> 使用者评分 去做预测模型,可以03/08 04:10
8F:→ ddavid: 当然是可以,但我只觉得会garbage in garbage out03/08 04:11
9F:→ ddavid: 自己逻辑想想就知道,你用App会因为它的介绍文字写比较好03/08 04:12
10F:→ ddavid: 或者用了特定字眼就给它评比较高分吗,不会吧。03/08 04:12
那如果我的资料是使用者评论的话,有什麽推荐的模型关键字吗?
※ 编辑: empireisme (49.216.49.183 台湾), 03/08/2020 12:22:32
11F:推 penolove5566: 统计正面负面的字词数不就行了? 03/08 14:44
12F:推 goldflower: kaggle就有amazon review的比赛呀 可以去看看 03/08 17:19
13F:推 ddavid: 一般的text mining就做得到了吧,Bag-of-words做完套个合 03/08 23:30
14F:→ ddavid: 理的分类器就可以做个基本架构了 03/08 23:31
15F:→ ddavid: 但是你如果连Bag-of-words都还不知道,表示连text mining 03/08 23:32
16F:→ ddavid: 的基础根本都还没开始看,你要做的不是找model,是Google 03/08 23:32
17F:→ ddavid: text mining然後把基础看一看 03/08 23:32
18F:→ patrick2dot0: 如果只是要预测分数 03/08 23:36
19F:→ patrick2dot0: word embedding後接个RNN就行吧 03/08 23:38