DataScience 板


LINE

还是忍不住来回一下文 感觉版上的大家 大部分是做影像辨识 自然语言处理的比较少 但是自然语言处理真的很有意思阿 像这个sentiment analysis 语意分析真的特别有趣 而且特别难 先跟大家介绍一下这个研讨会SemEval 应该是语意分析最大的会 会有shared tasks 有点像kaggle的比赛 大会给每个参赛团队同一组training dataset 和test dataset 时间到了大家回传prediction 看谁最接近gold standard SemEval 2017 Task 4 A 就是twitter tweets 的语意分析 训练集长这样 tweet1 -> positive tweet2 -> neutral tweet3 -> nagative ... 任务就是给你一段tweet 你猜是哪个:{positive,negative,neutral} 三选一 http://www.aclweb.org/anthology/S17-2088 结果成绩第一名团队也才拿到 68.1%的准确率 这其实好多难关要过 1. tweet 是很特殊的文体 杂质很高 (好用的tweet 预处理的工具: http://www.cs.cmu.edu/~ark/TweetNLP/ ) 2. 再来是自然语言本身的复杂度,举例来说: 张三很开心 -> positive 张三不开心 -> negative 张三很开心吗 -> neutral 张三不开心吗 -> neutral 如果张三很开心 -> neutral 现在把'开心' 换成'伤心' 正负值又要翻面了 另外还有讽刺的用法 像是 '你长的最好看了' 每个词都是正面的 合在一起变负面 ######################### 这里我找了一个参加semEval2017 task4的团队的github 或许你可以试着复制他们的成果: https://github.com/cbaziotis/datastories-semeval2017-task4 ######################### 之前不是有人再问 DL可以选股票吗? DL + NLP就可以帮你选股票! 这个semEval 就有选股票的比赛 SemEval 2017 task5就是搞这个 这个heuristic很简单 就是看看网路大家对xyz公司的评价是好是坏 好的话股价比较可能会涨 所以选股票除了看 财报 股价历史纪录 其他的数据 还可以看这个sentiment analysis ※ 引述《CaptPlanet (ep)》之铭言: : ctrl + y 可以删除一整行,请将不需要的内容删除 : 文章分类提示: : - 问题: 当你想要问问题时,请使用这个类别。 : - 讨论: 当你自己已经有答案,但是也想听听版友意见时。 : - 情报: 当你看到消息时,请使用这个类别。 : 根据板规规定,做适当的转换,以及摘录重要文意。 : - 心得: 当你自己想要分享经验时,请使用这个类别。 : (回答并非义务,所以当有人回答时,哪怕句谢谢也好,多多回应,大E可编辑文章) : (如果用不到以下框架,如观念问题请自行视情况删除作业系统,使用工具等项目) : 作业系统:(win10) : 问题类别:(DL, RNN, NLP) : 使用工具:(python,keras,gensim word2vec) : 问题内容: : 最近尝试对文本进行正负面评价分类 : 先自己训练了word2vec模型(一个词256维) : 然後参考网路上的code : https://blog.keras.io/using-pre-trained-word-embeddings-in-a-keras-model.html : 利用tokenizer和sequence padding把文章转成对应的编码(400维向量) : 再利用embedding 层设置权重让汇入的文章变成400*256的矩阵 : Embedding层後接着三层LSTM然後Flatten和Dense输出2维向量用softmax和crossentropy : 预测正负面 : 目前已经都训练完成,但是现在想要实际丢入一些新资料进去预测,新的文章该如何转换 : 成这个model的输入呢? : 直接参考上面的code用一样的方法将文章编码就可以输入了吗? : 感谢各位 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 150.135.165.10
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1523386559.A.522.html
1F:推 andyliu42: 推~ 04/11 16:58
2F:推 OnePiecePR: 推 04/11 19:10
3F:推 pp61022: 推! 04/11 20:08
4F:推 ricknfts: 推 04/12 01:39
5F:推 warex14: 推 04/12 07:59
6F:推 WZYang: 推 04/12 17:46
7F:推 hahaxd78: 推 04/12 20:19
8F:推 ax61316: 推分享! 06/05 11:11







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Boy-Girl站内搜寻

TOP