作者stayfool (fool)
看板DataScience
标题[问题] 如何让机器学到需要的词向量
时间Thu Apr 21 15:14:24 2022
ctrl + y 可以删除一整行,请将不需要的内容删除
文章分类提示:
- 问题: 当你想要问问题时,请使用这个类别。
- 讨论: 当你自己已经有答案,但是也想听听版友意见时。
- 情报: 当你看到消息时,请使用这个类别。
根据板规规定,做适当的转换,以及摘录重要文意。
- 心得: 当你自己想要分享经验时,请使用这个类别。
(回答并非义务,所以当有人回答时,哪怕句谢谢也好,多多回应,大E可编辑文章)
可以试着把程式码用网站贴出来唷 https://pastebin.com/
(如果用不到以下框架,如观念问题请自行视情况删除作业系统,使用工具等项目)
作业系统: win10
问题类别: ML
使用工具: tensorflow
问题内容:
有4个词,分别是 食物 汉堡 米饭 牙刷
食物 跟 汉堡 一起出现的频率是 10 次
食物 跟 米饭 一起出现的频率是 5 次
食物 跟 牙刷 一起出现的频率是 2 次
该如何把这4个词制作成向量,并且可比较相似度,食物 和 汉堡相似度最高,
和牙刷相似度最低,请提供关键字让我查询 或是 告知我该如何作 谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.161.242.144 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1650525266.A.08F.html
1F:推 ddavid: Word2vec、GloVe 04/21 15:38
2F:→ ddavid: 网路资源很多,这两个也都有公开的 GitHub 实作可以研究 04/21 15:40
3F:→ stayfool: Word2vec的相似度计算和我要的不一样 04/21 15:48
4F:→ stayfool: 它是利用具有相同上下文的词,计算相似度 04/21 15:50
5F:→ stayfool: 例如狗咬人和猫咬人,狗跟猫相似是因为有相同的上下文 04/21 15:52
6F:→ stayfool: 咬人,我要的相似度是一起出现的频率 04/21 15:54
7F:推 chang1248w: fp tree,两个礼拜前作业刚好有出 04/21 21:13
8F:推 ddavid: 如果只是要一起出现的频率,那请找 04/21 23:48
9F:→ ddavid: frequent pattern mining / association rule 04/21 23:49
10F:→ ddavid: 要演算法名的话可以从最基本的 Apriori 和 FP Growth 开始 04/21 23:50