Patent 板


LINE

推 MrCAKE: 如果是這樣,關鍵字拓展之後還是卡關,就要想其他招了 06/26 08:35 推 MrCAKE: 以後AI檢索更強的話應該能幫忙(吧) 06/26 08:41 推 patentable: 以目前機器學習的AI架構,還沒辦法做到瞭解文義 06/26 09:49 → patentable: 對於檢索的幫助其實非常有限,主要用在統計用字頻率 06/26 09:50 https://hant-kb.kutu66.com/others/post_13649887 目前的AI可以做到「句子相似度」的計算,如上連結。 'this is a sentence'及'this is also sentence'的計算結果,高達0.915479828613的 近似度。 因此,如果要用機器幫忙找前案的話,可以先寫下要找的句子(或詞袋),然後用「句 子相似度」的演算法,來找出近似的專利。word2vec是由google提出來,google專利資料 庫的近似專利,應該也是用這個演算法計算出來的。 考慮到專利用語的多變化,(以下是我亂想的,沒有理論基礎)想要提高演算的精確度時 ,選擇詞袋中的詞就很重要,可以考慮先對句子中的詞進行處理。舉例,可以考慮先把 下位詞更換成上位詞,或者把所有的近似詞換成相同的詞等,但這個需要自己整理詞庫。 因此,個人認為用機器幫忙找專利,是有機會的,但需要為不同的領域準備好自己的 詞庫。要用一般的詞庫應該很難達到實用的效果。 下面有整理出幾個句子相似度的演算法。 https://reurl.cc/WdQkVx --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.228.170 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Patent/M.1593275214.A.74C.html ※ 編輯: ides13 (114.32.228.170 臺灣), 06/28/2020 01:04:15
1F:推 patentable: 最大的問題確實是詞庫,還有上下位用語的關係 06/29 06:52
2F:→ VanDeLord: DL角度來看,原始資料清洗剩下的資料量和演算模型難搞 06/29 09:58
3F:→ VanDeLord: 之前想開發DL模型演算法,不過這一塊太吃AI科學家能力, 06/29 09:59
4F:→ VanDeLord: 弄個五人團隊加上硬體一年硬生生要掉我1200萬台票,市場 06/29 10:00
5F:→ VanDeLord: 規模有限,暫時放棄先看後面AI硬體有沒有辦法降價XD 06/29 10:01
6F:→ VanDeLord: 演算法的部分等 AutoML的發展,看起來有機會 06/29 10:05
7F:→ VanDeLord: AutoML的好處是,將足夠清洗好後的資料餵進去,會自己找 06/29 10:07
8F:→ VanDeLord: 最適合的演算模型, 而不是靠人設計模型,對於沒有頂尖AI 06/29 10:08
9F:→ VanDeLord: 科學家的企業來說,這一塊商機感覺很大 06/29 10:08
10F:→ ides13: 曾經想過這上面的的想法創業,但覺得應該不可能,只留在想 06/29 11:33
11F:→ ides13: 想的階段,對於敢付出實際的人,都感到佩服。 06/29 11:34
12F:→ ides13: V大你真有勇氣。 06/29 11:34
13F:→ ides13: https://reurl.cc/WdQOvD 06/29 13:09
14F:→ ides13: https://reurl.cc/8GM9j7 06/29 13:10
15F:→ ides13: 上面有代碼,提供給有興趣玩的網友參考。 06/29 13:10
16F:→ ides13: 只要更換sentance1及2的文字,就能算出相似度。 06/29 13:14
17F:→ ides13: https://reurl.cc/xZM3NZ 06/29 13:16
18F:→ ides13: 「GoogleNews」詞向量的下載地址,如上。 06/29 13:18
19F:→ VanDeLord: https://arxiv.org/pdf/1905.07870.pdf 06/29 13:52
20F:→ VanDeLord: 當初還找了金庸古龍小說訓練出來的演算模型,跑一個月以 06/29 13:53
21F:→ VanDeLord: 終於一個claim裡面有一小段話看起來比較像樣 06/29 13:53
22F:→ VanDeLord: google : AI論文機器人 06/29 13:58
23F:→ VanDeLord: 不過我也發現有些美國網站開始有推銷AI寫專利這一塊 06/29 13:58
24F:→ VanDeLord: 發明人只要輸入發明內容,就會生成專利說明書給你..orz 06/29 13:59
25F:→ VanDeLord: 不過我看內容還是需要人工校閱就是了 06/29 13:59
26F:→ VanDeLord: 在語意模型裡面, 英文比中文簡單太多了...嘆 06/29 14:00
27F:→ ides13: https://reurl.cc/j7Z0zp 06/30 15:03
28F:→ ides13: AI HUB,有在進行類似的專案。 06/30 15:07
29F:推 ealvis: 其實你用svm類似的方向去想ai分析專利,會落入pre-train 07/13 04:30
30F:→ ealvis: 那些拘束。但其實用cluster的方式去想專利相似應該會比較 07/13 04:30
31F:→ ealvis: 適合。以醫療分析也是這樣,其實你不用管原本的分析標的在 07/13 04:30
32F:→ ealvis: 你的眼光是什麼特性,因為分析後的ai會告訴你為什麼他要這 07/13 04:30
33F:→ ealvis: 樣分析。但真正的問題是拿ai來弄專利太浪費錢,拿這些錢 07/13 04:30
34F:→ ealvis: 來弄人命才比較好賺錢 07/13 04:30
35F:→ ides13: 謝謝提供進一步資料,原來還有cluster的方式。 07/14 13:37
36F:→ ides13: https://reurl.cc/KkaYxg 07/14 13:38
37F:→ ides13: 目前是想找一種能夠幫助檢索的方式,但理論基礎太弱了。 07/14 13:40
38F:→ VanDeLord: cluster是傳統語意分析方式 08/01 14:30
39F:→ VanDeLord: cluster分析是有其優點 08/01 14:31







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Gossiping站內搜尋

TOP