作者dontkissme (不要親我)
看板C_Sharp
標題[問題] 字串搜尋(contains ?)
時間Thu Oct 20 00:34:50 2011
剛剛學弟問我一個問題,他說文章中出現
Canon EOS 60D、EOS 60D 以及 Canon 60D 都是指同一樣東西
所以他要寫程式處理文章的這些詞(c#)
它用了contains去判斷文章中的詞句
是否包含在textbox1使用者預設的母集合" Canon EOS 60D"
Canon EOS 以及 EOS 60D都可以判斷出來屬於 " Canon EOS 60D"
但是 Canon 60D判斷結果是0,似乎就是{AB},{BC}屬於{ABC}
但是{AC}不屬於{ABC}這樣...
後來想一想學弟說要把 " Canon EOS 60D" 切成 n 個字(這裡是3)
丟到陣列str[0],str[1]跟str[2]
然後用陣列str 0,1、0,2、1,2 排列組合去做搜尋..
但我我跟他都覺得這樣很笨...
如果 n > 3 的時候,計算的複雜度會變大超多...
不知道在C#有沒有更快速或聰明的做法...
因為我不太熟C#,只是他今天問我,我稍微查詢一下
先是理解為何AC無法在ABC中被找到 (Data Mining購物籃的話算阿..)
就花了一段時間,再去找有沒有可以找到的語法又花了一段時間
但是我想我不熟,還是上來請益高手!!!
請高手指導,謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 219.70.235.98
1F:→ glennchen:這是要做IR嗎? 有很多toolkit可以用啊 10/20 06:33
2F:→ dontkissme:我也不知道耶,搞不好是,學弟他在寫他指導教授給的 10/24 14:19
3F:→ dontkissme:東西,我跟他不同老師,不過都是做TEXT MINING 或DM的 10/24 14:20