作者godfat (godfat 真常)
看板Ruby
标题Re: [问题] 句子断词
时间Mon May 19 10:31:16 2008
※ 引述《itucson (爱吐桑)》之铭言:
: 假设我有一句子:「网路应用程式」
: 我想要随机断词,会断成不同情况
: 网路应 用 程式 对照 001 1 01
: 或: 网 路应 用程式 对照 1 01 001
: 001101, 101001 我已经随机产生了,可是不知道中文字要怎麽随机长度来断
: 请问该怎麽做比较好
两个字串一样长,就 zip 起来并 fold
两种状况:
0. 串到最後一个词
1. 串新词
写成程式就是:
s = '网路应用程式'
b = '001101'
result = s.scan(/./u).zip(b.scan(/./)).inject([[]]){ |r, i|
r.last << i.first
r << [' '] if i.last == '1'
r
}.join
puts result
# => 网路应 用 程式
--
「行け!Loki!」
(rocky ロッキー)
-Gurumin ぐるみん 王子? XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.128.121.85
1F:推 itucson:感谢, 我只看到你的签名档写行!ok! XD 05/19 11:47
2F:→ godfat:那是 big5 日文 O_Q 我有在想是不是应该拿掉... 05/19 11:53