作者FacetheFaith (己立立人己達達人)
看板Soft_Job
標題[請益] 該怎麼分割字串才好 (贈P幣)
時間Mon Dec 3 17:48:03 2018
請教一下版上大大們 (若成功解答則贈送P幣200)
有一欄位可能有輸入值如下情況1:
'21481705020021 9 21481705020026 10 21481705020034 11'
其'21481705020021 9', '21481705020026 10', '21481705020034 11'各為一組值
彼此以tab鍵分隔
該欄位也可能有輸入值如下情況2:
'723L04 123L00 131KYW'
其'723L04', '123L00' '131KYW'各為一組值
彼此以空白鍵分隔
倘若以tab鍵來分割情況1的字組,則在遇到情況2的字組就行不通
反之亦然, 倘若以空白鍵來分割情況2的字組,則在遇到情況1的字組就行不通
想請問有沒有一個通用的寫法可以用在以上兩種情況?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.170.193.241
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1543830485.A.F52.html
1F:推 flyfoxy: 遇到tab或空白 就切 12/03 17:50
2F:→ sowrdking: sed -e 's/^[ \t]*//' 12/03 17:51
3F:→ sowrdking: 空白跟tab可以取代成你要的字元就可以囉 12/03 17:51
4F:推 sherees: 什麼語言啊 12/03 17:52
5F:推 t64141: 看起來問題點是: 空格有時是資料內容,有時是分隔字元? 12/03 18:00
6F:→ t64141: 資料有規律嗎?例如5位數的資料用空格當分隔字元,其他情 12/03 18:05
7F:→ t64141: 境用tab作為分隔字元; 如果有規律就可以先用tab切,然後判 12/03 18:05
8F:→ t64141: 斷各組資料格式是否符合規則,若不符則預設將空格視為分隔 12/03 18:05
9F:→ t64141: 符號,反之亦然 12/03 18:05
10F:→ dreamnook: regexp? 12/03 18:08
11F:→ v420746k: 情況二的字元大小是20。如樓樓上大大說的先用tab切,再 12/03 18:19
12F:→ v420746k: 對每一個index檢查大小是否為20,是的話就在針對這個ind 12/03 18:19
13F:→ v420746k: ex用空格切。 12/03 18:19
14F:→ t64141: 假設有規則,再配合其他大大說的regex來驗證會更簡潔 12/03 18:27
15F:→ MOONY135: 正則? 12/03 18:43
16F:→ pttuser2266: If find tab then .. else ... 12/03 18:53
17F:推 justben: str.split(/\s{1,}/) 12/03 18:56
18F:推 abc0922001: 正規化 12/03 19:13
19F:推 chocopie: 我會先判斷分組再處理regex 12/03 19:23
20F:推 ripple0129: 不就是有tab用tab切,沒tab用空白切嗎,範例太少沒看 12/03 19:26
21F:→ ripple0129: 到難點 12/03 19:26
22F:→ alog: 方法1 先對資料來源做歸類 再根據歸類後的結果用對應的處理 12/03 20:24
23F:→ alog: 方式 策略就是這樣 / 方法 2 將資料的 tab 跟 space 轉換成 12/03 20:24
24F:→ alog: 其中之一 再進行處理 / 方法 3 直接在 regexp 直接下條件包 12/03 20:24
25F:→ alog: 含 tab跟space做切割 只要你的程式有支援 12/03 20:24
26F:→ alog: 但我還是要說 如果你的資料極度重要且變化大 就別傻傻的直 12/03 20:25
27F:→ alog: 接用方法2跟3 12/03 20:25
28F:→ alog: 應該要先釐清完整規律 同時做時就拿資料來驗證把你預期外的 12/03 20:26
29F:→ alog: 早出來 12/03 20:26
30F:→ alog: 找* 不建議直接用一個方式想要省全部 12/03 20:27
31F:→ sachung28: regex 指定數字重複次數啊 大不了分二次掃檔抓字組 12/03 21:40
32F:→ qrtt1: 生資料的一方,為什麼不能好好地給一種格式就好@@? 12/03 21:43
33F:→ Murasaki0110: 看有沒有tab不就分出來了? 12/03 21:44
34F:噓 B99303079: 2 12/03 22:08
35F:推 yiefaung: 直接split依元素個數if 12/03 22:57
36F:推 giacch: [\d ]{16,}|\w{6} 12/04 01:39
37F:推 exeex: scanf %d 12/04 14:51
38F:推 gmoz: 先分類 12/04 16:16
39F:→ ron1220: 先用tab切看能不能切出東西,有切出東西=狀況1;沒有的 12/04 19:56
40F:→ ron1220: 話=狀況2。狀況1就直接撈值;狀況2的話就再用空白切一次 12/04 19:56
41F:→ ron1220: 。 12/04 19:56
42F:推 Csongs: 正規表示法 處理就好了@@ 12/04 23:38
43F:推 GoGoJoe: 看white space切出幾個字串,就能分出第幾個case,在將字 12/07 20:40
44F:→ GoGoJoe: 串組成你要的型式! 12/07 20:40