作者LPH66 (-858993460)
看板java
标题Re: 关於bbs自动载文的机器人
时间Tue Sep 13 10:04:10 2011
原因应该是出在 PTT 在输出文字时有做输出量最佳化
当利用移位码或 Tab 可以省去传输量时就会输出移位码或 Tab
以你附上的档案里的一行 Programming 版为例
注意到你抓到的资料中这行版标之後立刻接上一个 ANSI escape sequence
接着後面就是人气值和版主
有些版也在一些空白之後接有 ANSI escape sequence
因为版标的长度空间有 34 个字 (版主只能设到 31 字 不过那和这问题无关就算了)
在 "Programming" 11 字之後的 23 个字都是空白
如果原画面上就是 23 个空白的话那直接输出一个移位码 *[23C 会比较省输出
(23 bytes vs 5 bytes)
你或许也注意到有的行开头的序号数字前面也有空白 有的没有
这也是 PTT 的程式直接输出移位码移定位後输出数字的关系
(说不定就是一个 *[11;5H 之类的)
你读取的输入就只是没有把这一点考虑进去而已
要解决这个问题可能需要去模拟一个 telnet client
把 PTT 回传的资料填进一个内部的 buffer 里面
再从里面去抓取你所需要的行数来分析
那这就要你去分析所输出的移位码并做相应移动填值才行
这工作不管用什麽来写都要花一番功夫喔...
--
回一回貌似和这个版变得不太相干起来了 (汗)
--
実琴:「
河野!你真的就这样被
物质慾望给吸引过去了吗?!」
亨:「只要
穿着女装摆出亲切的样子,所有必要花费就能
全免,似乎一点都不坏啊。」
実琴:「难道你没有
男人的尊严了吗?!」
亨:(断然道)「
没有。在
节衣缩食且
生活吃紧的
学生面前,
没有那种东西。」
--プリンセス・プリンセス 第二话
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.230.62
1F:→ Favonia:如果有函式库可能就可以省下功夫了(?) 09/13 13:28
2F:推 raichuchuchu:楼上,等你写函式库 09/14 21:03
3F:推 LaPass:函式库! 函式库! (敲碗) 09/15 12:24
4F:推 transwrap:这一块在bbs reader里面还算小段~ 09/19 16:43