作者agomi (莱姆酒)
看板bioinfo_lab
标题Re: [情报] 为了怕snork不收信箱的信
时间Thu Jan 26 14:06:03 2006
※ 引述《snork (.....)》之铭言:
: 我把档案输出的部分写好了,先用文章的编号 UT 命名
: 可是发现一个很奇怪的问题 @@,
: 就是档案里面抓到的内容是不完整的~
: http://homepage.ntu.edu.tw/~r94548060/citation(060126).rar
: 後来我把相同的网址丢到简单的URLconnection程式跑,
: http://homepage.ntu.edu.tw/~r94548060/URLConnectionReader.java
: 却可以抓到正确的内容,
: 所以证明抓到的网址是对的~
: 我在猜是不是被後面在判断有没有超出30篇reference的程式影响到,
: 不过还是搞不清楚原因 <("""O""")>
: 现在急需高手协助 ~
我一直在等你回信说
我目前做的可以抓到完整的内容
而且也可以做出完整资料的档案(我自己乱凑的 结果居然可以跑 =.= 只是好像有问题)
所以我确定我写的那些东西抓到的都是正确的资料
不过.......我现在遇到一个诡异的问题
我自己写的输出成档案的部份 如果加入程式里面
针对egrf第一页下去做 理论上应该出现八个结果 但是却只出现五个
如果我把那句
FileOutputStream fileOutputStream = new FileOutputStream( new File("D://"+ title +".txt"));
↑mark掉
就可以出现完整的八个结果
这个我一直想想不透
举个例子
我在getTitle()部分加入println( title);
如果不写FileOutptStream那句 就可以印出八个title
如果加了FileOutputStream这句 出来的title却只有五个
可以出现8个title表示程式没问题
而且如果我要他印出8篇paper的ref_link 抓到的东西也没错
但是牵涉到file时就会变成跑到五个就停住
我实在不懂ㄚ
我有把档案寄给你了 你跑跑看
我已经把file的下半部mark掉了 所以不会真的产生档案
但是你会发现跑出来的结果只有五个(针对egrf)
如果你也把我那句FileOutputStream mark掉
你会发现我的程式真的能跑出八个结果没问题
如果你把file相关的程式都unmark掉
会印出五个title 但是真正会做出的档案只有四个
这个地方我不知道该怎麽解决
我想了两天了 =.=
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.170.17.110
※ 编辑: agomi 来自: 218.170.17.110 (01/26 14:10)
※ 编辑: agomi 来自: 218.170.17.110 (01/26 14:10)
※ 编辑: agomi 来自: 218.170.17.110 (01/26 14:17)
※ 编辑: agomi 来自: 218.170.17.110 (01/26 14:18)