|
|
|
|
 | kazmuzik 2009-07-03 21:45:28 #2465322673 from web あまり深く考えたことはありませんでしたが、ちょっと気になり調べてみると、Intel Atom Processor は、やはり 32-bit でした。JDK 6 の開発環境に関しては、ちょっと計画を変更する必要があります。 |
|
 | kazmuzik 2009-07-03 20:39:26 #2464584775 from web 最近は、仕事、家庭、ボランティアで時間をとられがちとなり、ついつい後回しになりがちな personal project(s) がなかなかはかどりません。ちょっとここいらで、見直しをする必要がありそうです。 |
|
 | kazmuzik 2009-07-03 20:14:18 #2464290273 from web InMotion から 1&1 へ移行するために、スクリプトを書いて、大量のファイルをコピーしていたところ、突然 InMotion からのコピーが失敗していました。まったく、InMotion は、最後の最後まで足を引っ張ってくれるサービス(会社)です。 |
|
|
 | kazmuzik 2009-07-03 20:00:53 #2464130182 from web parse-html (nekohtml) を修正する時間がなかったため、workaround として nutch/conf/crawler-urlfilter.txt に parser のバグで生成される余計なパターンを記述したところ、順調に crawlできるようになりました。 |
|
 | kazmuzik 2009-07-03 19:55:43 #2464069325 from web Nutch 1.0 plugin にある parse-html のソースを見ると、CyberNeko HTML Parser を使っていました。昨日の帰りの caltrain の中で、nekohtml のソースはなかったので、作業はここでストップしました。 |
|
|
|