`
zhouxianglh
  • 浏览: 263754 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

(2)Nutch1.0 浅析

阅读更多

关于Nutch1.0 导入Eclipse http://www.iteye.com/topic/525839   给了详细具体的说明

 

1  Nutch1.0 抓取类package org.apache.nutch.fetcher.Fetcher;

src\java\org\apache\nutch\fetcher\Fetcher.java

它有6个内部类,其中FetcherThread.run() 负责抓取

2  nutch-1.0.job  因为它的原因,Nutch 要在Cygwin 下运行.和Nutch-1.0.jar没有直接关系.nutch-1.0.job 是通过 build.xml 文件获得的

    <touch datetime="01/25/1971 2:00 pm">
      <fileset dir="${conf.dir}" includes="**/*.template"/>
    </touch>

 这里有错,注释掉就可以build了.

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics