问一个如何在 Hadoop 中正确引入 IK 资源包的基础问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3052 天前的主题，其中的信息可能已经有所发展或是发生改变。

情况是这样的，由于用 PHP 做那 2000w 文字的词频提取耗时太长了，就 Google 了一下，发现 Hadoop 可以做词频分析，就在虚拟机上部署好了 Hadoop ，基本的 WordCount 跑通，然后就想着更改一下，使用 IK 来分词，下载了 IKAnalyzer2012_u6 资源包，把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下，/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下，结果，当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候，怎么来都给我下面这样的错误：
./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.IKSegmenter;
^
./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
import org.wltea.analyzer.core.Lexeme;
^
请 v2er 们指教一下。。

1 条回复 • 2016-09-02 18:29:52 +08:00

apoclast

2016-09-02 18:29:52 +08:00

在虚拟机上跑 hadoop...还不如直接本机跑