(點選上方公眾號,可快速關註)
來源:王潔 ,
imaidata.github.io/blog/2017/07/11/java連線HBASE(kerberized叢集)/
社群原文 “Connecting to HBase in a Kerberos Enabled Cluster”:
https://community.hortonworks.com/articles/48831/connecting-to-hbase-in-a-kerberos-enabled-cluster.html
講解如何透過 Java 或 Scala 在啟用 Kerberos 的群集中連線到 HBase。
本測試需要一個啟用了kerberos的HDP叢集。叢集搭建參考《Ambari在本地VM(centos7.3)部署hadoop叢集》。本測試在HDP叢集的C7302節點(centos7.3)上進行。首先,下載java樣例程式碼:
https://imaidata.github.io/blog/ambari_centos/
$ cd /opt
$ git clone https://github.com/wbwangk/hdp-test-examples
這個github庫是從jjmeyer0/hdp-test-examples庫fork的。主要修改有:
-
修改了 pom.xml 檔案:增加了對 HDP2.6.1 的支援;去掉了 Scala 相關依賴,因為會導致構建失敗
-
修改了 src/main/java/com/jj/hbase/HBaseClient.java 中 jj 使用者主體為 jj@AMBAR.APACHE.ORGI
建立keytab
在 c7302 節點用管理員賬號登入 KDC,然後建立叫jj的主體,並匯出 keytab:
$ kinit root/admin@AMBARI.APACHE.ORG
$ kadmin -q “addprinc jj” (建立jj主體,需要輸入兩次密碼,密碼是1)
$ ktutil
ktutil: addent -password -p jj -k 1 -e RC4-HMAC
Password for jj@AMBARI.APACHE.ORG: 1
ktutil: wkt jj.keytab (生成了keytab檔案)
ktutil: q
$ scp jj.keytab /opt/hdp-test-examples/src/main/resources
準備HBase使用者
jj 使用者必須在 HBase 中獲得正確的許可權。Ambari 為 HBase建立一個管理員使用者,透過 keytab 查詢管理員使用者主體。並利用它登入,利用金鑰檔案登入不需要密碼:
$ klist -kt /etc/security/keytabs/hbase.headless.keytab (檢視hbase服務的printcipal )
KVNO Timestamp Principal
—- ——————- ——————————————————
1 07/06/2017 03:53:35 hbase-hdp2610@AMBARI.APACHE.ORG
$ kinit -kt /etc/security/keytabs/hbase.headless.keytab hbase-hdp2610 (實測只能用這個主體登入,即使root/admin主體都不行)
$ hbase shell
hbase(main):001:0> grant ‘jj’,’RW’
準備配置檔案
執行例子需要的檔案有三個:
-
hbase-site.xml
-
.keytab
-
krb5.conf 前文已經複製了jj.keytab,現在要複製另外兩個。
由於使用HDP叢集的節點充當客戶機,所以直接在本節點複製檔案即可:
$ scp /etc/hbase/conf/hbase-site.xml /opt/htp-test-examples/src/main/resources/
$ scp /etc/krb5.conf /opt/htp-test-examples/src/main/resources/
對於測試,建議在 hbase-site.xml 中更改 “hbase.client.retries.number” 屬性。預設情況下為35。這個“重試次數”這在執行測試時太大了,複製後可以修改為3。
其它修改
目錄/opt/hdp-test-examples/src`下有兩個目錄:`main`和`test`。`main`目錄放置客戶端程式,而`test`目錄是單元測試目錄。 來到目錄`/opt/hdp-test-examples/src/test/java/com/jj下看看,發現除了hbase還有個pig目錄。如果只是測試java客戶端連線hbase,建議刪除pig目錄。否則在maven構建是也會執行pig的單元測試,而由於沒有正確配置pig,導致必然出錯使構建失敗。
程式碼講解
例子的 Java 程式碼位於 src/main/java/com/jj/hbase/HBaseClient.java。在程式碼中,首先需要做的是建立和載入 HBase 配置:
// Setting up the HBase configuration
Configuration configuration = new Configuration();
configuration.addResource(“src/main/resources/hbase-site.xml”);
接下來指向 krb5.conf 檔案並設定 Kerberos 主體和 keytab。
// Point to the krb5.conf file.
System.setProperty(“java.security.krb5.conf”, “src/main/resources/krb5.conf”);
System.setProperty(“sun.security.krb5.debug”, “true”);
// Override these values by setting -DkerberosPrincipal and/or -DkerberosKeytab
String principal = System.getProperty(“kerberosPrincipal”, “jj@AMBARI.APACHE.ORG”);
String keytabLocation = System.getProperty(“kerberosKeytab”, “src/main/resources/jj.keytab”);
現在使用上面定義的主鍵和 keytab 登入。
UserGroupInformation.setConfiguration(configuration);
UserGroupInformation.loginUserFromKeytab(principal, keytabLocation)
Maven構建、測試
$ cd /opt/hdp-test-examples
$ mvn clean test -P hdp-2.6.1 (如果網路差則耗時較長)
[INFO] Scanning for projects…
[INFO]
[INFO] ————————————————————————
[INFO] Building hdp-test-examples 1.0-SNAPSHOT
[INFO] ————————————————————————
[INFO]
[INFO] — maven-clean-plugin:2.4.1:clean (default-clean) @ hdp-test-examples —
[INFO] Deleting /opt/hdp-test-examples/target
[INFO]
[INFO] — maven-resources-plugin:2.5:resources (default-resources) @ hdp-test-examples —
[debug] execute contextualize
[INFO] Using ‘UTF-8’ encoding to copy filtered resources.
[INFO] Copying 10 resources
[INFO]
[INFO] — maven-compiler-plugin:2.3.2:compile (default-compile) @ hdp-test-examples —
[INFO] Compiling 5 source files to /opt/hdp-test-examples/target/classes
[INFO]
[INFO] — maven-resources-plugin:2.5:testResources (default-testResources) @ hdp-test-examples —
[debug] execute contextualize
[INFO] Using ‘UTF-8’ encoding to copy filtered resources.
[INFO] Copying 1 resource
[INFO]
[INFO] — maven-compiler-plugin:2.3.2:testCompile (default-testCompile) @ hdp-test-examples —
[INFO] Compiling 1 source file to /opt/hdp-test-examples/target/test-classes
[INFO]
[INFO] — maven-surefire-plugin:2.10:test (default-test) @ hdp-test-examples —
[INFO] Surefire report directory: /opt/hdp-test-examples/target/surefire-reports
——————————————————-
T E S T S
——————————————————-
Running com.jj.hbase.HBaseClientTest
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0, Time elapsed: 0.552 sec
Results :
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0
[INFO] ————————————————————————
[INFO] BUILD SUCCESS
[INFO] ————————————————————————
[INFO] Total time: 5.145s
[INFO] Finished at: Wed Jul 19 07:19:34 UTC 2017
[INFO] Final Memory: 38M/91M
[INFO] ————————————————————————
可以自己讀一下單元測試程式碼 /opt/hdp-test-examples/src/test/java/com/jj/hbase/HBaseClientTest.java。看上去,程式碼中它似乎連線上 HBase,然後建表並插入幾行資料。
碰到的問題
-
虛擬機器記憶體不足,將記憶體由 3G 改成 4G 後問題解決;
-
構建過程中一些 jar 包下載失敗,修改 pom.xml,去掉 Scala相關依賴後問題解決;
-
pig 測試失敗,刪除 pig 的單元測試目錄;
-
透過 HBase shell 無法進行 grant,改用 hbase-hdp2610 主體並加大虛擬機器記憶體後解決。
這裡是完整程式碼。
https://github.com/wbwangk/hdp-test-examples
Windows下的測試
前文是在 Centos7.3下進行的測試。下麵在 Windows下進行測試。畢竟很多人使用 Windows+Eclipse 進行開發。下麵的測試並沒有直接使用 Eclipse,而是更直接的命令列測試。希望有人能夠補充上 Eclipse 下的測試。關於 Eclipse 下的相關配置可以參考 hortonworks 的一篇社群文章(“Hortonworks Data Platform Artifacts”)。
https://community.hortonworks.com/articles/43727/hortonworks-data-platform-development-guide.html
測試使用了git bash命令列工具。git base在 Windows 下模擬的類似 Linux 的命令,但實際上使用的 Windows 作業系統檔案。關於 git base 的安裝使用參考這個檔案《Ambari 在本地 VM 部署 Hadoop 叢集》。在 git base 上測試透過後,之後又直接在 Windows 命令列下進行了測試。需要說明的是,git bash 和 Windows 使用了不同的環境變數,如PATH。
https://imaidata.github.io/blog/ambari_vm/
在 Windows 下需要安裝 JDK1.8 和 Maven。Maven是 Java 實現的,所以是所有平臺通用的。在 Maven 的這篇檔案(“Maven on Windows”)中要求 JDK 的安裝目錄名稱不要有空格(如Program Files就不行)。Maven被我安裝在了 e:\maven。在 git bash 下執行 Maven 的方法是 /e/maven/bin/mvn。
http://maven.apache.org/guides/getting-started/windows-prerequisites.html
準備程式碼和配置檔案
測試在 Windows 的 e:\opt 目錄下進行。以下操作在 git bash 視窗中進行:
$ cd /e/opt
$ git clone https://github.com/wbwangk/hdp-test-examples
$ cd hdp-test-examples
$ scp root@c7302:/etc/krb5.conf src/main/resources/
$ scp root@c7302:/etc/hbase/conf/hbase-site.xml src/main/resources/
$ scp root@c7302:/opt/hdp-test-examples/src/main/resources/jj.keytab src/main/resources/
上述三個 scp 操作時把測試用到3個配置檔案從 Linux 下網路複製到了 Windows 下。確保 Windows 的 hosts 檔案中定義了3臺虛擬機器的 IP 和域名。
執行構建和單元測試
$ /e/maven/bin/mvn clean test -P hdp-2.6.1
(省略一些下載資訊)
——————————————————-
T E S T S
——————————————————-
Running com.jj.hbase.HBaseClientTest
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0, Time elapsed: 0.42 sec
Results :
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0
[INFO] ————————————————————————
[INFO] BUILD SUCCESS
[INFO] ————————————————————————
[INFO] Total time: 02:27 min
[INFO] Finished at: 2017-07-20T07:40:15+08:00
[INFO] Final Memory: 31M/206M
[INFO] ————————————————————————
直接在Windows命令列下測試
進入 Windows 命令列後:
$ e:
$ cd \opt\hdp-test-examples
E:\opt\hdp-test-examples> mvn clean test -P hdp-2.6.1
[INFO] Scanning for projects…
[INFO]
[INFO] ————————————————————————
[INFO] Building hdp-test-examples 1.0-SNAPSHOT
[INFO] ————————————————————————
[INFO]
[INFO] — maven-clean-plugin:2.5:clean (default-clean) @ hdp-test-examples —
[INFO] Deleting E:\opt\hdp-test-examples\target
[INFO]
[INFO] — maven-resources-plugin:2.6:resources (default-resources) @ hdp-test-examples —
[INFO] Using ‘UTF-8’ encoding to copy filtered resources.
[INFO] Copying 10 resources
[INFO]
[INFO] — maven-compiler-plugin:3.1:compile (default-compile) @ hdp-test-examples —
[INFO] Changes detected – recompiling the module!
[INFO] Compiling 5 source files to E:\opt\hdp-test-examples\target\classes
[INFO]
[INFO] — maven-resources-plugin:2.6:testResources (default-testResources) @ hdp-test-examples —
[INFO] Using ‘UTF-8’ encoding to copy filtered resources.
[INFO] Copying 1 resource
[INFO]
[INFO] — maven-compiler-plugin:3.1:testCompile (default-testCompile) @ hdp-test-examples —
[INFO] Changes detected – recompiling the module!
[INFO] Compiling 1 source file to E:\opt\hdp-test-examples\target\test-classes
[WARNING] /E:/opt/hdp-test-examples/src/test/java/com/jj/hbase/HBaseClientTest.java: E:\opt\hdp-test-examples\src\test\java\com\jj\hbase\HBaseClientTest.java使用了未經檢查或不安全的操作。
[WARNING] /E:/opt/hdp-test-examples/src/test/java/com/jj/hbase/HBaseClientTest.java: 有關詳細資訊, 請使用 -Xlint:unchecked 重新編譯。
[INFO]
[INFO] — maven-surefire-plugin:2.12.4:test (default-test) @ hdp-test-examples —
[INFO] Surefire report directory: E:\opt\hdp-test-examples\target\surefire-reports
——————————————————-
T E S T S
——————————————————-
Running com.jj.hbase.HBaseClientTest
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0, Time elapsed: 0.318 sec
Results :
Tests run: 4, Failures: 0, Errors: 0, Skipped: 0
[INFO] ————————————————————————
[INFO] BUILD SUCCESS
[INFO] ————————————————————————
[INFO] Total time: 3.624 s
[INFO] Finished at: 2017-07-20T08:15:17+08:00
[INFO] Final Memory: 30M/321M
[INFO] ————————————————————————
【關於投稿】
如果大家有原創好文投稿,請直接給公號傳送留言。
① 留言格式:
【投稿】+《 文章標題》+ 文章連結
② 示例:
【投稿】《不要自稱是程式員,我十多年的 IT 職場總結》:http://blog.jobbole.com/94148/
③ 最後請附上您的個人簡介哈~
看完本文有收穫?請轉發分享給更多人
關註「ImportNew」,提升Java技能