Apache Solr (1)
Wikipedia(https://ja.wikipedia.org/wiki/Apache_Solr)より
Solr(ソーラー)は、オープンソースの全文検索システム。Apacheソフトウェア財団のLuceneプロジェクトのサブプロジェクトとして開発されている。
というわけで、今回はとりあえずsolrを使ってみます。
まずは"DOWNLOAD"から
勧められた通りに山形大から取得。
(zip, tgz等はお好みの形式で)
展開後、solr-x.x.x/example/README.txt を参照。
上記にある"dih"(Data Import Handler) を試してみます。
solr-x.x.x上にいるとしてbin/solr -e dih
を実行します。
*** [WARN] *** Your open file limit is currently 256.
It should be set to 65000 to avoid operational disruption.
If you no longer wish to see this warning, set SOLR_ULIMIT_CHECKS to false in your profile or solr.in.sh
*** [WARN] *** Your Max Processes Limit is currently 709.
It should be set to 65000 to avoid operational disruption.
If you no longer wish to see this warning, set SOLR_ULIMIT_CHECKS to false in your profile or solr.in.sh
Starting up Solr on port 8983 using command:
"bin/solr" start -p 8983 -s "example/example-DIH/solr"
*** [WARN] *** Your open file limit is currently 10240.
It should be set to 65000 to avoid operational disruption.
If you no longer wish to see this warning, set SOLR_ULIMIT_CHECKS to false in your profile or solr.in.sh
*** [WARN] *** Your Max Processes Limit is currently 709.
It should be set to 65000 to avoid operational disruption.
If you no longer wish to see this warning, set SOLR_ULIMIT_CHECKS to false in your profile or solr.in.sh
Waiting up to 180 seconds to see Solr running on port 8983 [-]
Started Solr server on port 8983 (pid=97580). Happy searching!
Solr dih example launched successfully. Direct your Web browser to http://localhost:8983/solr to visit the Solr Admin UI
警告が何度か出ていますが、ひとまずここは置いておいて、示された"Solr Admin UI"を確認します。
初期画面は"Dashboard"です。早速データを取り込んでみます。
データの種別(左側メニューのコンボボックス)を選択すると、その下にさらにメニューが表示されます。
ここでは、“atom” -> "DataImport"と選択しています。
さらにEntityを選択(exampleでは"stackoverflow"のみ)した後、"Execute"を押下します。
"Refresh Status"を押下すると、右側にステータスが表示されます。
クエリを発行してみます。
デフォルトの出力形式(?)はjson形式の模様。
wtの値を変えれば、出力形式を変えられます。
xmlや
pythonなど
次は実用っぽいものをやってみたいと思います。
Written with StackEdit.
コメント
コメントを投稿