読者です 読者をやめる 読者になる 読者になる

Elasticsearch Reference [5.0] » Getting Started

Elasticsearchのサイトにある最新ドキュメントを少し読んでみる。
まずは「はじめに」のところ。

Getting Started | Elasticsearch Reference [5.0] | Elastic

Getting Started


Elasticsearch is a highly scalable open-source full-text search and analytics engine. It allows you to store, search, and analyze big volumes of data quickly and in near real time. It is generally used as the underlying engine/technology that powers applications that have complex search features and requirements.

Here are a few sample use-cases that Elasticsearch could be used for:


・You run an online web store where you allow your customers to search for products that you sell. In this case, you can use Elasticsearch to store your entire product catalog and inventory and provide search and autocomplete suggestions for them.


・You want to collect log or transaction data and you want to analyze and mine this data to look for trends, statistics, summarizations, or anomalies. In this case, you can use Logstash (part of the Elasticsearch/Logstash/Kibana stack) to collect, aggregate, and parse your data, and then have Logstash feed this data into Elasticsearch. Once the data is in Elasticsearch, you can run searches and aggregations to mine any information that is of interest to you.


・You run a price alerting platform which allows price-savvy customers to specify a rule like "I am interested in buying a specific electronic gadget and I want to be notified if the price of gadget falls below $X from any vendor within the next month". In this case you can scrape vendor prices, push them into Elasticsearch and use its reverse-search (Percolator) capability to match price movements against customer queries and eventually push the alerts out to the customer once matches are found.


・You have analytics/business-intelligence needs and want to quickly investigate, analyze, visualize, and ask ad-hoc questions on a lot of data (think millions or billions of records). In this case, you can use Elasticsearch to store your data and then use Kibana (part of the Elasticsearch/Logstash/Kibana stack) to build custom dashboards that can visualize aspects of your data that are important to you.
Additionally, you can use the Elasticsearch aggregations functionality to perform complex business intelligence queries against your data.


For the rest of this tutorial, I will guide you through the process of getting Elasticsearch up and running, taking a peek inside it, and performing basic operations like indexing, searching, and modifying your data. At the end of this tutorial, you should have a good idea of what Elasticsearch is, how it works, and hopefully be inspired to see how you can use it to either build sophisticated search applications or to mine intelligence from your data.

はじめに

Elasticsearchは、拡張性の高いオープンソース全文検索及び分析エンジンです。
高速かつリアルタイムに大量データの格納、検索、分析を可能にします。
複雑な検索機能要件を持つアプリケーションを動かす基本的なエンジン/技術として一般的に使用されます。

Elasticsearchの使用例は以下の通り。

・オンラインショップ
 販売する全製品のカタログ、在庫情報を格納して、
 製品の検索や入力補完(オートコンプリート)機能を提供することができます。

・価格を通知するプラットフォーム
 例えば、ある電子機器の購入を検討している顧客(買い物上手)が、
 「来月までに、その電子機器の価格が、他のベンダーの価格よりも$x下がったら通知してほしい」
 といった条件を指定して、
 ベンダーの価格をスクレイピングして、Elasticsearchにストアして、
 「その価格の動きと顧客が指定した条件を比較して、条件と一致したら、自動的に顧客に通知する」
 (パーコレーター)といった機能を提供することができます。

・ログデータまたはトランザクションデータを収集して、
 傾向、統計、要約の解析、または異常を解析したい場合には、
 Logstash(Elasticsearch / Logstash / Kibanaスタックの一部)を使用して
 データを収集、集計、解析することができます。
 その後、Logstashを使用して、このデータをElasticsearchへ投入させることができます。
 Elasticsearcにデータが投入された状態になると、
 あなたの関心のある情報の検索や集計を行うことができます。

・定型・非定型検索ソリューション(BI:Business Intelligence)のニーズがあり、
 多くのデータ(数百万、数十億)を迅速に調査し、分析し、視覚化し、
 アドホックな質問(日常的なものに対して、臨時的・専門的な質問)をしたいと考えている、
 といった場合には、Elasticsearchを使用してデータを保存し、
 Kibana(Elasticsearch / Logstash / Kibanaスタックの一部)を使用して、
 重要なデータの側面を可視化できるカスタムダッシュボードを構築できます。
 さらに、Elasticsearchの集計機能を使用して、
 データに対してビジネスインテリジェンス クエリを実行することもできます。

 ⇒データを集計、可視化したり、その集計データを抽出したりして、
  経営上の意思決定にElasticsearch、Kibanaを活用することができます、
  といったことが書いてあるのだろう。
 ※「ビジネスインテリジェンス」- Wikipedia参照
  経営・会計・情報処理などの用語で、企業などの組織のデータを、
  収集・蓄積・分析・報告することで、経営上などの意思決定に役立てる手法や技術のこと。

このチュートリアルでは、Elasticsearchを起動させて、その内部を見ていき、
データの索引付け、検索、変更などの基本的な操作方法を説明いたします。
最後までチュートリアルを読んで頂ければ、Elasticsearchがどのようなものなのか、
洗練された検索アプリケーションを構築するために、また、データマイニングのために、
どのようにElasticsearchを使用できるのかが分かるようになるはずです。

※「データマイニング」とは
 データの集合の中から、知識を発見しよう!というものです。

データマイニング」 - Wikipedia

定義
 データマイニングの定義としては、「明示されておらず今まで知られていなかったが、役立つ可能性があり、かつ、自明でない情報をデータから抽出すること」[1]、「データの巨大集合やデータベースから有用な情報を抽出する技術体系」[2]などがある。 データマイニングは、通常はデータの解析に関する用語として用いられるが、人工知能という用語などと同様、包括的な用語であり、様々な文脈において多様な意味で用いられる。

広告を非表示にする