본문 바로가기

분류 전체보기21

Elasticsearch의 shard와 replica shard와 replica는 elasticsearch에서만 존재하는 개념은 아니다. DB쪽에서는 널리 쓰는 개념이니 알아두면 도움이 되겠지. 컴퓨터를 좀 안다 하면 RAID를 들어본 적이 있을거다. shard와 replica를 이해하는데 RAID 개념이 도움이 될 듯 하다. RAID 0 / RAID 1 RAID는 여러개의 하드디스크를 용도에 맞게 구성해 사용하는 기술이다. 저장 속도를 높이기 위해 분할 저장을 하거나 안정성을 위해 복제본을 만들거나 패리티 비트를 쓰거나 하는 등의 기술이다. RAID0은 stripe라고도 한다. 2개의 disk가 있을 경우 데이터를 나눠서 기록하는 방식이다. 이 방식은 데이터를 저장하는 속도를 높여주는 역할을 한다. disk가 한개라면 동시에 1개 데이터만 기록할 수 있지.. 2020. 1. 11.

Elasticsearch의 Cluster와 Node 개념 앞 포스팅에서 elasticsearch 실습환경에 관해 얘기하다가 node니 cluster니 얘기를 잠깐 했었다. 실습을 진행하기 전에 기본적인 내용은 언급하는 게 추후 과정을 이해하는데 도움이 될 것 같다. 그렇게 어려운 내용은 아니니 한번 훑어보자. Node 일반적으로 쓰는 node 라는 단어는 표준국어대사전에 아래와 같이 정의되어 있다. (사실 국어대사전에 외래어까지 있는 줄은 몰랐다.) 노드(node) 컴퓨터 데이터 통신망에서, 데이터를 전송하는 통로에 접속되는 하나 이상의 기능 단위. 주로 통신망의 분기점이나 단말기의 접속점을 이른다. 출처 : 표준국어대사전 아주 좋은 설명이다. node는 위 설명대로 하나 이상의 기능의 단위 혹은 단말기의 접속점이다. elasticsearch에서의 node도 .. 2020. 1. 10.

Elasticsearch 실습 환경에 관해서.. elasticsearch 설치 방법은 비교적 간단하다. 그냥 홈페이지에서 설치 하라는 대로 하면 된다. 그런데 보통 elasticsearch는 여러개의 node로 cluster를 구성하거나 logstash, kibana 등과 함께 사용하기 때문에 한 대의 PC에서 모두 사용하기엔 무리가 있다. (물론 포트 나눠서 쓰면 가능이야 하겠지만 편하게 하자.) 이렇게 PC 여러대가 필요한 elastic-stack 환경을 구성하기 위해서 아래 방법 중 하나를 활용하면 될 것 같다. 아, 여기서 node, cluster라 하는 부분은 다음 포스팅에서 자세히 다뤄보겠다. 지금은 일단 넘어가자. VM Ware(혹은 Virtual Box)를 활용한 가상머신 Docker를 활용한 컨테이너 환경 호스팅형 elastic 서비스.. 2020. 1. 5.

Elasticsearch가 빠르다는데..? inverted index? 앞서 언급했듯이 elasticsearch는 검색엔진이다. 검색엔진이면 당연히 저장되어 있는 데이터들 중 원하는 데이터를 찾아내는 속도가 빨라야 하겠지? 근데 그건 다른 DB들도 마찬가지다. 그렇다면 elasticsearch가 다른 DB랑은 어떻게 다를까? Elasticsearch는 어떻게 작동하나요? 로그, 시스템 메트릭, 웹 애플리케이션 등 다양한 소스로부터 원시 데이터가 Elasticsearch로 흘러들어갑니다. 데이터 수집은 원시 데이터가 Elasticsearch에서 색인되기 전에 구문 분석, 정규화, 강화되는 프로세스입니다. Elasticsearch에서 일단 색인되면, 사용자는 이 데이터에 대해 복잡한 쿼리를 실행하고 집계를 사용해 데이터의 복잡한 요약을 검색할 수 있습니다. Kibana에서 사용.. 2020. 1. 5.

이전 1 2 3 4 5 6 다음

티스토리툴바