검색

파일:Attachment/rjator.jpg

検索, Retrieval/Search

지금 이 위키를 사용하는 것을 포함한 인터넷의 시작점.
당신은 검색을 나무위키에 검색했다.
분명 심심한데 검색해볼 건 없고 검색창에 마침 Search라는 영어가 있어서 검색해보다가 이 항목으로 들어온사람 있을거다

1 개요

검색의 사전적인 의미는 '범죄나 사건을 밝히기 위한 단서나 증거를 찾기 위하여 살펴 조사함'이나, IT에서는 어떤 기억 매체 중에 축적되어 있는 정보 중에서 필요한 정보를 찾아내는 것을 뜻한다. 우리가 인터넷으로 정보를 보기 위해 키보드 타이핑으로 특정 단어를 검색하여 결과를 도출하게 하는 것을 말한다.

2 검색의 종류

검색에는 여러 종류가 있는데, 대표적으로 두가지 형식이 있다.

2.1 형식

사실 검색(fact retrieval)

  • 주어진 질문에 대해 직접 사실을 구하는 것으로 확정 검색(deterministic retrieval)

이라고도 한다.

문헌 검색(document retrieval)

  • 어떤 사실에 관하여 관계되는 문헌명을 찾아내는 행위. 확률 검색(stochastic retrieval)이라고도 한다. 우리가 컴퓨터로 정보를 찾아내는 것은 보통 문헌 검색이다.

2.2 데이터베이스의 종류에 따른 분류

  • 통합검색 - 다양한 종류의 데이터베이스를 검색하여 얻은 검색 결과 중 각 데이터베이스 별로 몇 개의 검색 결과만 차례대로 배열하여 보여주는 검색이다. 인터넷 상에 한글로 기록된 정보가 부족하다는 단점을 극복하기 위해 등장한, 한국에서만 보이는 독특한 형식의 검색이다.물론 독특한 거지 장점만 있는 것은 아니다.
  • 웹검색(웹문서 검색) - 웹상의 모든 문서를 데이터베이스로 하여, 검색 주제와 맞는 문서를 찾는 검색이다.
  • 사이트검색 - 검색 주제와 관련된 사이트를 찾을 때 쓰는 검색이다. 웹검색과는 다르게 사이트의 메인 페이지를 주로 보여준다.
  • 사전검색 - 각종 사전을 데이터베이스로 하여 검색 주제와 관련된 내용을 찾을 때 쓰는 검색이다.
  • 뉴스검색 - 각종 뉴스 사이트 및 전자화된 신문 등, 뉴스를 데이터베이스로 하여 검색 주제와 관련된 내용을 찾을 때 쓰는 검색이다.
  • 지식검색 - 흔히 지식iN으로 알려져있는, 누리꾼이 묻고 누리꾼이 답하는 Q&A 서비스이다.
  • 지도검색 - 여러 시설의 정보를 기록해놓고, 검색 주제와 맞는 시설의 정보를 지도 위에 표시해서 보여주는 검색이다.
  • 이미지 검색 - 입력한 검색 주제와 맞는 이미지를 검색한다.
  • 동영상검색 - 입력한 검색 주제와 맞는 동영상을 검색한다.
  • 카페검색 - 각종 카페글을 데이터베이스로 하여 검색 주제와 맞는 글을 찾는 검색이다.
  • 블로그검색 - 각종 블로그를 데이터베이스로 하여 검색 주제와 맞는 글을 찾는 검색이다.
  • 음악검색 - 각종 음원사이트의 음원 정보를 데이터베이스로 하여 검색 주제와 맞는 음원을 찾는 검색이다.
  • 쇼핑검색 - 각종 인터넷 쇼핑 사이트의 매물 정보를 데이터베이스로 하여 검색 주제와 맞는 매물을 찾는 검색이다.
  • 책검색 - 각종 인터넷 서점 사이트 및 서점의 전산화 정보를 데이터베이스로 하여 검색 주제와 맞는 책을 찾는 검색이다.
  • 브라우즈검색

2.3 검색 방식에 따른 분류

2.3.1 키워드 검색

사용자가 검색창에 검색어를 입력하면, 그 단어에 적합한 내용이 담겨있을 것으로 짐작되는 자료를 데이터베이스 상에서 찾는 검색이다. 오늘날 검색을 지칭하면 사실상 키워드 검색을 떠올리는 경우가 많다. 이런 형태의 검색을 사용하고 싶다면, 멀리 갈 것 없다. 당장 나무위키의 검색이 키워드 검색이다. 나무위키가 질린다면 네이버나 다음,구글등의 검색창에 검색어를 입력하고 엔터를 치면 된다.그러니까 검색창에 검색어 입력하고 검색이 되면 키워드 검색이다.

2.3.2 디렉토리 검색

데이터베이스의 자료를 여러가지 주제로 분류한다. 이렇게 분류한 자료를 또 나름의 기준을 가지고 분류한다. 이렇게 분류된 자료를 또 새로운 기준으로 분류한다. 이런 과정을 자꾸 반복하면 거대한 데이터베이스의 자료 중 특정 주제 몇 가지와 관련된 문서는 몇 십개나 몇 개만 남게 된다. 이렇게 데이터베이스의 자료를 주제에 따라 여러가지로 분류하여 자료를 보여주는 범위를 축소하는 방식을 이용한 검색을 디렉토리 검색이라 한다.

예시를 위해, 나무위키 개발진이 디렉토리 검색을 사이트 기능에 추가하기 위한 준비에 착수했다고 "가정"하겠다. 그런데 그것이 실제로 일어났습니다.[1] 나무위키 전체의 문서는 1차적으로 음악, 스포츠, 물리학, 과학, 인터넷 등 다양한 주제의 문서로 분류된다. 이 중 스포츠 관련 정보로 분류된 문서는 다시 축구, 야구, 농구, 하키 등의 주제에 따라 다시 분류된다. 이 중 야구와 관련된 문서는 다시 선수, 팀, 규칙, 장비 등의 주제로 분류될 수 있다. 이 중 장비와 관련된 문서는 다시 배트, 글러브, 공 등의 문서로 분류할 수 있다. 이렇게 계속 분리하다보니 나무위키의 문서 중 스포츠, 야구, 장비, 공과 관련된 문서는 몇 개로 줄어 해당 문서로의 링크만 걸어주면 별도의 과정 없이도 사람이 충분히 찾을 수 있을 만큼 자료의 범위가 작아지게 된다.

키워드 검색과 더불어 90년대 및 2000년대 초반까지는 많이 쓰였지만 현재는 그 방식의 태생적 한계와 불편함 때문에 거의 쓰이지 않는다. 디렉토리 검색은 다음과 같은 한계를 지니고 있었다.

  • 불편하다. - 키워드 검색은 사용하기 정말 편하다. 그냥 자신이 원하는 검색어만 입력하면 그대로 그 검색어와 관련된 문서를 보여준다. 하지만 디렉토리 검색은 자신이 찾고 싶은 문서를 보기 위해 분류 주제를 여러 번 클릭해야 했고, 그 과정은 키워드 검색에 비하면 느리고 귀찮은 과정이었다. 결국 사용자들은 키워드 검색을 선호하게 된다. 당장 위의 예시를 인용하자면, 나무위키에서 야구공과 관련된 정보를 찾고 싶다면 그냥 검색창에 '야구공'이란 글만 치면 자동으로 정보를 볼 수 있다. 하지만 디렉토리 검색으로 찾으려면 '스포츠, 야구, 장비, 공' 이렇게 네 번이나 클릭해서 정보를 찾을 수밖에 없다.
  • 데이터베이스가 클 경우 비효율적이다. - 디렉토리 검색이 2000년대 중반부터는 거의 안 쓰이는 주요 이유이다. 디렉토리 검색은 데이터베이스를 주제별로 쪼개서 사람이 자신이 원하는 자료를 편하게 찾을 수 있을 만큼 보여주는 자료의 범위를 줄여 불편을 줄인다. 이 방식은 데이터베이스에 담긴 문서 수가 몇 십만 장, 또는 몇 백만 장 정도로 비교적 작을 때는 효과적이다. 하지만 데이터베이스의 문서 수가 몇 십억 장, 또는 그 이상으로 불어나면 이야기가 달라진다.
    • 앞의 예시를 인용하자면, 나무위키의 전체의 문서 수는 약 50만 장[2]으로, 이 중 스포츠, 야구, 장비, 공 관련 문서는 얼마 되지 않아 디렉토리 검색으로도 쉽게 문서를 찾을 수 있다. 하지만 문서가 몇 십억 장 이상이나 되는 구글의 데이터베이스 전체에서 '스포츠, 야구, 장비, 공'이라는 주제만으로는 사람이 자료를 찾는 데 불편함을 느끼지 않을 정도로 자료의 범위가 줄어들지 않는다. 이런 한계를 디렉토리 검색의 방식으로 극복하려면 주제를 더 세분화하는 방법밖에는 없는데, 그렇게 되면 이용자들이 더 많이 클릭을 하게 되어 매우 불편해진다. 인터넷 전체 문서 수가 너무 많아 정확히 몇 장이나 되는지 집계조차 되지 않는 2010년대에, 디렉토리 검색은 사용하고 싶어도 사용할 수 없는, 시대에 뒤떨어진 검색 방식이 되었다.
  • 새로운 주제에 대한 유연성이 떨어진다. - 디렉토리 검색은 문서를 주제별로 나누는 방식으로 보여주는 문서의 양을 줄인다. 이 때, 기존의 분류로는 나누기 어려운 새로운 주제를 다루는 문서는 어떻게 분류를 할지 애매해지는 문제가 생긴다.

위와 같은 문제점 때문에 현재 검색 서비스 제공 업체 중 디렉토리 검색을 지원하는 업체는 거의 없다. 그래도 아직 몇 군데에서는 디렉토리 검색을 사용할 수 있다. 한 번 사용해보고 싶다면 여기에 들어가보자.

3 관련 문서

  1. 나무위키의 분류:분류 기능이 디렉토리 검색의 기능과 사실상 같다.
  2. 리다이렉트 문서까지 전부 다 포함된 결과로, 실제 문서 수는 이보다 작다.