[[분류:검색 엔진]][[분류:컴퓨터 공학]] [목차] == 개요 == search engine. [[월드 와이드 웹]] 상에 존재하는 [[정보]]와 [[웹 사이트]]를 [[검색]]하기 위한 프로그램이다. 웹의 정보를 긁어오는 소프트웨어는 [[크롤링|크롤러]]라고 부르고, 그 행위는 [[크롤링]]이라고 부른다. 참고로 일반 검색 엔진에 안 잡히는 웹을 [[딥 웹]]이라 한다. 검색 엔진은 프로그램을 가리키는 것이고 그 프로그램으로 검색 서비스를 제공하는 곳은 '검색 사이트'지만, 사실상 검색 엔진이라는 용어로 두 의미를 혼용하고 있다. 또한, 사실상 [[포털 사이트]]와 동의어로 쓰이기도 한다. 이는 대부분의 포털 사이트가 검색 서비스를 제공하고 있기 때문이다. 2010년대 들어선 [[모바일]]의 강세와 [[유튜브]]의 강세로 검색 엔진의 입지가 좁아지는 중이다. 현대 들어서 제대로 된 검색은 구글을 통해 시행할 뿐 대부분의 정보는 검색이 아닌 유튜브나 [[SNS]]로 얻는게 대세가 되었기 때문. [[네이버]]는 검색엔진의 힘이 2000년대 비해 보잘것 없다는 얘기를 듣지만 쇼핑[* 네이버쇼핑은 [[네이버페이]]와 결합해 2020년 현재 한국 2위 인터넷쇼핑 업체로 자리잡았다.], 메신저, 웹툰 등을 강화해 좋은 평가를 받고 있는 반면 검색 엔진에 역량을 집중한 [[바이두]]는 쇼핑의 [[알리바바 그룹|알리바바]], SNS와 메신저의 [[텐센트]]에 비교해 모바일 환경에 전혀 강점이 없다는 평가를 듣고 있다. 그러다 2022년 11월 말 출시된 [[ChatGPT]]의 등장으로 대형 언어 모델 기반의 [[대화형 인공지능]] 서비스가 주목을 받자 인공지능과 검색엔진을 결합한 AI 검색엔진이 새로운 비즈니스 모델로 떠오르며 또다른 변화를 예고하고 있다. 자세한 내용은 [[인공지능 검색 엔진]] 문서 참고. == 목표 == * 검색의 품질, 효과성: 사용자가 원하는 정보에 부합하는 정보를 모으는 능력이다. * 검색의 속도, 효율: 이름 그대로 검색 속도이다. == 기능 == * [[색인]] 과정: 빠른 검색을 위해 색인(Index)이라 하는 키워드를 만들고 정리한다. * 텍스트 획득 * [[크롤링]] * [[피드]] (Feed): 문서를 실시간으로 나열하는 기능. * 인코딩 * 텍스트 변환: 텍스트를 색인어로 변환한다. * 파서 * 불용어 제거 * 스테밍 * 링크 추출 및 분석 * 정보 추출 * 분류 * 색인 생성 / [[검색 등록]]: 빠른 검색을 위해 데이터베이스를 만든다. * 통계 * 가중치 부여 * 인버전 * 색인 분산 * 질의 과정 * 사용자 경험 및 사용자 인터페이스 * 질의 입력 * 질의 변환 * 결과 출력 * 순위부여: 사용자에 맞게 검색의 우선순위를 만든다. * 점수 부여 * 성능최적화 * 검색분산 * [[키워드 스터핑]] * [[필터링]] * 평가: 품질과 속도를 평가. * 로깅 * 순위부여 분석 * 성능분석 == 목록 == 다른 업체(들)로부터 검색결과를 사온 후 편집하여 보여주는 사이트는 검색 결과를 사오는 회사의 이름을 같이 기재하여 목록에 포함시킨다. 검색 말고도 뉴스, 게임 등 다른 서비스를 제공하는 종합 [[포털 사이트]]의 경우 '''독자적인 자체 검색엔진'''을 보유한 경력이 있는 경우에만 이 목록에 추가한다. 단, 타 사이트에서 검색결과를 제공받으면 ▩표를 한다. === 한국 서비스 중 === ## 해외에 적을 둔 웹 검색엔진이라도 한국에서 서비스 중이라면 한국 검색엔진으로 처리한다.(같은 회사의 검색엔진이라도 언어에 따라 엄연히 다른 검색엔진이 되기 때문이다.) ## 한때 한국에서 서비스를 했으나 지금은 하지 않는 경우는 '''서비스를 처음 시작한 지역이 한국라 하더라도''' '해외'부분에 기재한다. * '''[[구글]]''': 한국 포함 전세계에서 가장 많이 사용되는 검색 엔진. * [[네이버]] : 한국 2위 검색 엔진 * [[Microsoft Bing|Bing]]: [[Microsoft Edge]]의 기본 검색 엔진이기도 하다. 선호되지는 않으나 최근 빙 gpt로 주목을 받고 있다. * [[zum]]: 영문 검색, 이미지 검색 등 일부 검색은 구글 맞춤 검색을 사용하고 있다.[[http://kalaheim.egloos.com/1217859|#1]][[http://news.inews24.com/php/news_view.php?g_menu=020310&g_serial=869177|#2]] * [[네이트]]▩: 다음으로부터 검색 결과를 제공받는다.[* 엠파스 인수 시까지만 해도 자체적인 검색 엔진을 보유했었다.] * [[다음]]: 자체적 검색 외에도 Bing의 검색 결과도 보여준다. * [[드림위즈]] * [[나무위키]]: 자체적 검색 엔진이 있으며, 크롬과 웨일 브라우저에서 기본 엔진으로 설정이 가능하다. * [[코리아닷컴]] === 해외 서비스 중 === ## 해외에 적을 둔 웹 검색엔진이라도 한국에서 서비스 중이라면 한국 검색엔진으로 처리한다.(같은 회사의 검색엔진이라도 언어에 따라 엄연히 다른 검색엔진이 되기 때문이다.) ## 한때 한국에서 서비스를 했으나 지금은 하지 않는 경우는 '''서비스를 처음 시작한 지역이 한국라 하더라도''' '해외'부분에 기재한다. * [[구글]] : 세계 1위 검색 엔진 * [[AOL]]▩ : Bing에서 검색결과를 제공받는다. * Ask Jeeves▩ : 구글에서 검색결과를 제공받는다. * [[Brave]] Search▩ : 자체 검색결과를 제공하나, 결과가 존재하지 않을 때 Google Fallback 옵션을 이용하여 구글 검색결과를 받아볼 수 있다. * Boodigo * [[Microsoft Bing|Bing]] * Disconnect▩ : 구글, Bing, 야후에서 검색결과를 제공받았지만 현재 구글은 차단된 상태. Tor 브라우저 기본 검색 엔진. * Dogpile▩ : 구글, 야후에서 검색결과를 제공받는다. * [[DuckDuckGo]]: 개인정보를 전혀 수집하지 않는 개인정보 중시 검색엔진. 개인정보 보호에 관심이 많아지는 추세에 전세계 점유율 2위를 찍었다가 다시 4~5위로 내려갔다. * [[https://www.ecosia.org/|Ecosia]] : 검색엔진을 이용한 만큼 나무를 심는 [[사회적 기업]]. * Gigablast * ixquick▩: 구글, 야후, Bing에서 검색결과를 제공받는다. 과거 Tor 브라우저 기본 검색 엔진. 현재 StartPage에 인수됨. * StartPage.com▩: 구글에서 검색결과를 제공받는다. DuckDuckGo와 같은 프라이버시 중시 검색 엔진. * [[Wolfram Alpha]] * 룩스마트: 2015년에는 검색광고 업체로 바뀌었다. * [[라이코스]]▩: Bing으로부터 검색결과를 제공받는다. * [[바이두]] * [[얀덱스]] * [[익사이트]]▩: Dogpile에서 검색결과를 제공받는다. * [[야후!]]▩: Bing에서 검색결과를 제공받는다. * [[야후! 재팬]]▩: 구글에서 검색결과를 제공받는다. * 핫봇▩: 라이코스에서 검색결과를 제공받는다. * [[엘라스틱 서치]]: 오픈소스 검색엔진. * [[https://www.webcrawler.com/|웹크롤러]]: 현재까지 살아남은 검색 엔진 중 최장수 엔진.[* 단, 자체 홈페이지로 검색 엔진 서비스를 제공한 최초의 기업은 구글이다. 웹크롤러는 처음 시작할 때는 [[워싱턴 대학교]] 네트워크 홈페이지 상에서 기능했고, 이후 [[AOL]]에 인수된 후로는 AOL의 하위 페이지로 기능하다가, 2001년이 되어서야 자체 홈페이지로 서비스를 제공하였다.] 소형 검색 엔진으로서는 드물게 자체 엔진으로 서비스 중이지만,[* 2001년부터 InfoSpace라는 회사가 운영 중인데, 같은 회사에서 운영하는 메타 검색 엔진 [[https://www.metacrawler.com/|MetaCrawler]]의 경우에는 일찌감치 자체 엔진을 폐기하였고 현재는 Bing에서 검색 결과를 제공받는다.] 과거 많은 사람들이 찾던 대형 검색 엔진 시절이던 [[AOL]] 산하였을 때가 무색하게도 현재는 검색 결과의 퀄리티가 썩 좋지 않아 쓰는 사람이 거의 없기에 운영은 하지만 사실상 운영하는 기업의 실험장 역할이라고 봐야 한다. === 서비스 종료 === * '''한국''' * [[까치네]] * [[미스다찾니]]: 메타 검색엔진으로 한미르, 알타비스타, 라이코스, 야후!, ....등 다양한 검색엔진에서 결과를 가져왔다. * [[마이엠]] * [[심마니]]: 천리안에 인수됐고, 천리안도 검색 분야는 사실상 손을 놓은 상황이니... * [[엠파스]]: 상기된 네이트와 통합. * [[야후!]]: 2014년에 한국 서비스는 종료됐지만, 해외 서비스는 있다. * [[첫눈(동음이의어)#s-3]] * [[큐로보]] * [[코시크]]: 1995년 서비스를 시작한 최초의 한글 검색엔진. * [[파란(포털)|파란]]([[정보탐정]]) : 한미르와 [[하이텔]]이 통합한 사이트였지만, 결국은 사라졌다. * '''해외''' * Blekko * Cuil * Infoseek * Teoma * [[와카노]]: 맨 처음에는 세계로 진출하는 한국 검색엔진이었지만 얼마 안 가 망하고 일본 지사만 남아 지금은 일본 검색 엔진이다. --검색하려 하면 서버랑 연결이 안 되는 건 넘어가기로 하자.-- * [[잉크토미]] * [[알타비스타]]