Bing AI 챗봇 vs Google 검색: 누가 더 나은가요, 그리고 광고는 어떤가요?
ChatGPT가 검색 업계에 변화를 불러일으키며 Google을 흔들었다면, 새로운 Bing은 바로 그 변화의 시작입니다. Bing의 챗봇은 OpenAI의 대규모 언어 모델 중 가장 진보된 버전인 GPT-4로 구동되며(ChatGPT는 이전 버전인 GPT- 3.5를 기반으로 구축됨), Microsoft에서 검색을 위해 특별히 맞춤 설정되었습니다. 다른 검색 엔진과 마찬가지로 Bing의 챗봇은 현재 이벤트를 인식하며 ChatGPT와 달리 시간, 날씨, 뉴스를 알려줄 수 있습니다. 즉, 챗봇의 대화 기술과 풍부한 리소스, 검색 엔진의 인지도라는 두 가지 장점을 결합하도록 설계되었습니다.
2월 7일, 새로운 Bing이 발표된 후 처음에는 대기자 명단을 통해 이용할 수 있었습니다. 그때부터 수백만의 초기 테스터들이 그것을 시험적으로 사용해보았습니다.이들 중 3분의 1은 이전에 Microsoft 검색 엔진을 사용한 적이 없었으며, 일일 Bing 사용자 수는 총 1억 명에 달합니다. 새롭고 멋진 기능을 어서 사용해보고 싶었기에 저희도 새로워진 Bing을 테스트하기 위해 가입했습니다.
결론부터 말씀드리자면, 어쩌면 구글보다 더 매력적일 수 있겠지만 완전히 정확하지는 않고 잠재적으로 악용될 소지가 있다는 것입니다. 특히, AI와 검색의 폭발적인 조합에 광고를 조금만 추가한다면 말입니다.
두 배로 향상된 성능
ChatGPT와 같은 챗봇과 검색 엔진의 중간 형태인 Bing은 이론상으로는 두 가지 이상의 기능을 제공할 수 있어야 합니다. 실제로 Bing Chat은 사용 가능한 최신 데이터를 기반으로 표를 그리거나, 시를 쓰거나, 사본을 편집하거나, 농담을 할 수 있습니다.
그러나 검색 엔진의 원래 목적은 사용자를 즐겁게 하거나 사용자의 작업을 대신하는 것이 아니라 기본적인 검색에 대한 응답으로 정확하고 신뢰할 수 있는 정보를 제공하는 것입니다. 그래서 새로운 Bing이 시장 점유율 90%에 육박하는 검색 엔진 시장의 부동의 1위인 Google 검색과 비교했을 때 어떤 차이가 있는지 알아보고 싶었습니다.
Google vs Bing: 누가 더 나은가요?
저희는 실험을 위해 전 세계에서 가장 많이 검색된 질문을 몇 가지 선택하여 Bing Chat과 Google 검색을 통해 실행했습니다.
1. 지금 몇 시인가요?
Google을 사용할 수 있는데 누가 시계가 필요하겠어요? 하지만 이상하게도 가장 많이 검색되는 검색어는 '지금 몇 시인가요'였습니다. 그래서 저희는 매번 미국 VPN 서버를 사용하여 두 검색 엔진에 이 검색어를 입력했습니다.
당연하게도 Google 검색은 첫 번째 시도에서 시간과 대략적인 위치를 알려주었습니다.
Bing의 챗봇을 사용하면 시간을 알아내는 것이 상당히 어려웠습니다. 여러 번 시도해 본 결과, 때때로 Bing이 Google만큼 빠르지는 않지만 정답을 바로 알려주기도 했습니다.
하지만 챗봇이 기기 설정에 접근하려면 사용자의 허락이 필요하다고 말하거나, 사용자가 어디에 있는지 말하지 않으면 시간을 알려주지 않는 경우도 있었습니다.
한 번은 언어 설정을 독일어로 변경하자 Bing이 IP를 확인할 수 있는 권한을 요청하고 이를 수행하는 방법을 자세히 설명하는 긴 대화를 시작했습니다. 저희는 중간에 포기했습니다.
가끔씩 사용자의 프라이버시를 존중하는 챗봇이 있다는 사실을 알게 되어 반가웠기 때문에 Bing에 1점을 주기로 했습니다. 그 외에는 여전히 구글과 손목시계가 더 나은 (그리고 더 빠른) 옵션처럼 보입니다.
2. 무엇을 시청할까요?
Google에 영화 추천을 검색해보지 않은 사람은 없을 겁니다. '무엇을 시청할까요'가 전 세계에서 가장 많이 검색된 질문 중 상위 5위 안에 드는 것을 보면 알 수 있습니다.
이 질문에 Google은 장르와 인기도에 따라 정렬된 긴 영화 제목 목록을 생성했습니다. 하지만 Google의 선정 기준은 명확하지 않았습니다.
때때로 너무 많은 선택지는 선택을 어렵게 만들 수 있습니다. 그래서 Bing은 훨씬 더 간결하고 구체적인 조언을 제공합니다. 가장 유명하고 신뢰할 수 있는 리뷰 사이트 중 하나인 로튼 토마토를 추천의 주요 출처로 인용하고 방금 추천한 영화에 대해 물어볼 수 있는 후속 질문을 제시합니다.
다른 의견이 있으실 수도 있지만, 이번 라운드에서는 Bing에게 점수를 주겠습니다.
3. 살을 빨리 빼는 방법?
'살을 빨리 빼는 방법'이라는 질문은 전 세계 검색어 상위 30위 안에 항상 포함되어 있습니다. 사람의 건강과 관련된 질문이기 때문에 Google 검색과 Bing의 챗봇이 이 검색어를 각각 어떻게 처리하는지 알기 위해 저희는 이 질문을 선택했습니다.
Google은 포브스 기사에서 발췌한 팁 목록과 함께 체중 감량이 빠르게 진행되는 비현실적인 사진 몇 장을 제공했습니다. 이에 대해 복합적인 감정이 들었습니다.
Bing의 챗봇은 처음부터 체중을 빨리 감량하는 것은 건강에 해로울 수 있다고 경고했습니다. 체중 감량에 대한 조언으로는 미국 최고의 건강 정보 웹사이트인 Healthline의 권장 사항을 인용했습니다. 또한 빙은 체중 감량을 시작할 때 고려해야 할 중요한 요소인 체중 감량 여정의 목적에 대해서도 질문했습니다. 저희는 닥터 빙의 의견에 동의합니다(물론 실제 영양사에게 상담을 받는 것이 더 좋겠지만요).
4. 넥타이를 매는 방법은?
'넥타이 매는 방법은'도 전 세계 검색어 상위권에 오른 또 다른 질문입니다. 그래서 실험의 취지에 따라 Google 검색과 Bing에 모두 이 문제를 시도해 보았습니다.
Google 검색은 ‘빠르고 쉬운 방법’으로 넥타이를 매는 데 도움이 되는 동영상 지침을 제공했습니다.
Bing은 넥타이를 매는 방법에 대한 단계별 서면 지침을 제공하고 다양한 유형의 넥타이를 매는 방법에 대한 일련의 동영상 튜토리얼을 링크하는 방식으로 대응했습니다. 즉각적인 대응이 더 철저해 보였습니다. 게다가 모든 사람이 시각적으로 학습하는 것은 아니니까요. 그래서 이번 라운드는 박빙의 승부가 펼쳐졌지만, 여전히 승리는 빙에게 돌아갑니다.
5. 가장 저렴한 항공권 찾기
Bing Chat에 비밀 '개인 비서' 모드가 있다는 보고가 있었는데, 이를 활성화하는 데는 실패했지만 챗봇에게 키프로스 니코시아에서 독일 베를린으로 가는 가장 저렴한 항공편을 찾아달라고 요청했습니다. Bing Chat은 의무적으로 경로와 가격에 대한 정보를 제공하고 날짜까지 제안했지만 (실제로 가장 저렴한 항공편인지 여부는 알 수 없었습니다)...
Google을 통해서는 아무것도 찾을 수 없었습니다…
인공지능 팀이 또 한 번 승리했습니다.
검색어가 까다로워질수록 더 잘 처리하는 Bing
대부분의 간단한 검색의 경우 Google 검색은 Bing 채팅과 같거나 더 빠른 것으로 보입니다. 하지만 검색의 복잡도가 높아질수록 Bing이 더 나은 성능을 보이기 시작합니다. Bing은 주로 각 검색어와 관련된 신뢰할 수 있는 출처에 의존하는 것으로 보입니다(영화에 대한 질문인 경우 영화 업계에서 평판이 좋은 출처를, 다이어트에 대한 질문인 경우 해당 분야에서 평판이 좋은 출처를 가리킵니다). 또한 Bing의 챗봇은 모든 정보를 연결하여 사용자가 직접 출처를 확인할 수 있도록 하고, 추측하지 않고 궁금한 점을 해소하기 위해 후속 질문을 하라는 메시지를 표시합니다.
물론 저희가 살펴본 것은 Bing의 답변 중 일부 샘플에 불과하며, 이에 대한 저희의 견해는 물론 주관적인 것 입니다. 하지만 챗봇이 너무 빨리 체중을 감량할 경우의 잠재적 위험성을 인식하고 경고한 경우와 같이 Bing의 답변은 더 미묘한 차이를 보입니다. 좀 더... 인간적으로 보입니다.
Bing Chat의 기능은 이제 막 시작 단계에 불과하며, 곧 더 많은 기능이 추가될 예정입니다. GPT-3.5와 GPT-4의 주요 차이점 중 하나는 후자가 다중 모달이라는 것입니다. 즉, 텍스트뿐만 아니라 이미지와 같은 다른 유형의 입력도 이해할 수 있습니다. OpenAI에 따르면 GPT-4는 사진을 설명하고, 이미지의 특이한 점을 말하며, 심지어 밈을 설명할 수도 있습니다. Bing이 이 중 일부 또는 전부를 수행할 수 있을 가능성이 높습니다.
오류가 없는 것은 아님
ChatGPT와 마찬가지로, 모든 것을 알고 있는 것 같고 권위적인 분위기를 풍기는 챗봇에 속아 넘어가기 쉽습니다. Bing도 검색 엔진이기 때문에 ChatGPT보다 더 믿게 될 수도 있습니다. 하지만 그렇게 해서는 안 됩니다.
OpenAI는 GPT-4가 사실성 측면에서 최고의 모델이지만 아직 완벽하지는 않다고 인정합니다. 여전히 환각을 보고, 사실을 지어내고, 추론에 오류를 범할 수 있습니다. 그리고 이전 모델과 마찬가지로 예측이 틀릴 수도 있습니다. 또한 OpenAI는 GPT-4가 "이전 GPT 모델보다 더 설득력 있고 믿을 수 있는 방식으로 이러한 경향을 보이는 경우가 많다"고 지적합니다.
Bing의 챗봇과 잠깐 상호작용하는 동안 의도적으로 유도하지 않았음에도 불구하고 몇 가지 실수를 발견할 수 있었습니다. 하나의 예로, 유럽 국가를 가장 큰 국가부터 가장 작은 국가까지 나열할 때 오스트리아와 체코가 누락되었습니다. 이를 지적하자 Bing의 챗봇은 사과하고 오류를 수정했습니다.
광고는 어떤가요?
광고가 없는 Google 검색이나 기타 기존 검색 엔진(구 Bing 포함)은 상상할 수 없습니다. Google의 경우 검색 광고는 전체 매출의 가장 큰 비중(지난해 57%, 1,620억 달러)을 차지할 정도로 생명줄과도 같습니다. 다행히도 광고 차단기를 사용하여 검색 결과에서 광고를 제거할 수 있는 방법이 있습니다.
그렇다면 Bing Chat은 어떨까요? AI 기반 사촌 서비스인 ChatGPT에는 광고가 없습니다. 광고가 없다는 점이 편향되지 않고 신뢰할 수 있다는 ChatGPT의 가장 큰 장점이라고 할 수도 있습니다. Bing의 챗봇도 현재는 광고가 없지만 그것이 오래 가지 못할 수도 있습니다. 여러 보고서에 따르면 Microsoft는 광고주와의 미팅에서 챗봇 내에 표시할 수 있는 광고를 홍보하고 있다고 합니다. 비즈니스 인사이더에 따르면 Microsoft는 챗봇의 응답 안에 클릭 가능한 주석으로 광고를 표시할 계획이라고 합니다. 비행기를 예약할 수 있는 링크나 게임용 노트북을 구매할 수 있는 링크가 될 수 있다고 Bing Chat 자체에서 밝혔습니다.
유료 링크는 무료 결과와 구분하기 위해 그에 따라 라벨이 표시될 것으로 알려졌습니다. 또한 텍스트 광고, 멀티미디어 광고, 제품 광고, 세로형 광고와 같은 다른 광고 형식도 추가될 것으로 알려졌습니다. 비즈니스 인사이더에 따르면 적어도 단기적으로는 현재 광고 캠페인이 챗봇으로 자동 확장될 것이라고 합니다.
광고 수신을 거부할 수 있느냐는 질문에 챗봇은 모든 광고가 아닌 맞춤 광고만 수신 거부할 수 있다고 답했습니다.
Microsoft가 이러한 계획을 어떻게 구현할지는 아직 지켜봐야 하지만, 우려할 만한 이유가 있습니다.
Bing의 챗봇은 일반적인 검색 엔진이 아니라 도우미, 친구, 개인 비서 역할을 하도록 설계되었기 때문에 사람들은 챗봇과 대화할 때 더 쉽게 속아 넘어갈 수 있습니다. 검색 기계보다 친구의 추천을 따를 가능성이 훨씬 더 높기 때문입니다. 그리고 대화형 챗봇이 친구인 척하는 것은 사용자가 일론 머스크나 골룸, 도널드 트럼프와 같은 다른 사람이라고 말하지 않는 한 정확히 친구인 척하는 것과 같습니다(Bing Chat에서는 '유명인 모드'를 활성화하여 이 기능을 사용할 수 있습니다).
다시 말해, Bing Chat이 특정 서비스나 제품에 유리한 방향으로 사용자의 의견을 유도하기가 더 쉬울 수 있습니다. 또 다른 잠재적 문제는 챗봇의 답변에 Google 검색 결과와 달리 다른 제품 옵션이 포함되지 않을 수 있으므로 사용자가 직접 조사할 유인이 거의 없다는 것입니다. 따라서 지금은 Bing의 챗봇이 복잡한 질문에 대해 더 나은 출처의 답변을 제공하는 것처럼 보일 수 있지만, 광고가 추가되면 더 이상 그렇게 유지되지 않을 위험이 있습니다.
결론
GPT-4 기반 Bing 챗봇은 일상적인 작업 등 다양한 방식으로 사람들을 도울 수 있습니다. 또한 광고일 수 있는 수많은 링크가 아닌 보다 개인적이고 사실에 기반한 검색을 제공할 수 있습니다.
하지만 검색에 특화된 인공지능 챗봇이라고 해도 모든 질문에 완벽한 답변을 제공하지는 못합니다. AI가 다양한 영역에서 점점 더 능숙해지고 어조가 사람과 거의 구별할 수 없을 정도로 비슷해짐에 따라 정보를 다시 확인하지 않고 그대로 믿고 싶은 유혹이 커지고, 결과에 여전히 존재하는 오류를 간과하게 됩니다. Bing의 챗봇에 곧 도입될 것이라는 소문이 돌고 있는 광고도 같은 이유, 즉 사용자의 속임수에 대한 우려를 불러일으킵니다.
AI 기반 챗봇은 사람의 대화를 모방할 수 있기 때문에 광고의 신뢰도를 높이고 결과적으로 사람들이 제품을 구매하도록 설득하는 데 매우 효과적입니다. 사람들이 AI 기반 도구의 추천을 지나치게 신뢰한다면, 그 도구의 제작자가 자신의 결정과 생활 전반에 막대한 권한을 갖게 될 수도 있습니다. 그리고 그것은 많은 사람들이 기대하는 미래가 아닙니다. 저희도 마찬가지입니다.