오픈 에이아이(Open AI)가 2022년 11월 30일 공개한 대화 전문 인공지능 챗봇으로, Open AI에서 만든 대규모 인공지능 모델인 ‘GPT-3.5’ 언어 기술을 기반으로 한다. 출처: 게티이미지 코리아
오픈에이아이(OpenAI, openai.com)가 개발한 대화 전문 인공지능 챗봇으로, 챗은 채팅의 줄임말이고 GPT는 'Generated Pre-trained Transformer'의 앞 글자를 딴 것이다. 챗GPT는 사용자가 대화창에 텍스트를 입력하면 그에 맞춰 대화를 함께 나누는 서비스로, 공개 단 5일 만에 하루 이용자가 100만 명을 돌파하면서 돌풍을 일으키기 시작했다. 특히 질문에 대한 답변은 물론 논문 작성, 번역, 노래 작사·작곡, 코딩 작업 등 광범위한 분야의 업무 수행까지 가능하다는 점에서 기존 AI와는 확연히 다른 면모를 보이고 있다.
챗GPT의 제작사 오픈AI는 일론 머스크 테슬라 CEO, 샘 올트먼 와이컴비네이터 사장(현 오픈AI CEO) 등이 인류에게 도움이 될 디지털 지능 개발을 목표로 2015년 설립한 비영리 법인이다. 그러다 2019년 영리 추구를 위한 자회사를 추가 설립하면서 AI 사업을 본격화했는데, 그동안 ▷인공지능 언어모델 ‘지피티-3’(GPT-3) ▷그림을 그리는 인공지능 ‘달리2’(DALL-E2)
▷다국어 음성인식 인공지능 ‘위스퍼(Whisper)’ 등을 선보여 왔다. 특히 언어에 특화된 인공지능인 GPT의 경우 2018년 GPT-1 출시 이후 2019년 GPT-2, 2020년 GPT-3에 이르기까지 버전을 높여 왔으며, 2022년 11월에는 GPT-3.5에 해당하는 챗GPT를 공개하면서 화제의 중심에 섰다. GPT 성능은 매개변수(파라미터) 개수가 중요한데, GPT-3는 GPT-1보다 1500배 많은 매개변수(1750억 개)를 활용한 것이다.
챗GPT는 이 GPT-3에 강화학습을 적용해 더욱 업그레이드한 GPT-3.5를 기반으로 개발됐는데, 오픈AI는 2023년 인간의 시냅스 수와 비슷한 수준의 100조 개 매개변수를 갖춘 GPT-4를 내놓는다는 계획이다.
한편, 오픈AI 설립자 머스크는 2018년 오픈AI 이사회에서 전격 사임했으며, 이때 보유하고 있던 지분도 마이크로소프트(MS)에 매각한 것으로 알려졌다. MS는 2019년 오픈AI에 10억 달러(1조 2000억 원)를 투자했고, 2023년 1월에는 100억 달러(12조 원)로 추정되는 금액을 추가 투자한다고 발표했는데 이렇게 될 경우 오픈AI의 MS 지분은 49%에 이르게 된다.
특징과 역할
챗GPT는 인간과 비슷한 대화를 생성해 내기 위해 수백만 개의 웹페이지로 구성된 방대한 데이터베이스에서 사전 훈련된 대량 생성 변환기를 사용하고 있다. 이는 사람의 피드백을 활용한 강화학습(Reinforcement Learning)을 사용해 인간과 자연스러운 대화를 나누고 질문에 대한 답변도 제공한다.
대화의 주제는 지식정보 전달은 물론 창의적 아이디어에 대한 답변 및 기술적 문제의 해결방안 제시 등 매우 광범위하다. 또 대화의 숨은 맥락을 이해하거나 이전의 질문 내용이나 대화까지 기억해 답변에 활용하는 등 기존의 챗봇과는 확연한 차이를 보이고 있다.
무엇보다 오픈AI는 챗봇의 차별·혐오 발언을 차단하기 위해 챗GPT에 AI 기반 조정 시스템인 ‘모더레이션API’(Moderation API)를 사용했다. 이에 챗GPT는 허용되지 않는 내용의 질문이 나올 경우 ‘차별적· 공격적이거나 부적절한 질문, 여기에는 인종차별적, 성차별적, 동성애 혐오적, 성전환자 혐오적 또는 기타 차별적이거나 혐오스러운 질문이 포함됩니다’라고 답변한다. 다만 챗GPT는 가끔 잘못되거나 편향적인 정보를 제공할 수 있으며, 2021년 이후의 지식은 제한돼 있다는 한계도 있다.
챗GPT 월 사용자 1억 명 돌파-유료버전 출시
투자은행 UBS는 2023년 2월 1일 보고서를 통해 챗GPT가 2023년 1월 월간 활성 사용자 수(MAU) 1억 명을 돌파한 것으로 추정된다고 밝혔다. MAU는 월 단위로 한 번이라도 접속한 사람 수로, 1억 명 돌파는 오픈AI가 챗GPT를 출시한 지 단 2개월 만에 나온 기록이다. 또 이 기록은 다른 소셜네트워크서비스(SNS)보다 훨씬 빠른 것으로, UBS 보고서에 따르면 1억 MAU 달성에 든 기간은 ▷우버 70개월 ▷스포티파이 55개월 ▷인스타그램 30개월 ▷틱톡 9개월이었다.
이와 함께 챗GPT 개발사인 오픈 AI는 2023년 2월 1일 챗GPT 유료버전인 '챗GPT 플러스(ChatGPT Plus)'를 출시한다고 밝혔다. 이용 요금은 월 20달러(약 2만 4400원). 오픈AI에 따르면 챗GPT 플러스를 통해 사용자들이 챗봇에 24시간 접근할 수 있고 더 빠른 응답과 새로운 부가 기능 등을 경험할 수 있다. 현재 제공되고 있는 무료 버전 서비스 역시 계속되는데, 다만 사용이 몰리는 시간에는 접속자 수가 제한된다. 유료 버전은 미국에서만 가입할 수 있으며 향후 다른 국가 및 지역으로 서비스를 확대할 예정이다.
챗GPT 출시 이후 화제와 논란들
2022년 11월 공개된 챗GPT는 출시 일주일 만에 사용자가 100만 명을 넘기는 등 획기적 성능으로 화제를 모으면서 큰 주목을 받았다. 이에 정보기술(IT) 업계에서는 챗GPT가 ▷웹 브라우저(1994년) ▷구글 검색엔진(1998년) ▷아이폰(2007년)에 이은 게임 체인저가 될 수 있다는 전망까지 나온다. 특히 현재 글로벌 검색시장을 주도하고 있는 구글에 위협이 될 것이라는 전망이 높은데,
2022년 말 영국 《인디펜던트》는 'Google is done(구글은 끝났다)'는 제목의 기사를 통해 챗GPT로 대표되는 대화형 인공지능 검색이 구글을 대체할 수 있다는 보도를 내놓기도 했다. 이에 위기감이 높아진 구글은 2023년 2월 6일 챗GPT 대항마로 대화형 AI 서비스 '바드(Bard)' 출시를 공식화했다. 그런데 다음 날인 2월 7일에는 마이크로소프트(MS)가 자사의 검색 엔진 빙(Bing)에 챗GPT 기반 언어모델을 장착했다고 발표하면서 생성 AI와 결합한 검색시장 주도권을 차지하기 위한 글로벌 경쟁이 본격화됐다는 분석이 제기됐다.
챗GPT를 둘러싼 교육계 논쟁들
챗GPT는 공개 이후 특히 교육·연구 분야에서 뜨거운 논쟁을 일으키고 있는데, 이는 챗GPT가 기존 챗봇과 달리 방대한 양의 전문 지식을 담은 에세이와 논문을 순식간에 써내려가는 능력을 갖춘 것이 확인된 데 따른 것이다. 실제로 미국의 교육 현장에서는 학생들이 챗GPT가 작성한 글을 숙제로 제출하는 일이 속출했고, 이에 뉴욕과 시애틀의 공립학교에서는 교내 와이파이망과 컴퓨터를 통한 챗GPT 접속을 차단하는 조치를 내리기도 했다.
또 미국 일부 대학에서도 챗GPT로 작성된 에세이를 제출한 사례가 적발됐으며, 이에 일부 대학에서는 AI를 이용할 수 없는 구술시험 및 그룹 평가를 늘리고 학내 규정에 'AI를 활용한 표절'을 포함시킨다는 방침이다. 여기에 미국 노스웨스턴대 연구진은 2022년 12월 27일 논문 사전공개 사이트인 바이오아카이브(bioRvix)에 챗GPT로 작성한 의학 논문 초록 50편이 표절 검사 프로그램을 모두 통과하고 의학 전문가들마저 제출된 초록의 32%를 걸러내지 못했다는 연구 결과를 내놓기도 했다.
이에 미국 일부 대학들에서는 챗GPT가 쓴 글인지를 식별하기 위한 제로GPT·디텍트GPT 등의 탐지 서비스를 내놓았으며, 챗GPT 제작사인 오픈AI도 2023년 1월 31일 챗GPT로 작성한 글인지 아닌지를 구별하는 툴을 자사 블로그를 통해 공개했다. 다만 오픈 AI는 해당 시스템이 모든 AI가 작성한 텍스트를 확실하게 판별하는 것은 불가능하다며 그 한계를 인정했다.
챗GPT, MBA·로스쿨·의사면허까지 통과
챗GPT는 미국의 명문 경영전문대학원(MBA)인 펜실베이니아대의 와튼스쿨에서 치러진 필수 과목(운영관리)의 기말시험에서 평균 이상인 B-에서 B 사이의 성적을 받은 것으로 알려졌다. 또 미국 미네소타주립대 로스쿨 시험에서는 C+ 점수를 받으며 과목을 수료할 수 있는 성적을 거뒀고, 캘리포니아 마운틴뷰의 의료기관인 앤서블헬스 연구진이 챗GPT를 대상으로 실시한 미국 의사면허시험에서 50% 이상의 정확도를 기록했다. 이처럼 챗GPT가 MBA·로스쿨·의사면허시험까지 통과하면서 화이트칼라 일자리 분야에도 충격을 일으킬 것이라는 전망이 나오기도 했다.
생성 AI를 둘러싼 논란들
챗GPT가 돌풍을 일으키면서 '생성(Generative) AI'가 주목을 받고 있는데, 생성 AI는 기계 스스로 학습한 알고리즘으로 글·이미지·영상 등을 이용자가 원하는 형태로 생성해 내는 기술을 일컫는다. 기존 AI가 데이터와 패턴을 학습해서 대상을 이해하는 것이라면 생성 AI는 기존 데이터와의 비교 학습을 통해 새로운 콘텐츠를 탄생시키는 특성 때문에 '초거대 AI'라고도 불린다.
생성 AI는 챗GPT 출시로 큰 화제를 모으고 있으나, 이미 챗GPT 이전에 그림·음악을 창작하는 생성 AI가 비약적 발전을 거듭해 오고 있었다. 대표적으로 ▷오픈AI가 개발한 '달리2' ▷미드저니 AI연구소의 '미드저니' ▷스테빌리티AI 의 '스테이블 디퓨전'이 이에 해당한다. 이 가운데 미드저니가 만들어낸 작품은 2022년 9월 미국에서 열린 미술전에서 디지털 아트 부문 1위를 차지하면서 큰 논쟁을 일으킨 바 있다.
미드저니가 그린 기계 비둘기
그러나 생성 AI는 이미 만들어진 수없이 많은 기존 창작물을 학습한 뒤 이를 통해 결과물을 만들어낸다는 점에서 저작권 침해 논란에 직면해 있다. 또 AI가 생성한 글을 통해 거짓 정보가 교류될 수 있다는 점도 주요 논쟁이 되고 있는데, 이는 AI가 학습한 기존의 데이터에 잘못된 내용이 섞여 있을 수 있기 때문이다. 아울러 사용자가 챗GPT에 프로그램의 보안 취약점을 묻거나 여러 생성 AI의 기능을 조합해 악성 웹사이트을 제작하는 등 범죄에 악용할 우려도 있어 이에 대한 대책 마련도 요구되고 있다.
챗GPT 충격, 글로벌 빅테크 업계들의 대응은?
구글, GPT의 등장은 정보기술(IT) 업계에 커다란 변화를 일으키고 있는데, 특히 현재 글로벌 검색시장을 주도하고 있는 구글에 위협이 될 것이라는 전망이 높다. 구글은 2023년 2월 6일 챗GPT 대항마로 대화형 AI 서비스인 '바드(Bard)' 출시를 공식화했다.
바드는 구글의 초거대 언어 모델인 '람다(LaMDA·Language Model for Dialogue Applications)'를 기반으로 하는데, 람다는 매개변수(파라미터)를 기반으로 30억 개에 달하는 문서와 11억 개의 대화를 학습한 것으로 알려졌다. 또 바드를 공개하기에 앞서 챗GPT 개발사인 오픈AI의 라이벌로 꼽히는 앤스로픽에 4억 달러를 투자하고, 이들이 개발한 챗봇 '클로드'를 구글 클라우드를 통해 공급한다는 방침을 내놓기도 했다.
마이크로소프트(MS)
챗GPT 개발사인 오픈AI에 총 100억 달러의 투자 계획을 발표하며 화제를 모은 마이크로소프트(MS)는 2월 7일 AI 기반의 새로운 검색엔진 '빙(Bing)'을 발표했다. 새로워진 빙은 검색을 위해 특별히 설계된 오픈 AI의 새 대형 언어모델 '프로메테우스'에서 실행되는데,
이 모델은 챗GPT와 GPT-3.5보다 더 정확하고 빠른 성능을 갖췄다. MS는 검색 엔진 빙과 함께 웹브라우저인 엣지에도 AI 기술이 탑재된다고 덧붙였다. MS는 앞서 2월 2일에는 챗GPT로 구동되는 업무용 메신저와 화상회의, 문서 공유 기능 등을 갖춘 기업용 협업 플랫폼 '팀즈 프리미엄'을 유료(월 7달러)로 판매한다고 밝힌 바 있다.
중국 바이두
중국 최대 포털사이트 바이두는 2월 7일 챗GPT와 유사한 '어니봇(Ernie Bot)'을 오는 3월 출시한다고 밝혔다. 바이두는 지난 2019년 언어 이해, 언어 생성, 텍스트-이미지 생성과 같은 광범위한 작업을 처리할 수 있는 초거대 언어모델 '어니'를 선보인 바 있다.
국내 IT기업들의 챗GPT 대응은?
카카오는 한국어 특화 AI 모델인 코GPT(KoGPT)를 활용한 서비스를 연내 선보일 계획을 밝혔는데, 카카오에 따르면 코GPT는 60억 개의 매개 변수와 2000억 개 토큰의 한국어 데이터를 학습해 한국어를 사전적·문맥적으로 이해할 수 있는 역량을 보유했다. 카카오는 이러한 코GPT 역량을 활용해 개인화 비서 역할 및 광고 카피 작성 등을 할 수 있는 '버티컬 서비스'를 2023년 상반기에 내놓는다는 계획이다.
네이버의 경우 자체 개발한 초거대 AI '하이퍼클로바(HyperCLOVA)'를 다양한 용도로 활용 중인데, 2023년 상반기 챗GPT에 대응해 '서치GPT'를 선보이겠다고 밝혔다. 서치GPT는 하이퍼클로바를 기반으로 하는데, 하이퍼클로바는 국내 최초 한국어 특화 모델로 학습 매개변수 2040억 개 규모이다. 네이버는 하이퍼클로바를 기반으로 해 음성 텍스트 변환을 비롯해 ▷AI 안부전화 서비스 ▷네이버쇼핑 개인화 큐레이션 서비스 ▷클로바 스튜디오 등의 다양한 서비스를 선보인 바 있다. 네이버에 따르면 서치GPT는 챗GPT와 달리 더욱 고도화된 검색 경험을 제공하는 것을 목표로 삼고 있다.
(참고 사이트-영문) ChatGPT 더 알아보기ChatGPT: Optimizing Language Models for DialogueWe’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests. ChatGPT is a sibling model to InstructGPT, which is openai.com
출처 : [네이버 지식백과] ChatGPT(챗지피티) (시사상식사전, pmg 지식엔진연구소)