CHATGPT가 요즘 화제이다.
어떤 사람들은 구글의 시대는 가고 CHATGPT의 시대가 올것이라 한다.
CHATGPT가 도대체 뭐길래?
CHATGPT의 제작사는 Open AI라는 회사인데,
2022년 12월 1일 인공지능 CHATGPT를 공개했다.
기존의 챗봇과 차이점은 빅데이터 분석을 바탕으로 사람과 대화하듯 답을 해준다.
특히 CHATGPT는 대규모 인공지능 모델인 GPT-3.5 언어 기술을 사용했는데,
GPT(Generative Pre-Trained Transformer)는 어떤 텍스트가 주어졌을 때 다음 텍스트가 무엇인지 예측하며 글을 만든다.
구글 검색창에 단어 몇자를 치면 자동완성이 되거나 연관 검색어가 뜨는데,
이것또한 GPT기술이 활용된 예이다.
ChatGPT가 도대체 뭐지?
OpenAI 홈페이지에 들어가서 보니 ChatGPT를 다음과 같이 설명한다.
"우리는 대화 방식으로 상호 작용하는 ChatGPT라는 모델을 훈련시켰다. 대화 형식은 채팅 GPT가 후속 질문에 답하고, 실수를 인정하고, 잘못된 전제에 도전하고, 부적절한 요청을 거부하는 것을 가능하게 한다. ChatGPT는 InstructGPT의 형제 모델로, 프롬프트에서 명령을 따르고 자세한 응답을 제공하도록 훈련된다."
소개에서 볼 수 있듯이, ChatGPT는 대화 방식으로 상호 작용을 하는데, 이것이 사람과 대화하듯 문맥을 파악해서 적절한 대답을 해주는 키 포인트다. 특히 처음 질문한것과 그 이후 질문한 것에 대해 연장선상에서 답변을 이어가므로, ChatGPT가 기존 챗봇보다 성능이 좋아보이는 이유다.
그럼 ChatGPT는 어디에 활용이 가능할까?
1. 코딩을 짜주거나 코딩을 검사해줄 수 있다.
아래 예시는 사용자가 코드가 에러난다고 했고, 어떻게 고칠 수 있냐고 ChatGPT에 문의하며,
답변을 찾는 과정을 보여준다.
도대체 어떻게 이런게 가능할까?
ChatGPT는 Azure AI 슈퍼컴퓨팅 인프라에서 훈련이 되었는데, 훈련 방법은 아래와 같다.
1.시연 자료를 수집하고 감독 정책을 훈련
2. 비교 데이터를 수집하고 보상 모델을 훈련
3. PPO 강화 학습 알고리즘을 사용하여 보상 모델에 대한 정책을 최적화
(InstructGPT와 동일한 방법을 사용했지만 데이터 수집 설정에서 약간의 차이가 있는 RLHF(인간 피드백 강화 학습)를 사용하여 이 모델을 훈련시켰다고 한다.
인간 AI 트레이너는 사용자와 AI 선생님 양쪽 역할을 하는 대화를 제공했고, 트레이너에게 모델이 작성한 제안에 접근하여 답변을 구성하는 데 도움을 주게 만든다. 이 새로운 대화 데이터 세트를 대화 형식으로 변환한 InstructGPT 데이터 세트와 혼합했다.
강화학습에 대한 보상모형을 만들기 위해서는 질별로 순위를 매긴 2개 이상의 모형응답으로 구성된 비교자료를 수집할 필요가 있었다. 이 데이터를 수집하기 위해, 우리는 AI 트레이너들이 챗봇과 나눈 대화를 썻고, 무작위로 챗봇이 만든 샘플 모델을 선택하고 몇 가지 대체 완료를 샘플링한 후 AI 트레이너에게 순위를 매겼다. 이러한 보상 모델을 사용하여 근위 정책 최적화를 사용하여 모델을 미세 조정할 수 있다. 우리는 이 과정을 여러 번 반복했다.)
그럼 모두가 가장 궁금한 내용
어떻게 설치하는가?
1. 오른쪽 상단 점세개를 클릭하고, 도구더보기-> 확장프로그램 클릭
2. 확장프로그램 클릭후 가로로 3줄 클릭
3. 스크롤 다운하여 Chrome 웹스토어 열기
4. ChatGPT for Google 혹은 ChatGPT for Search Engines 설치
설치가 완료되면 크롬 오른쪽 상단에 아이콘이 나오게 된다.
그럼 이제 몇가지 실험을 해보자
영어로 먼저 질문을 해보겠다.
"how to import cosmetics form korea to canada"
어떻게 화장품을 한국에서 캐나다로 수입하는가? 를 검색했다.
구글 화면에서 바로치면, 옆에 ChatGPT의 의견이 나온다.
바로 팝업이 되는것은 아니고 약간의 로딩 시간이 있지만 못참을 정도는 아니다.
생각보다 퀄리티가 나쁘지 않다.
한글도 될까 궁금해서
"한국에서 미국으로 화장품 수출하는 방법"으로 바로 검색해보았다.
오!! 된다. 영어보다 약간 느리긴 하지만 작동한다.
사실 구글검색을 하면 양질의 검색 결과를 찾기 위해 시간이 다소 소요되는데,
AI가 이런 시간을 줄여줄 수 있을거 같다는 생각이 들었다.
그래도 OpenAI 홈페이지에서는 아래와 같은 한계를 말한다.
ChatGPT의 한계
(1) RL 훈련 중에는 현재 진실의 원천이 없다.(부정확한 경우가 있을 수 있음)
(2) 모델을 더 신중하게 훈련시키면 올바르게 대답할 수 있는 질문을 거부하게 된다.
(3) 지도 훈련은 모델이 알고 있는 것에 따라 이상적인 대답이 달라지기 때문에 모델을 잘못 인도한다 알고 있다.
ChatGPT는 입력 구문을 수정하거나 동일한 프롬프트를 여러 번 시도하는 데 민감합니다. 예를 들어, 질문의 한 표현이 주어지면 모델은 답을 모른다고 주장할 수 있지만 약간의 표현이 주어지면 정확하게 대답할 수 있다.
이 모델은 종종 지나치게 장황하고 오픈에 의해 훈련된 언어 모델이라고 다시 말하는 등 특정 문구를 과도하게 사용한다AI. 이러한 문제는 훈련 데이터의 편향(훈련자들이 더 포괄적으로 보이는 긴 답변을 선호함)과 잘 알려진 과도한 최적화 문제에서 발생한다.
내 개인적인 생각으론
아직 초기단계 버전인데 이정도 퀄리티면 충분히 괜찮고 경쟁력이 있는거 같다.
앞으로 종종 ChatGPT를 써먹을 생각이다.
앞으로가 더 기대되는 ChatGPT
나중에는 더 재미있는 걸로 테스트를 해봐야겠다.
'잡학' 카테고리의 다른 글
인공 장기와 이종 장기 이식 기술 (0) | 2023.01.26 |
---|---|
인공지능으로 그림 그리기 (0) | 2023.01.18 |
제임스 웹 우주망원경 사진 다운 방법 (0) | 2023.01.17 |