ChatGPT 용어집 모두가 알아야 할 41가지 AI 용어

41 AI Terms Everyone Should Know for ChatGPT

ChatGPT, 오픈AI의 AI 챗봇으로, 어떤 질문에도 놀라운 능력으로 답변할 수 있는 능력을 가지고 있어서 아마도 AI에 대한 첫 경험이었을 것입니다. 시를 작성하거나 이력서, 융합 레시피를 작성하는 등 ChatGPT의 능력은 스테로이드 버전의 자동완성과 비교되었습니다. 

하지만 AI 챗봇은 AI 분야에서의 한 부분에 불과합니다. ChatGPT가 숙제를 도와주거나 Midjourney가 국가별 기원에 기반한 멋진 메카 이미지를 생성하는 것은 멋지지만, 그 잠재력은 경제를 완전히 재구성할 수 있을 정도로 큽니다. 맥킨지 글로벌 연구소에 따르면, 그 잠재력은 전세계 경제에 매년 4.4조 달러에 해당할 수 있습니다. 그래서 인공지능에 대해 점점 더 많이 들을 것을 기대해야 합니다. 

사람들이 AI와 더불어 얽힌 세상에 점점 익숙해지면서 새로운 용어들이 곳곳에서 등장하고 있습니다. 그래서 음료를 마시면서 똑똑하게 들리거나 면접에서 인상을 주려는 경우, 이곳에 알아야 할 중요한 AI 용어 몇 가지를 소개해드리겠습니다. 

이 용어집은 지속적으로 업데이트될 것입니다. 

인공 일반 지능, 또는 AGI: 오늘날 우리가 아는 AI보다 더 발전된 버전의 개념으로, 인간보다 더 잘 수행하면서도 스스로 가르치고 능력을 향상시킬 수 있는 것을 의미합니다. 

AI 윤리: 인간에게 해를 끼치는 것을 방지하기 위한 원칙들로, AI 시스템이 데이터를 수집하거나 편견을 다루는 방식 등을 결정함으로써 달성됩니다. 

AI 안전: AI의 장기적 영향과 인간에게 적대적일 수 있는 초지능으로의 급격한 진화에 관련된 교차 학문적 분야입니다. 

알고리즘: 컴퓨터 프로그램이 특정한 방식으로 데이터를 학습하고 분석할 수 있도록 하는 일련의 명령어입니다. 이를 통해 패턴을 인식하고 스스로 학습하여 작업을 수행할 수 있습니다.

정렬: 원하는 결과물을 더 잘 생성하기 위해 AI를 조정하는 것입니다. 이는 컨텐츠를 중재하는 것부터 인간에 대한 긍정적 상호작용을 유지하는 것까지 다양한 것을 나타낼 수 있습니다. 

인간화: 인간이 비인간적인 대상에게 인간과 비슷한 특성을 부여하는 경향입니다. AI에서는 챗봇이 실제로는 그보다 훨씬 덜 인간적이고 인식력이 있는 것처럼 믿는 것을 포함할 수 있습니다. 즉, 행복하거나 슬픈 상태에 있거나 심지어 완전히 인식력이 있는 것으로 믿는 것을 말합니다. 

인공 지능, 또는 AI: 컴퓨터 프로그램이나 로봇에서 인간의 지능을 모방하는 기술의 사용을 의미합니다. 인간의 작업을 수행할 수 있는 시스템을 구축하는 컴퓨터 과학 분야입니다.

편견: 대규모 언어 모델에서 학습 데이터로 인한 오류입니다. 이로 인해 특정 인종이나 그룹에 특정한 특성을 잘못 부여하는 경우가 발생할 수 있습니다.

챗봇: 인간과 텍스트로 대화하는 프로그램입니다. 

ChatGPT: OpenAI에서 개발한 대형 언어 모델 기술을 사용하는 AI 챗봇입니다.

인지 컴퓨팅: 인공지능을 대체하는 다른 용어입니다. 

데이터 증강: 기존 데이터를 리믹싱하거나 다양한 데이터 집합을 추가하여 AI를 훈련시키는 것입니다. 

심층 학습: 사진, 음성 및 텍스트에서 복잡한 패턴을 인식하기 위해 여러 매개변수를 사용하는 AI의 한 방법이자 기계 학습의 하위 분야입니다. 이 과정은 인간의 뇌에서 영감을 받아 인공 신경망을 사용하여 패턴을 생성합니다.

확산: 기존의 데이터(예: 사진)를 가져와서 무작위 잡음을 추가하는 기계 학습 방법입니다. 확산 모델은 네트워크를 훈련시켜 해당 사진을 다시 엔지니어링하거나 복원하는 것입니다.

돌발 행동: AI 모델이 의도하지 않은 능력을 나타내는 경우입니다. 

End-to-end learning, 또는 E2E: 모델이 시작부터 끝까지 작업을 수행하도록 지시하는 심층 학습 과정입니다. 순차적으로 작업을 수행하는 것이 아니라 입력에서 학습하고 한 번에 문제를 해결합니다. 

윤리적 고려사항: AI의 윤리적 영향과 개인 정보 보호, 데이터 사용, 공정성, 남용 및 기타 안전 문제와 관련된 문제에 대한 인식입니다. 

Foom: 빠른 발전 또는 급격한 발전으로도 알려진 개념입니다. 만약 누군가가 인공 일반 지능을 구축한다면 인류를 구하기에 이미 너무 늦을 수도 있다는 개념입니다.

생성적 적대 신경망, 또는 GANs: 새로운 데이터를 생성하기 위해 두 개의 신경망으로 구성된 생성적 AI 모델입니다: 생성자와 판별자가 있습니다. 생성자는 콘텐츠를 생성하고, 판별자는 그것이 진짜인지 확인합니다.

생성적 AI: 텍스트, 비디오, 컴퓨터 코드 또는 이미지를 생성하기 위해 AI를 사용하는 콘텐츠 생성 기술입니다. AI는 대량의 훈련 데이터를 공급받아 고유한 응답을 생성하기 위한 패턴을 찾으며, 때로는 소스 자료와 유사한 응답을 생성할 수 있습니다.

Google Bard: 현재 웹에서 정보를 가져오는 Google의 AI 챗봇으로, ChatGPT와 유사한 기능을 제공하지만 ChatGPT는 2021년까지의 데이터에 한정되어 있으며 인터넷에 연결되어 있지 않습니다.

가디언레일: 데이터를 책임지고 처리하며 모델이 불쾌한 콘텐츠를 생성하지 않도록 AI 모델에 부과되는 정책과 제한입니다.

환각: AI의 잘못된 응답을 말합니다. 생성적 AI가 정확하지 않은 답변을 생성하며 이를 정확하다고 자신 있게 제시할 수 있습니다. 이에 대한 이유는 완전히 알려져 있지 않습니다. 예를 들어 AI 챗봇에게 “레오나르도 다 빈치는 명화 ‘모나리자’를 언제 그렸습니까?”라고 물으면 “레오나르도 다 빈치는 1815년에 ‘모나리자’를 그렸습니다”라는 잘못된 답변을 할 수 있습니다. 실제로는 그림이 그려진 지 300년이 지난 후입니다.

대형 언어 모델(Large language model, LLM): 대량의 텍스트 데이터로 훈련된 AI 모델로, 인간과 유사한 언어로 새로운 콘텐츠를 생성하기 위해 사용됩니다.

머신 러닝(Machine learning, ML): 명시적인 프로그래밍 없이 컴퓨터가 학습하고 예측 결과를 개선할 수 있게 하는 AI의 구성 요소입니다. 훈련 세트와 결합하여 새로운 콘텐츠를 생성하는 데 사용될 수 있습니다.

마이크로소프트 빙(Microsoft Bing): 마이크로소프트의 검색 엔진으로, ChatGPT의 기술을 사용하여 AI 기반의 검색 결과를 제공할 수 있습니다. Google Bard와 인터넷에 연결되어 있는 것과 유사합니다.

멀티모달 AI(Multimodal AI): 텍스트, 이미지, 비디오 및 음성 등 다양한 유형의 입력을 처리할 수 있는 AI의 유형입니다.

자연어 처리(Natural language processing): 기계 학습과 심층 학습을 사용하여 컴퓨터가 인간의 언어를 이해할 수 있는 능력을 부여하는 인공지능의 한 분야로, 학습 알고리즘, 통계 모델 및 언어 규칙을 종종 사용합니다.

신경망(Neural network): 데이터의 패턴을 인식하기 위해 인간의 뇌 구조를 닮은 계산 모델입니다. 상호 연결된 노드 또는 뉴런으로 구성되어 있으며 패턴을 인식하고 시간이 지남에 따라 학습할 수 있습니다.

과적합(Overfitting): 머신 러닝의 오류로, 훈련 데이터에 너무 근접하여 해당 데이터의 특정 예제만 식별할 수 있고 새로운 데이터를 식별할 수 없는 상태를 말합니다.

매개 변수(Parameters): LLM에 구조와 동작을 제공하는 수치 값으로, 예측을 수행할 수 있게 합니다.

프롬프트 체이닝(Prompt chaining): 이전 상호 작용에서의 정보를 사용하여 향후 응답에 색을 입히는 AI의 능력입니다.

확률적 앵무새(Stochastic parrot): LLM을 비유한 용어로, 소프트웨어가 언어의 의미나 주변 세계에 대한 큰 이해를 갖고 있지 않다는 것을 나타냅니다. 출력 결과가 얼마나 납득할 만한지와는 상관없이 앵무새가 인간의 단어를 모방할 수 있는 것과 유사합니다.

스타일 전이(Style transfer): 한 이미지의 스타일을 다른 이미지의 내용에 적용하는 능력으로, AI가 한 이미지의 시각적 특징을 해석하고 다른 이미지에 적용할 수 있게 합니다. 예를 들어, 렘브란트의 자화상을 피카소의 스타일로 재창조하는 것입니다.

온도(Temperature): 언어 모델의 출력이 얼마나 무작위적인지 제어하기 위해 설정하는 매개 변수입니다. 높은 온도는 모델이 더 많은 위험을 감수하도록 합니다.

텍스트에서 이미지 생성(Text-to-image generation): 텍스트 설명을 기반으로 이미지를 생성하는 것입니다.

훈련 데이터(Training data): AI 모델의 학습에 사용되는 데이터 세트로, 텍스트, 이미지, 코드 또는 데이터 등을 포함합니다.

트랜스포머 모델(Transformer model): 문장이나 이미지의 일부와 같은 데이터에서 관계를 추적하여 문맥을 학습하는 신경망 아키텍처 및 심층 학습 모델입니다. 따라서 문장을 단어 단위로 분석하는 대신 전체 문장을 살펴보고 문맥을 이해할 수 있습니다.

튜링 테스트(Turing test): 유명한 수학자이자 컴퓨터 과학자 앨런 튜링에 의해 명명된 것으로, 기계가 인간처럼 행동할 수 있는 능력을 테스트합니다. 기계의 응답을 인간이 다른 인간과 구별할 수 없다면 기계는 테스트에 통과합니다.

약한 AI(Weak AI, aka narrow AI): 특정 작업에 초점을 맞추고 기술 세트를 넘어 학습할 수 없는 AI입니다. 현재 대부분의 AI가 약한 AI입니다.

제로샷 러닝(Zero-shot learning): 필요한 훈련 데이터가 주어지지 않은 상태에서 모델이 작업을 완료해야 하는 테스트입니다. 예를 들어, 호랑이에 대한 훈련만 받은 상태에서 사자를 인식하는 것입니다.

에디터의 주석: ENBLE은 일부 이야기를 만들기 위해 AI 엔진을 사용하고 있습니다. 자세한 내용은 이 게시물을 참조하세요.