인공지능 기술이 발달하면서 인공지능이 할 수 있는 일이 점점 더 다양해지고 있습니다. 이전에는 사람만이 할 수 있던 일을 인공지능이 사람을 도와주거나 대신해주기도 합니다. 복잡한 계산을 하거나 바둑을 두는 일은 인공지능이 사람보다 정확하고 빠르게 할 수 있습니다. 하지만, 친구의 기분을 파악하거나 앞으로 일어날 상황을 파악하고 책을 읽고 느낀 것을 표현하는 일은 사람이 할 수 있는 일입니다. 인공지능이 잘하는 것과 사람이 잘 하는 것은 무엇일까요? 오늘은 인공지능에 대해서 살펴보고, 인공지능이 그림을 어떻게 인식하고 이해하여 표현해주는지 살펴볼게요.
인공지능이란?
인공지능(Artificial Intelligence, AI)은 인간의 지능을 모방하여 컴퓨터가 학습, 추론, 문제 해결, 인식, 언어 이해 등 인간 고유의 인지 능력을 수행할 수 있도록 하는 기술 또는 그러한 시스템을 의미합니다. 단순히 미리 정해진 규칙에 따라 작동하는 것이 아니라, 방대한 데이터를 학습하고 분석하여 스스로 판단하고 예측하며, 새로운 상황에 적응하는 능력을 갖추는 것을 목표로 합니다. 인공지능이라는 용어는 1956년 다트머스 학회에서 처음 등장했지만, 그 개념적 기원은 훨씬 이전으로 거슬러 올라갑니다. 고대 그리스 신화에 등장하는 자동 기계 장치나, 19세기 찰스 배비지의 해석 기관 등 인간의 지능을 기계로 구현하려는 시도는 꾸준히 이어져 왔습니다. 20세기 중반, 컴퓨터 과학의 발달과 함께 인공지능 연구는 본격적인 궤도에 오르기 시작했습니다.
인공지능은 그림을 어떻게 인식할까?
미술 시간에 사물을 그려본 경험이 있나요? 사물을 그릴때 어떤것을 보나요? 우리는 사물을 그리기 위해서 사물의 모양과 색을 관찰합니다. 그렇다면 인공지능은 그림을 어떻게 보고 이해할까요? 인공지능은 그림을 수많은 네모 칸으로 나누고 칸에 있는 숫자의 규칙을 통해 그림을 이해합니다. 즉 숫자를 읽어서 그림을 본다고 할 수 있습니다. 이때 사물의 모양이나 상태를 컴퓨터가 이해할 수 있는 형태로 바꾼것을 데이터라고 합니다.
생성형 AI란 무엇일까?
생성형 AI를 정확하게 이해하기 위해서는 이 기술이 등장하기 전까지 AI 발전 과정이라고 할 수 있는 상위 개념들을 살펴볼 필요가 있다. 가장 먼저 인공지능 개념이 등장했다. 인공지능(AI, Artificial Intelligence)은 말 그대로 인공지능, 즉 인간의 지능을 통해서 수행되는 행위들을 컴퓨터나 기계가 할 수 있도록 만드는 기술을 의미한다. 그리고 이후 명시적 규칙 없이 컴퓨터가 데이터를 기반으로 학습하고 데이터에서 찾은 패턴을 기반으로 결과물을 처리하는, 더 능동적인 개념의 AI 기술인 머신러닝 개념이 등장했다. 이들은 이미 1940년대부터 꾸준히 논의되며 개발되어 왔다.
그리고 이 구체적으로 체감할 수 있는 성공한 혁신 제품이나 서비스가 아직 없기 때문이다. 아이폰발 파괴적 혁신을 기억해보면, 3G 기반 모바일 기술과 터치스크린 기술은 이미 그보다 일찍 등장했지만 이 기술들은 아이폰과 앱스토어 서비스가 등장하며 비로소 전 세계 비즈니스에 변화를 증폭시킬 수 있었다. 직관적으로 체험 가능한 UI(User Interface)와 앱스토어라는 구체적인 프론트엔드 서비스(Front-endService)가 있었기에 가능했던 것이다. 따라서 ChatGPT라는 프론트엔드 서비스를 통해 대중이 서비스의 유용성을 직접 체감할 수 있게 된 생성형 AI는 아이폰발 모바일 혁신 때와 유사함을 띠고 있으며, 전 세계 비즈니스 생태계에 큰 변화를 촉진하는 파괴적 혁신을 준비하고 있다고 볼 수 있다.
생성형 AI란 이용자의 특정 요구에 따라 결과를 능동적으로 생성해 내는 인공지능 기술을 의미한다. 기존까지의 딥러닝 기반 AI 기술이 단순히 기존 데이터를 기반으로 예측하거나 분류하는 정도였다면, 생성형 AI는 이용자가 요구한 질문이나 과제를 해결하기 위해 스스로 데이터를 찾아서 학습하여 이를 토대로 능동적으로 데이터나 콘텐츠 등 결과물을 제시하는 한 단계 더 진화한 AI 기술이다. AI 개발사들은 개발하고자 하는 서비스의 목적에 따라 다양한 생성형 AI 모델을 개발하고 적용하고 있는데, ChatGPT와 같은 챗봇 서비스에 가장 널리 쓰이고 있는 생성형 AI 모델은 LLM(Large Language Model)이다.
LLM은 쉽게 설명하자면, 텍스트와 같은 언어 데이터를 학습하여 결과를 제공하는 생성형 AI 모델이다. 오픈AI(OpenAI)에서 개 발한 ChatGPT에 적용된 LLM은 GPT이며, 2023년 3월에 기존 모델인 GPT 3.5보다 약 500배 더 큰 모델 크기를 가진 ChatGPT-4가 출시되었다. 또한, 구글(Google)에서는 PaLM(Pathways Language Model: 구글의 LLM)을 활용한 챗봇 서비스인 ‘바드(Bard)’를 공개하였으며, 메타(Meta)에서는 ‘라마(Large Language Model Meta AI: 메타의 LLM)’라는 LLM을 공개하였다. 국내에서는 네이버가 한국어에 특화된 초거대 언어모델인 ‘오션(OCEAN: 네이버의 LLM)’을 개발하였고, 연내에 오션 기반의 챗봇 서비스인‘하이퍼클로바X’를 런칭할 계획이다.
'과학' 카테고리의 다른 글
[과학] 혼합물의 의미와 종류, 일상생활에서 혼합물 분리하는 생활용품 (0) | 2025.07.18 |
---|---|
[과학] 식물의 분류 기준, 식물을 나누는 7가지 방법, 식물을 분류하는 이유 (0) | 2025.07.18 |
[과학] 조선시대 성곽 오산 독산성 세마대 권율장군, 김포 문수산성 병인양요 이야기 (0) | 2025.07.18 |
[과학] 공기주머니가 있어 물에떠서 사는 식물 개구리밥 부레옥잠 마름 자라풀, 연꽃과 수련의 차이 (0) | 2025.07.18 |
[과학] 식물의 특징을 활용한 생활 용품, 생체모방기술을 이용한 생활용품, 찍찍이 테이프 발명 (1) | 2025.07.18 |
댓글