Engineering/AI

인공지능 Study

산책散策 2024. 7. 26. 14:54
728x90

아래 내용은 https://github.com/microsoft/generative-ai-for-beginners/blob/main/01-introduction-to-genai/translations/ko/README.md 내용을 요약해서 작성했습니다.

 

AI LLM 관련해서 오픈되어 있으면서 한글로도 번역되어 정리되어 있는 문서 중에서는 최강이지 않을까 생각합니다.

챕터에서 MS AI 상용 제품으로 예를 들고 있고 설명하고 있는게 아쉽지만, 구글의 제미나이 보다는 MS 가 더 준비가 잘 되어 보입니다.


 

인공지능(Artifical Intelligence)

머신러닝
1997년~
텍스트 분석에 통계적 접근법을 적용한 것.
명시적으로 프로그래밍되지 않아도 데이터로부터 패턴을 학습할 수 있다.
이 접근법은 기계가 인간의 언어 이해를 모방하게 해준다.
통계 모델은 텍스트-레이블 쌍에 대해 학습하며, 이를 통해 모델은 알려지지 않은 입력 텍스트를 메시지의 의도를 나타내는 사전 정의된 레이블로 분류할 수 있게 된다.

딥러닝
2017년~
더 많은 양의 데이터를 처리하고 더 복잡한 계산을 수행할 수 있는 하드웨어의 기술적 진화가 AI 분야의 연구를 촉진.
고급 머신러닝 알고리즘인 신경망 또는 딥러닝 알고리즘이 개발.
신경망(특히 순환 신경망 - RNN)은 자연어 처리를 크게 향상시켜, 단어의 문맥을 고려하여 텍스트의 의미를 더 의미있게 표현할 수 있게 하였다.
가상 어시스턴트를 구동하여 이들이 인간의 언어를 해석하고, 필요성을 파악하고, 그것을 만족시키기 위한 행동을 수행하는 데 매우 능숙했다.
예를 들어, 사전에 정의된 스크립트로 답변하거나 3rd party 서비스를 사용하는 등의 작업을 수행하였습니다.

생성형 AI
2021년~
새로운 모델 구조인 Transformer가 RNN의 한계를 극복했다.
Transformer는 입력받은 텍스트의 순서에 관계없이 가장 중요한 정보가 집중된 곳에 ’더 많은 주의’를 기울일 수 있도록 모델에 다른 가중치를 부여하는 attention 메커니즘에 기반.
대형 언어 모델(Large Language Models, LLMs)이라고도 불리는 최근의 생성형 AI 모델들은 대부분 이 구조에 기반.
이 모델들은 책, 기사, 웹사이트 등 다양한 출처로부터 수많은 양의 라벨이 없는 데이터로 훈련되었다.
이 모델들의 흥미로운 점은 다양한 작업에 활용할 수 있고, 문법적으로 올바르고 창의적인 텍스트를 생성할 수 있다.
즉, 기계가 입력 텍스트를 ’이해’하는 능력을 엄청나게 향상시키뿐만 아니라, 인간의 언어로 원본 응답을 생성하는 능력을 가능하게 했다.


검색 증강
https://github.com/microsoft/generative-ai-for-beginners/blob/main/02-exploring-and-comparing-different-llms/translations/ko/README.md