├── Open-source_LLM ├── basic_chat │ ├── huggingface_LLM_chat.ipynb │ ├── langchain_ollama_QnA.ipynb │ ├── langchain_ollama_chatbot.ipynb │ └── langchain_ollama_prompting.ipynb └── rag │ ├── llama-index_huggingface_RAG_basic.ipynb │ └── llama-index_ollama_RAG_basic.ipynb ├── OpenAI ├── OpenAI_API_call.ipynb ├── OpenAI_RAG_ChatAPI.ipynb └── OpenAI_RAG_Llama_index.ipynb └── README.md /Open-source_LLM/basic_chat/langchain_ollama_QnA.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# **Langchain과 Ollama를 이용한 Q&A 시스템 예제**\n", 8 | "\n", 9 | "**Langchain**과 **Ollama**를 이용해 **Open-source LLM**으로 Q&A 시스템을 만드는 예제입니다.\n", 10 | "\n", 11 | "\n", 12 | "*본 예제는 구글 코랩 환경이 아닙니다." 13 | ] 14 | }, 15 | { 16 | "cell_type": "markdown", 17 | "metadata": {}, 18 | "source": [ 19 | "## **1. 환경 세팅**\n", 20 | "- 개발 환경에 필요 라이브러리 설치 : ollama, langchain, langchain_community,...\n", 21 | "- 필요 패키지 임포트\n", 22 | "- Ollama 모델 사용 방법" 23 | ] 24 | }, 25 | { 26 | "cell_type": "code", 27 | "execution_count": 1, 28 | "metadata": {}, 29 | "outputs": [], 30 | "source": [ 31 | "# 필요한 라이브러리 임포트\n", 32 | "from langchain_community.llms import Ollama\n", 33 | "from langchain_core.prompts import PromptTemplate\n", 34 | "from langchain.chains import LLMChain\n", 35 | "from IPython.display import Markdown, display" 36 | ] 37 | }, 38 | { 39 | "attachments": { 40 | "image.png": { 41 | "image/png": "" 42 | } 43 | }, 44 | "cell_type": "markdown", 45 | "metadata": {}, 46 | "source": [ 47 | "### Ollama 모델 사용 방법\n", 48 | "![image.png](attachment:image.png)\n", 49 | "- [Ollama 레포지토리](https://github.com/ollama/ollama?tab=readme-ov-file) 참고하여 OS 별 Ollama 다운로드\n", 50 | "- `ollama pull {model_name}` 명령어로 로컬에 모델 다운로드\n", 51 | "- 본 예제에서는 \"gemma2:2b\" 모델 사용 \n", 52 | "\n", 53 | "![image.png](attachment:image.png)\n", 54 | "\n", 55 | "- Ollama 레포지토리에서 모델 라이브러리를 참고하여 원하는 모델 다운로드 가능" 56 | ] 57 | }, 58 | { 59 | "cell_type": "markdown", 60 | "metadata": {}, 61 | "source": [ 62 | "## **2. 모델 로드**\n", 63 | "- Ollama를 이용한 오픈소스 LLM 로드\n", 64 | "- 프롬프트 템플릿 & LLM Chain 생성" 65 | ] 66 | }, 67 | { 68 | "cell_type": "code", 69 | "execution_count": 2, 70 | "metadata": {}, 71 | "outputs": [], 72 | "source": [ 73 | "# Ollama LLM 설정 (원하는 모델을 선택하여 사용)\n", 74 | "llm = Ollama(model=\"gemma2:2b\")\n", 75 | "\n", 76 | "# 프롬프트 템플릿 생성\n", 77 | "template = \"\"\"\n", 78 | " 질문: {question}\n", 79 | " 답변:\n", 80 | " \"\"\"\n", 81 | "prompt = PromptTemplate(\n", 82 | " input_variables=[\"question\"],\n", 83 | " template=template,\n", 84 | ")\n", 85 | "\n", 86 | "# LLMChain 생성\n", 87 | "llm_chain = LLMChain(prompt=prompt, llm=llm)" 88 | ] 89 | }, 90 | { 91 | "cell_type": "markdown", 92 | "metadata": {}, 93 | "source": [ 94 | "## **3. LLM Q&A 시스템 함수 선언**\n", 95 | "- LLM Chain을 이용해 사용자 질의와 모델 응답을 출력하는 함수\n", 96 | "- 이전 대화 내용은 기억하지 않는 단순한 질의 응답 방법" 97 | ] 98 | }, 99 | { 100 | "cell_type": "code", 101 | "execution_count": 5, 102 | "metadata": {}, 103 | "outputs": [], 104 | "source": [ 105 | "# 함수 정의: 질문 입력 및 답변 출력\n", 106 | "def QnA_assistant():\n", 107 | " print(\"LLM과의 질의 응답을 시작합니다. 대화 내용은 기억하지 못합니다. 종료하려면 '그만'이라고 입력하세요.\")\n", 108 | " \n", 109 | " while True:\n", 110 | " # 사용자가 질문을 입력\n", 111 | " question = input(\"\\n질문을 입력하세요: \")\n", 112 | "\n", 113 | " # '그만'을 입력하면 종료\n", 114 | " if question.lower() == \"그만\":\n", 115 | " print(\"대화를 종료합니다.\")\n", 116 | " break\n", 117 | "\n", 118 | " # LLMChain을 사용하여 질문에 대한 답변 생성\n", 119 | " response = llm_chain.run(question)\n", 120 | "\n", 121 | " # 질문과 응답을 구분해서 출력\n", 122 | " display(Markdown(f\"### **사용자 질문:**\\n{question}\\n\"))\n", 123 | " display(Markdown(f\"### **LLM 응답:**\\n{response}\"))\n", 124 | " print(\"==========================\")" 125 | ] 126 | }, 127 | { 128 | "cell_type": "markdown", 129 | "metadata": {}, 130 | "source": [ 131 | "## **4. Q&A 진행**\n", 132 | "- LLM에게 질문하고 답변을 받는 과정\n", 133 | "- 대화를 중지하고 싶은 경우 '그만'이라고 입력" 134 | ] 135 | }, 136 | { 137 | "cell_type": "code", 138 | "execution_count": 6, 139 | "metadata": {}, 140 | "outputs": [ 141 | { 142 | "name": "stdout", 143 | "output_type": "stream", 144 | "text": [ 145 | "LLM과의 질의 응답을 시작합니다. 대화 내용은 기억하지 못합니다. 종료하려면 '그만'이라고 입력하세요.\n" 146 | ] 147 | }, 148 | { 149 | "name": "stderr", 150 | "output_type": "stream", 151 | "text": [ 152 | "/var/folders/h7/y4jd7kf533z0n4r3h9x9pc4c0000gn/T/ipykernel_23088/547107013.py:15: LangChainDeprecationWarning: The method `Chain.run` was deprecated in langchain 0.1.0 and will be removed in 1.0. Use :meth:`~invoke` instead.\n", 153 | " response = llm_chain.run(question)\n" 154 | ] 155 | }, 156 | { 157 | "data": { 158 | "text/markdown": [ 159 | "### **사용자 질문:**\n", 160 | "python 언어에 대해 설명해줘\n" 161 | ], 162 | "text/plain": [ 163 | "" 164 | ] 165 | }, 166 | "metadata": {}, 167 | "output_type": "display_data" 168 | }, 169 | { 170 | "data": { 171 | "text/markdown": [ 172 | "### **LLM 응답:**\n", 173 | "## Python 언어에 대한 설명 🐍💻\n", 174 | "\n", 175 | "**Python:** versatile, easy-to-learn programming language 🌎\n", 176 | "\n", 177 | "**무엇 때문에 Python이 인기 있는가? 🤔**\n", 178 | "\n", 179 | "* **쉽게 배우는 방식:** 초보자도 이해하기 쉬운 문법과 유용한 도움말을 통해 시작할 수 있습니다. 😊\n", 180 | "* **다양한 분야에 적용 가능:** Web 개발, 데이터 분석, 머신러닝, 게임 개발 등 거의 모든 분야에서 사용됩니다! 💪\n", 181 | "* **강력하고 활발한 커뮤니티:** 언어를 잘 이해하는 많은 개발자들이 도움을 제공해줍니다. 🤝\n", 182 | "\n", 183 | "**Python의 강점! 🤩**\n", 184 | "\n", 185 | "* **코드가 간결하고 명확:** 문제 해결에 효율적이고 읽기를 용이하게 합니다.\n", 186 | "* **다양한 라이브러리와 기능:** Python은 풍부한 도구들을 제공하여 다양한 작업을 수행할 수 있습니다. 🧰 (예: NumPy, Pandas, matplotlib 등)\n", 187 | "* **안정적인 환경 및 확장성:** 변화에 대한 적응력이 높고 장기적으로 사용하기 위한 안정적입니다. 🚀\n", 188 | "\n", 189 | "**Python 언어 활용 분야! ✨**\n", 190 | "\n", 191 | "* **Web 개발:** Flask, Django로 웹사이트 구축 🌐\n", 192 | "* **데이터 분석:** Pandas, NumPy를 이용하여 데이터 수집, 처리, 분석 💪\n", 193 | "* **머신러닝 & 인공 지능:** Scikit-learn, TensorFlow 등으로 모델 학습 및 예측 🚀\n", 194 | "* **게임 개발:** Pygame와 Kivy로 게임을 만들고 실행 🕹️\n", 195 | "\n", 196 | "\n", 197 | "**Python 언어 배우기 방법! 📖**\n", 198 | "\n", 199 | "* **온라인 강좌 (Coursera, Udemy 등):** 다양한 수준의 과정으로 선택 가능 🎓\n", 200 | "* **프로그래밍 도구 & 환경:** IDE (PyCharm, VS Code)를 통해 실습 💻\n", 201 | "* **실전 연습:** 제공되는 온라인 사례들과 직접 프로젝트 진행 💪\n", 202 | "\n", 203 | "\n", 204 | "**Python 언어는 당신의 창업 꿈을 이룰 수 있는 강력한 도구! 🌠**\n", 205 | "\n", 206 | "더 자세히 알고 싶다면, Python 공식 웹사이트(https://www.python.org/)를 방문해보세요! 😊\n" 207 | ], 208 | "text/plain": [ 209 | "" 210 | ] 211 | }, 212 | "metadata": {}, 213 | "output_type": "display_data" 214 | }, 215 | { 216 | "name": "stdout", 217 | "output_type": "stream", 218 | "text": [ 219 | "==========================\n", 220 | "대화를 종료합니다.\n" 221 | ] 222 | } 223 | ], 224 | "source": [ 225 | "QnA_assistant()" 226 | ] 227 | } 228 | ], 229 | "metadata": { 230 | "kernelspec": { 231 | "display_name": "base", 232 | "language": "python", 233 | "name": "python3" 234 | }, 235 | "language_info": { 236 | "codemirror_mode": { 237 | "name": "ipython", 238 | "version": 3 239 | }, 240 | "file_extension": ".py", 241 | "mimetype": "text/x-python", 242 | "name": "python", 243 | "nbconvert_exporter": "python", 244 | "pygments_lexer": "ipython3", 245 | "version": "3.12.4" 246 | } 247 | }, 248 | "nbformat": 4, 249 | "nbformat_minor": 2 250 | } 251 | -------------------------------------------------------------------------------- /Open-source_LLM/basic_chat/langchain_ollama_chatbot.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# **Langchain과 Ollama를 이용한 대화형 챗봇 예제**\n", 8 | "\n", 9 | "**Langchain**과 **Ollama**를 이용해 **Open-source LLM**으로 대화형 챗봇을 만드는 예제입니다.\n", 10 | "\n", 11 | "\n", 12 | "*본 예제는 구글 코랩 환경이 아닙니다." 13 | ] 14 | }, 15 | { 16 | "cell_type": "markdown", 17 | "metadata": {}, 18 | "source": [ 19 | "## **1. 환경 세팅**\n", 20 | "- 개발 환경에 필요 라이브러리 설치 : ollama, langchain, langchain_community,...\n", 21 | "- 필요 패키지 임포트\n", 22 | "- Ollama 모델 사용 방법" 23 | ] 24 | }, 25 | { 26 | "cell_type": "code", 27 | "execution_count": 12, 28 | "metadata": {}, 29 | "outputs": [], 30 | "source": [ 31 | "# 필요한 라이브러리 임포트\n", 32 | "from langchain_community.llms import Ollama\n", 33 | "from langchain_core.prompts import PromptTemplate\n", 34 | "from langchain.chains import LLMChain\n", 35 | "from langchain.memory import ConversationBufferMemory\n", 36 | "from IPython.display import Markdown, display" 37 | ] 38 | }, 39 | { 40 | "cell_type": "markdown", 41 | "metadata": {}, 42 | "source": [ 43 | "### Ollama 모델 사용 방법\n", 44 | "- [Ollama 레포지토리](https://github.com/ollama/ollama?tab=readme-ov-file) 참고하여 OS 별 Ollama 다운로드\n", 45 | "- `ollama pull {model_name}` 명령어로 로컬에 모델 다운로드\n", 46 | "- 본 예제에서는 \"gemma2:2b\" 모델 사용 \n", 47 | "- Ollama 레포지토리에서 모델 라이브러리를 참고하여 원하는 모델 다운로드 가능" 48 | ] 49 | }, 50 | { 51 | "cell_type": "markdown", 52 | "metadata": {}, 53 | "source": [ 54 | "## **2. 모델 로드**\n", 55 | "- Ollama를 이용한 오픈소스 LLM 로드\n", 56 | "- 프롬프트 템플릿 & LLM Chain 생성\n", 57 | "- 대화 내용을 저장하는 메모리 버퍼 설정" 58 | ] 59 | }, 60 | { 61 | "cell_type": "code", 62 | "execution_count": 13, 63 | "metadata": {}, 64 | "outputs": [], 65 | "source": [ 66 | "# Ollama LLM 설정 (원하는 모델을 선택하여 사용)\n", 67 | "llm = Ollama(model=\"gemma2:2b\")\n", 68 | "\n", 69 | "# 프롬프트 템플릿 생성 (대화의 맥락을 추가)\n", 70 | "template = \"\"\"\n", 71 | " 다음은 사용자와 AI 사이의 대화입니다.\n", 72 | " 대화를 이어서 하세요.\n", 73 | " \n", 74 | " {history}\n", 75 | " \n", 76 | " 사용자: {question}\n", 77 | " AI:\n", 78 | " \"\"\"\n", 79 | "prompt = PromptTemplate(\n", 80 | " input_variables=[\"history\", \"question\"],\n", 81 | " template=template,\n", 82 | ")\n", 83 | "\n", 84 | "# 메모리 설정 (대화 내용을 저장하는 버퍼)\n", 85 | "memory = ConversationBufferMemory(input_key=\"question\", memory_key=\"history\")\n", 86 | "\n", 87 | "# LLMChain 생성 (메모리를 연결)\n", 88 | "llm_chain = LLMChain(prompt=prompt, llm=llm, memory=memory)" 89 | ] 90 | }, 91 | { 92 | "cell_type": "markdown", 93 | "metadata": {}, 94 | "source": [ 95 | "## **3. LLM 대화형 챗봇 함수 선언**\n", 96 | "- LLM Chain을 이용해 대화형 챗봇 기능 구현\n", 97 | "- 이전 대화 내용을 기억한 상태로 질의 응답 진행" 98 | ] 99 | }, 100 | { 101 | "cell_type": "code", 102 | "execution_count": 26, 103 | "metadata": {}, 104 | "outputs": [], 105 | "source": [ 106 | "# 함수 정의: 질문 입력 및 답변 출력\n", 107 | "def chatbot_with_memory():\n", 108 | " print(\"대화형 챗봇과의 대화를 시작합니다. 종료하려면 '그만'이라고 입력하세요.\")\n", 109 | " \n", 110 | " while True:\n", 111 | " # 사용자가 질문을 입력\n", 112 | " question = input(\"\\n질문을 입력하세요: \")\n", 113 | "\n", 114 | " # '그만'을 입력하면 종료\n", 115 | " if question.lower() == \"그만\":\n", 116 | " print(\"대화를 종료합니다.\")\n", 117 | " break\n", 118 | "\n", 119 | " # LLMChain을 사용하여 질문에 대한 답변 생성\n", 120 | " response = llm_chain.run(question)\n", 121 | "\n", 122 | " # 질문과 응답을 구분해서 출력\n", 123 | " display(Markdown(f\"### **사용자 질문:**\\n{question}\\n\"))\n", 124 | " display(Markdown(f\"### **LLM 응답:**\\n{response}\"))\n", 125 | " print(\"==========================\")" 126 | ] 127 | }, 128 | { 129 | "cell_type": "markdown", 130 | "metadata": {}, 131 | "source": [ 132 | "## **4. 대화 진행**\n", 133 | "- LLM에게 질문하고 답변을 받는 과정\n", 134 | "- 대화를 중지하고 싶은 경우 '그만'이라고 입력" 135 | ] 136 | }, 137 | { 138 | "cell_type": "code", 139 | "execution_count": 27, 140 | "metadata": {}, 141 | "outputs": [ 142 | { 143 | "name": "stdout", 144 | "output_type": "stream", 145 | "text": [ 146 | "대화형 챗봇과의 대화를 시작합니다. 종료하려면 '그만'이라고 입력하세요.\n" 147 | ] 148 | }, 149 | { 150 | "data": { 151 | "text/markdown": [ 152 | "### **사용자 질문:**\n", 153 | "비타민에 대해 알려줘\n" 154 | ], 155 | "text/plain": [ 156 | "" 157 | ] 158 | }, 159 | "metadata": {}, 160 | "output_type": "display_data" 161 | }, 162 | { 163 | "data": { 164 | "text/markdown": [ 165 | "### **LLM 응답:**\n", 166 | "## 비타민: 우리 몸의 필수적인 영양소! 🌈\n", 167 | "\n", 168 | "비타민은 우리 몸에서 중요한 역할을 하는 **필수적인 영양소**입니다. 💪 다양한 기능을 수행하며 건강 유지에 매우 중요합니다. 😉 \n", 169 | "\n", 170 | "### 비타민 종류와 그 역할들! ✨ \n", 171 | "\n", 172 | "1. **비타민 A (retinol):** 눈, 피부를 위한 강력한 영양소! 👀\n", 173 | " * **눈:** 시야 확보 및 안구 주변 세포 성장 활성화에 필수적! ☀️\n", 174 | " * **피부:** 노화 방지, 탄력 증진 및 윤기 개선에 도움을 줍니다.\n", 175 | "\n", 176 | "2. **비타민 B (B1, B2, B3, B5, B6, B7, B9, B12):** 에너지를 생산하는 데 필수적! 💪\n", 177 | " * **이들의 역할:** 신경 기능 활성화와 신체 작용을 지켜주는 주요 역할입니다. 🧠\n", 178 | "\n", 179 | "3. **비타민 C (Ascorbic Acid):** 면역력 강화에 필수적인 영양소! 💪\n", 180 | " * **피부:** 피부 노화, 미백, 균일성 증진, 피부 질환 예방에 도움을 줄 수 있습니다!\n", 181 | "\n", 182 | "4. **비타민 D (cholecalciferol):** 칼슘 소수와 골밀도 유지에 필수적! 🦴\n", 183 | " * **뼈 건강:** 뼈 성장 및 건강 유지에 필수적입니다. \n", 184 | "\n", 185 | "5. **비타민 E (tocopherols):** 피부 보호, 항산화 작용, 안전을 위한 좋은 영양소!🛡️ \n", 186 | " * **피부:** 자외선 차단, 피부 손상 예방에 도움을 줄 수 있습니다.\n", 187 | "\n", 188 | "### 비타민은 개인별 건강 상태에 따라 필요량이 다릅니다. 🩺\n", 189 | "\n", 190 | "**더 자세한 정보:** 각 비타민의 종류와 필요한 양에 대해 더 알고 싶으신가요? 😊 문자로 질문해주세요! \n", 191 | "\n", 192 | "\n", 193 | "\n" 194 | ], 195 | "text/plain": [ 196 | "" 197 | ] 198 | }, 199 | "metadata": {}, 200 | "output_type": "display_data" 201 | }, 202 | { 203 | "name": "stdout", 204 | "output_type": "stream", 205 | "text": [ 206 | "==========================\n" 207 | ] 208 | }, 209 | { 210 | "data": { 211 | "text/markdown": [ 212 | "### **사용자 질문:**\n", 213 | "B에 대해 조금 더 상세하게 알려줄래?\n" 214 | ], 215 | "text/plain": [ 216 | "" 217 | ] 218 | }, 219 | "metadata": {}, 220 | "output_type": "display_data" 221 | }, 222 | { 223 | "data": { 224 | "text/markdown": [ 225 | "### **LLM 응답:**\n", 226 | "네, 비타민 B에 대한 자세한 정보를 알려드릴게요! 💪\n", 227 | "\n", 228 | "**비타민 B은 우리 몸에서 에너지 생성과 신경 기능 활성화에 필수적인 영양소입니다. ** 총 8종류의 비타민이 포함된 이 군데는 매우 중요합니다. 😎\n", 229 | "\n", 230 | "* **B1 (Thiamine):**\n", 231 | " * **작용:** 미네랄 형태로 에너지 생성을 유도하는 역할을 합니다. 신경계, 심장 및 근육 기능에 도움을 줍니다. 🧠\n", 232 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 233 | "\n", 234 | "* **B2 (Riboflavin):**\n", 235 | " * **작용:** 세포 성장과 활성화를 위해 에너지를 분해하는 역할을 합니다. 피부, 눈 등에 영향을 미치고 있습니다. 👀\n", 236 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 237 | "\n", 238 | "* **B3 (Niacin):**\n", 239 | " * **작용:** 세포 성장과 활성화에 필수적인 역할을 합니다. 심혈관 기능 조절에도 중요한 역할을 합니다. 💪🧠\n", 240 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 241 | "\n", 242 | "* **B5 (Pantothenic Acid):** \n", 243 | " * **작용:** 세포 신호 전달과 에너지 생성에 관여하는 중요한 역할을 합니다. 생산, 소모 및 운동 등에서 활용됩니다. 🧬💪\n", 244 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 245 | "\n", 246 | "* **B6 (Pyridoxine):** \n", 247 | " * **작용:** 신경계 기능과 신체 작용을 조절하는 역할을 합니다. 뇌, 신장 및 호르몬 분비에 큰 영향을 미치고 있습니다. 🧠💪 \n", 248 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 249 | "\n", 250 | "* **B7 (Biotin):** \n", 251 | " * **작용:** 카테콜라민 생성과 세포 성장 및 신경 기능에 중요한 역할을 합니다. 피부와 모발 건강에도 도움을 줄 수 있습니다. 🧬💪 \n", 252 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 253 | "\n", 254 | "* **B9 (Folate):** \n", 255 | " * **작용:** 식물성 생활 유지 및 발달에 필수적인 역할을 합니다. 신체 기능 활동과 성장에 중요한 역할을 합니다. 🧬💪 \n", 256 | " * **비타민 B군**: 비타민 B의 일부입니다.\n", 257 | "\n", 258 | "* **B12 (Cobalamin):** \n", 259 | " * **작용:** 혈액 생성, 신경계 기능 및 기타 생명 활동에 필수적인 역할을 합니다. 치아 건강에도 중요한 역할을 합니다. 🩸🧠🦷 \n", 260 | " * **비타민 B군**: 비타민 B의 일부입니다. \n", 261 | "\n", 262 | "**비타민 B는 우리 몸의 에너지 생산과 신경 기능 활성화에 중요한 역할을 하므로, 건강 관리에 매우 중요합니다! 💪 **\n", 263 | "\n", 264 | "\n", 265 | " 더 자세한 정보를 원하시면 문자로 질문해주세요! 😊" 266 | ], 267 | "text/plain": [ 268 | "" 269 | ] 270 | }, 271 | "metadata": {}, 272 | "output_type": "display_data" 273 | }, 274 | { 275 | "name": "stdout", 276 | "output_type": "stream", 277 | "text": [ 278 | "==========================\n" 279 | ] 280 | }, 281 | { 282 | "data": { 283 | "text/markdown": [ 284 | "### **사용자 질문:**\n", 285 | "어떤 식품을 먹으면 좋아?\n" 286 | ], 287 | "text/plain": [ 288 | "" 289 | ] 290 | }, 291 | "metadata": {}, 292 | "output_type": "display_data" 293 | }, 294 | { 295 | "data": { 296 | "text/markdown": [ 297 | "### **LLM 응답:**\n", 298 | " 비타민 B가 풍부한 식품은 다음과 같습니다. 👍\n", 299 | "\n", 300 | "* **곡류:** 귀리, 잡곡, 현미, 보리와 같은 곡물은 비타민 B1, B2, B6 및 B9를 함유하고 있습니다. 🌾\n", 301 | "* **새우, 연어 등 미네랄이 풍부한 생선:** 새우나 연어는 비타민 B가 풍부합니다. 🐟 \n", 302 | "* **콩과 두부:** 콩과 두부는 비타민 B1을 함유하고 있습니다. 🫘\n", 303 | "* **브로콜리, 시금치 등 채소**: 브로콜리는 비타민 B2를 함유하고 있으며, 시금치와 같은 채소도 비타민 B가 풍부합니다. 🥦 🌱\n", 304 | "\n", 305 | "**비타민 B가 있는 식품을 꾸준히 섭취하면 건강 관리에 도움이 될 수 있습니다.** \n" 306 | ], 307 | "text/plain": [ 308 | "" 309 | ] 310 | }, 311 | "metadata": {}, 312 | "output_type": "display_data" 313 | }, 314 | { 315 | "name": "stdout", 316 | "output_type": "stream", 317 | "text": [ 318 | "==========================\n", 319 | "대화를 종료합니다.\n" 320 | ] 321 | } 322 | ], 323 | "source": [ 324 | "# 챗봇 실행\n", 325 | "chatbot_with_memory()" 326 | ] 327 | } 328 | ], 329 | "metadata": { 330 | "kernelspec": { 331 | "display_name": "base", 332 | "language": "python", 333 | "name": "python3" 334 | }, 335 | "language_info": { 336 | "codemirror_mode": { 337 | "name": "ipython", 338 | "version": 3 339 | }, 340 | "file_extension": ".py", 341 | "mimetype": "text/x-python", 342 | "name": "python", 343 | "nbconvert_exporter": "python", 344 | "pygments_lexer": "ipython3", 345 | "version": "3.12.4" 346 | } 347 | }, 348 | "nbformat": 4, 349 | "nbformat_minor": 2 350 | } 351 | -------------------------------------------------------------------------------- /Open-source_LLM/basic_chat/langchain_ollama_prompting.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# **Langchain과 Ollama를 이용한 프롬프트 엔지니어링 예제**\n", 8 | "\n", 9 | "**Langchain**과 **Ollama**를 이용해 **Open-source LLM**으로 기본적인 프롬프트 엔지니어링을 구현하는 예제입니다.\n", 10 | "\n", 11 | "\n", 12 | "*본 예제는 구글 코랩 환경이 아닙니다." 13 | ] 14 | }, 15 | { 16 | "cell_type": "markdown", 17 | "metadata": {}, 18 | "source": [ 19 | "## **1. 환경 세팅**\n", 20 | "- 개발 환경에 필요 라이브러리 설치 : ollama, langchain, langchain_community,...\n", 21 | "- 필요 패키지 임포트\n", 22 | "- Ollama 모델 사용 방법" 23 | ] 24 | }, 25 | { 26 | "cell_type": "code", 27 | "execution_count": 1, 28 | "metadata": {}, 29 | "outputs": [], 30 | "source": [ 31 | "from langchain_community.llms import Ollama\n", 32 | "from langchain_core.prompts import PromptTemplate\n", 33 | "from langchain.chains import LLMChain\n", 34 | "from IPython.display import Markdown, display" 35 | ] 36 | }, 37 | { 38 | "cell_type": "markdown", 39 | "metadata": {}, 40 | "source": [ 41 | "### Ollama 모델 사용 방법\n", 42 | "- [Ollama 레포지토리](https://github.com/ollama/ollama?tab=readme-ov-file) 참고하여 OS 별 Ollama 다운로드\n", 43 | "- `ollama pull {model_name}` 명령어로 로컬에 모델 다운로드\n", 44 | "- 본 예제에서는 \"gemma2:2b\" 모델 사용 \n", 45 | "- Ollama 레포지토리에서 모델 라이브러리를 참고하여 원하는 모델 다운로드 가능" 46 | ] 47 | }, 48 | { 49 | "cell_type": "markdown", 50 | "metadata": {}, 51 | "source": [ 52 | "## **2. 모델 로드**\n", 53 | "- Ollama를 이용한 오픈소스 LLM 로드\n", 54 | " - temperature, top_p 등 하이퍼파라미터 조정\n", 55 | "- 프롬프트 템플릿 & LLM Chain 생성\n", 56 | " - 템플릿을 구성하여 프롬프트 엔지니어링 준비" 57 | ] 58 | }, 59 | { 60 | "cell_type": "code", 61 | "execution_count": 2, 62 | "metadata": {}, 63 | "outputs": [ 64 | { 65 | "name": "stderr", 66 | "output_type": "stream", 67 | "text": [ 68 | "/var/folders/h7/y4jd7kf533z0n4r3h9x9pc4c0000gn/T/ipykernel_32179/2297175553.py:24: LangChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.\n", 69 | " llm_chain = LLMChain(prompt=prompt, llm=llm)\n" 70 | ] 71 | } 72 | ], 73 | "source": [ 74 | "# Ollama LLM 설정 (하이퍼파라미터 조정: temperature, top_p)\n", 75 | "llm = Ollama(\n", 76 | " model=\"gemma2:2b\", \n", 77 | " temperature=0.7, # 창의성을 적당히 높임\n", 78 | " top_p=0.9 # 확률 분포의 상위 90%에서 샘플링\n", 79 | ")\n", 80 | "\n", 81 | "# 프롬프트 템플릿 (프롬프트 엔지니어링 적용)\n", 82 | "template = \"\"\"\n", 83 | "context를 고려하여 답변을 생성해주세요.\n", 84 | "\n", 85 | "context: {context}\n", 86 | "\n", 87 | "질문: {question}\n", 88 | "답변:\"\"\"\n", 89 | "\n", 90 | "# 상황과 질문을 받아 모델이 응답하도록 하는 PromptTemplate\n", 91 | "prompt = PromptTemplate(\n", 92 | " input_variables=[\"context\", \"question\"],\n", 93 | " template=template,\n", 94 | ")\n", 95 | "\n", 96 | "# LLMChain 생성\n", 97 | "llm_chain = LLMChain(prompt=prompt, llm=llm)" 98 | ] 99 | }, 100 | { 101 | "cell_type": "markdown", 102 | "metadata": {}, 103 | "source": [ 104 | "## **3. Context 기반 질의 응답**\n", 105 | "- Context를 고려한 질의 응답 진행을 위해 윷놀이 규칙이 담긴 문서 준비\n", 106 | "- Context 고려한 질의 응답 진행\n", 107 | " - 위 코드 template에서 context를 고려하여 답변하도록 프롬프트 작성" 108 | ] 109 | }, 110 | { 111 | "cell_type": "code", 112 | "execution_count": 3, 113 | "metadata": {}, 114 | "outputs": [], 115 | "source": [ 116 | "# 상황과 질문을 정의\n", 117 | "context = \"\"\"\n", 118 | "윷놀이 규칙\n", 119 | "1. 준비물\n", 120 | "\n", 121 | "윷: 앞뒤가 다른 네 개의 막대.\n", 122 | "윷판: 원형 모양의 판, 중앙으로 가는 지름길이 있습니다.\n", 123 | "말: 각 팀이 사용할 말 4개.\n", 124 | "2. 플레이어\n", 125 | "\n", 126 | "최소 2명에서 4명까지 팀을 이루어 플레이합니다.\n", 127 | "3. 윷 던지기 윷은 네 개의 막대로 구성되어 있으며, 던진 결과에 따라 다음과 같은 점수를 얻습니다:\n", 128 | "\n", 129 | "도: 1칸 이동 (1개만 뒤집힘)\n", 130 | "개: 2칸 이동 (2개 뒤집힘)\n", 131 | "걸: 3칸 이동 (3개 뒤집힘)\n", 132 | "윷: 4칸 이동 (4개 모두 뒤집힘)\n", 133 | "모: 5칸 이동 (모두 안 뒤집힘)\n", 134 | "4. 말 이동\n", 135 | "\n", 136 | "윷이나 모가 나오면 한 번 더 던질 수 있습니다.\n", 137 | "말을 이동시키며, 자신의 말 4개가 모두 완주하면 승리합니다.\n", 138 | "5. 말 업기\n", 139 | "\n", 140 | "같은 팀의 말이 한 칸에 모이면 말 업기가 가능합니다. 업힌 말은 함께 이동합니다.\n", 141 | "6. 잡기\n", 142 | "\n", 143 | "상대방의 말을 잡으면, 상대방 말은 시작점으로 돌아갑니다. 잡은 플레이어는 한 번 더 윷을 던집니다.\n", 144 | "7. 승리 조건\n", 145 | "\n", 146 | "자신의 말 4개를 모두 완주시키면 승리합니다.\n", 147 | "특별 규칙\n", 148 | "지름길: 중앙으로 가는 지름길을 통해 빠르게 이동할 수 있습니다.\n", 149 | "말의 이동 선택: 윷을 던질 때, 여러 개의 말 중 어느 말이 이동할지 선택할 수 있습니다.\n", 150 | "윷놀이는 간단하면서도 전략적인 게임으로, 운과 실력을 모두 요구하는 한국 전통 놀이입니다.\n", 151 | "\"\"\"" 152 | ] 153 | }, 154 | { 155 | "cell_type": "code", 156 | "execution_count": 4, 157 | "metadata": {}, 158 | "outputs": [ 159 | { 160 | "name": "stderr", 161 | "output_type": "stream", 162 | "text": [ 163 | "/var/folders/h7/y4jd7kf533z0n4r3h9x9pc4c0000gn/T/ipykernel_32179/1700282676.py:3: LangChainDeprecationWarning: The method `Chain.run` was deprecated in langchain 0.1.0 and will be removed in 1.0. Use :meth:`~invoke` instead.\n", 164 | " response = llm_chain.run(context=context, question=question)\n" 165 | ] 166 | }, 167 | { 168 | "name": "stdout", 169 | "output_type": "stream", 170 | "text": [ 171 | "LLM 답변:\n" 172 | ] 173 | }, 174 | { 175 | "data": { 176 | "text/markdown": [ 177 | "윷놀이에서 상대방의 말을 잡으면, **상대방 말은 시작점으로 돌아갑니다.** 그리고 잡은 플레이어는 한 번 더 윷을 던질 수 있습니다. \n" 178 | ], 179 | "text/plain": [ 180 | "" 181 | ] 182 | }, 183 | "execution_count": 4, 184 | "metadata": {}, 185 | "output_type": "execute_result" 186 | } 187 | ], 188 | "source": [ 189 | "question = \"윷놀이에서 상대방 말을 잡으면 어떻게 돼?\"\n", 190 | "\n", 191 | "response = llm_chain.run(context=context, question=question)\n", 192 | "print(\"LLM 답변:\")\n", 193 | "Markdown(response)" 194 | ] 195 | }, 196 | { 197 | "cell_type": "markdown", 198 | "metadata": {}, 199 | "source": [ 200 | "## **4. Few-shot Learning 질의 응답**\n", 201 | "- Few-shot Learning 방법 예시" 202 | ] 203 | }, 204 | { 205 | "cell_type": "code", 206 | "execution_count": 5, 207 | "metadata": {}, 208 | "outputs": [], 209 | "source": [ 210 | "# Few-shot Learning 추가 예시 (Few-shot을 통한 학습 예제 제공)\n", 211 | "few_shot_template = \"\"\"\n", 212 | "다음 질문 - 답변 형식에 맞게 답변을 생성해주세요\n", 213 | "\n", 214 | "1. 질문: AI 연구를 시작하려면 어떤 것을 공부해야 하나요?\n", 215 | " 답변: 기초 프로그래밍, 선형대수학, 확률론, 그리고 기본적인 머신러닝 개념을 공부해야 합니다.\n", 216 | "\n", 217 | "2. 질문: 딥러닝을 공부하기 전에 필요한 기초 지식은 무엇인가요?\n", 218 | " 답변: 미적분학, 행렬 연산, 확률분포, 그리고 그래디언트 기반 최적화 기법을 숙지해야 합니다.\n", 219 | "\n", 220 | "3. 질문: {question}\n", 221 | " 답변:\n", 222 | "\"\"\"\n", 223 | "\n", 224 | "few_shot_prompt = PromptTemplate(\n", 225 | " input_variables=[\"question\"],\n", 226 | " template=few_shot_template,\n", 227 | ")\n", 228 | "llm_chain_few_shot = LLMChain(prompt=few_shot_prompt, llm=llm)" 229 | ] 230 | }, 231 | { 232 | "cell_type": "code", 233 | "execution_count": 6, 234 | "metadata": {}, 235 | "outputs": [ 236 | { 237 | "name": "stdout", 238 | "output_type": "stream", 239 | "text": [ 240 | "Few-shot Learning 기반 LLM 답변:\n" 241 | ] 242 | }, 243 | { 244 | "data": { 245 | "text/markdown": [ 246 | "강화학습을 공부하려면 다음과 같은 지식이 필요합니다.\n", 247 | "\n", 248 | "* **머신러닝 기초**: AI의 핵심 개념들을 이해하는 것이 중요합니다. 특히 학습 과정, 모델 구조, 데이터 처리 등에 대한 이해가 필요합니다.\n", 249 | "* **기하학적 접근**: 강화학습은 특수한 변수와 관계를 분석하여 모델을 학습시키는 방식입니다. 이러한 접근방식을 이해해야 합니다. \n", 250 | "\n", 251 | "강화학습은 다양한 분야에서 활용되는 복잡한 알고리즘이므로, 기초 지식을 바탕으로 구체적인 방법과 정의를 파악하는 것이 중요합니다.\n", 252 | "\n", 253 | "\n", 254 | "**추가적으로**:\n", 255 | "\n", 256 | "* **Python:** 강화학습을 위한 주요 언어입니다. \n", 257 | "* **numpy**: Python에서 데이터 처리 및 계산에 사용되는 라이브러리 \n", 258 | "\n", 259 | "\n", 260 | "\n" 261 | ], 262 | "text/plain": [ 263 | "" 264 | ] 265 | }, 266 | "execution_count": 6, 267 | "metadata": {}, 268 | "output_type": "execute_result" 269 | } 270 | ], 271 | "source": [ 272 | "# 사용자 질문에 few-shot으로 응답\n", 273 | "\n", 274 | "question = \"강화학습을 공부하려면 무엇을 알아야 하나요?\"\n", 275 | "\n", 276 | "response_few_shot = llm_chain_few_shot.run(question=question)\n", 277 | "print(\"Few-shot Learning 기반 LLM 답변:\")\n", 278 | "Markdown(response_few_shot)" 279 | ] 280 | } 281 | ], 282 | "metadata": { 283 | "kernelspec": { 284 | "display_name": "base", 285 | "language": "python", 286 | "name": "python3" 287 | }, 288 | "language_info": { 289 | "codemirror_mode": { 290 | "name": "ipython", 291 | "version": 3 292 | }, 293 | "file_extension": ".py", 294 | "mimetype": "text/x-python", 295 | "name": "python", 296 | "nbconvert_exporter": "python", 297 | "pygments_lexer": "ipython3", 298 | "version": "3.12.4" 299 | } 300 | }, 301 | "nbformat": 4, 302 | "nbformat_minor": 2 303 | } 304 | -------------------------------------------------------------------------------- /Open-source_LLM/rag/llama-index_ollama_RAG_basic.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# **Ollama와 llama_index를 활용한 RAG 기본 예제**\n", 8 | "\n", 9 | "**Ollama**, **llama_index** 등의 라이브러리를 이용해 **Open-source LLM**으로 기본적인 **RAG** 기능을 구현하는 예제입니다.\n", 10 | "\n", 11 | "- Ollama : LLM 모델 \n", 12 | "- llama_index : RAG 문서 데이터셋\n", 13 | "- sentence_transformers : 텍스트 임베딩 모델\n", 14 | "\n", 15 | "\n", 16 | "*본 예제는 구글 코랩 환경이 아닙니다." 17 | ] 18 | }, 19 | { 20 | "cell_type": "markdown", 21 | "metadata": {}, 22 | "source": [ 23 | "## **1. 환경 세팅**\n", 24 | "- 개발 환경에 필요 라이브러리 설치 : ollama, langchain, langchain_community,...\n", 25 | "- 필요 패키지 임포트\n", 26 | "- Ollama 모델 사용 방법\n", 27 | "- `search_related_docs`\n", 28 | " - 질의와 관련된 문서를 검색하는 함수\n", 29 | " - query 임베딩을 생성하고 유사도가 높은 문서를 찾음" 30 | ] 31 | }, 32 | { 33 | "cell_type": "code", 34 | "execution_count": 29, 35 | "metadata": {}, 36 | "outputs": [], 37 | "source": [ 38 | "from langchain.llms import Ollama\n", 39 | "from llama_index.core import Document\n", 40 | "from sentence_transformers import SentenceTransformer, util\n", 41 | "from IPython.display import Markdown, display" 42 | ] 43 | }, 44 | { 45 | "cell_type": "code", 46 | "execution_count": 30, 47 | "metadata": {}, 48 | "outputs": [], 49 | "source": [ 50 | "def search_related_docs(embedding_model, query, documents):\n", 51 | "# 질의 임베딩 생성\n", 52 | " query_embedding = embedding_model.encode(query)\n", 53 | " # 인덱스를 사용하여 관련 문서 검색\n", 54 | " doc_embeddings = embedding_model.encode([doc.text for doc in documents])\n", 55 | " cosine_scores = util.pytorch_cos_sim(query_embedding, doc_embeddings)\n", 56 | "\n", 57 | " # 상위 N개의 관련 문서 인덱스 찾기\n", 58 | " top_k = 2\n", 59 | " top_results = cosine_scores[0].topk(top_k)\n", 60 | "\n", 61 | " # 관련 문서 추출\n", 62 | " related_docs = [documents[idx].text for idx in top_results[1]]\n", 63 | "\n", 64 | " return related_docs" 65 | ] 66 | }, 67 | { 68 | "cell_type": "markdown", 69 | "metadata": {}, 70 | "source": [ 71 | "### Ollama 모델 사용 방법\n", 72 | "- [Ollama 레포지토리](https://github.com/ollama/ollama?tab=readme-ov-file) 참고하여 OS 별 Ollama 다운로드\n", 73 | "- `ollama pull {model_name}` 명령어로 로컬에 모델 다운로드\n", 74 | "- 본 예제에서는 \"gemma2:2b\" 모델 사용 \n", 75 | "- Ollama 레포지토리에서 모델 라이브러리를 참고하여 원하는 모델 다운로드 가능" 76 | ] 77 | }, 78 | { 79 | "cell_type": "markdown", 80 | "metadata": {}, 81 | "source": [ 82 | "## **2. 모델 로드**\n", 83 | "- Ollama를 이용한 오픈소스 LLM 로드\n", 84 | "- `SentenceTransformer` 의 텍스트 임베딩 모델 로드\n", 85 | " - 한국어 임베딩이 가능한 \"distiluse-base-multilingual-cased-v1\" 모델 사용" 86 | ] 87 | }, 88 | { 89 | "cell_type": "code", 90 | "execution_count": 31, 91 | "metadata": {}, 92 | "outputs": [ 93 | { 94 | "name": "stderr", 95 | "output_type": "stream", 96 | "text": [ 97 | "/opt/anaconda3/lib/python3.12/site-packages/transformers/tokenization_utils_base.py:1601: FutureWarning: `clean_up_tokenization_spaces` was not set. It will be set to `True` by default. This behavior will be depracted in transformers v4.45, and will be then set to `False` by default. For more details check this issue: https://github.com/huggingface/transformers/issues/31884\n", 98 | " warnings.warn(\n" 99 | ] 100 | } 101 | ], 102 | "source": [ 103 | "# Ollama 모델 로드\n", 104 | "llm = Ollama(model='gemma2:2b') # 사용할 Ollama 모델 선택\n", 105 | "\n", 106 | "# 텍스트 임베딩 모델 로드\n", 107 | "# distiluse-base-multilingual-cased-v1 : 한국어 임베딩을 지원하는 모델\n", 108 | "# embedding_model = SentenceTransformer('all-mpnet-base-v2')\n", 109 | "embedding_model = SentenceTransformer('distiluse-base-multilingual-cased-v1')" 110 | ] 111 | }, 112 | { 113 | "cell_type": "markdown", 114 | "metadata": {}, 115 | "source": [ 116 | "## **3. RAG 문서 데이터셋 정의**\n", 117 | "- RAG에서 검색할 텍스트 데이터셋 정의\n", 118 | "- `Documents` 객체를 생성하여 각 텍스트를 문서로 변환\n", 119 | "- 예제에서는 윷놀이, 제기차기, 식혜 만들기, 스타크래프트에 대한 문서 사용" 120 | ] 121 | }, 122 | { 123 | "cell_type": "code", 124 | "execution_count": 32, 125 | "metadata": {}, 126 | "outputs": [], 127 | "source": [ 128 | "text_0 = \"\"\"\n", 129 | "윷놀이 규칙\n", 130 | "1. 준비물\n", 131 | "\n", 132 | "윷: 앞뒤가 다른 네 개의 막대.\n", 133 | "윷판: 원형 모양의 판, 중앙으로 가는 지름길이 있습니다.\n", 134 | "말: 각 팀이 사용할 말 4개.\n", 135 | "2. 플레이어\n", 136 | "\n", 137 | "최소 2명에서 4명까지 팀을 이루어 플레이합니다.\n", 138 | "3. 윷 던지기 윷은 네 개의 막대로 구성되어 있으며, 던진 결과에 따라 다음과 같은 점수를 얻습니다:\n", 139 | "\n", 140 | "도: 1칸 이동 (1개만 뒤집힘)\n", 141 | "개: 2칸 이동 (2개 뒤집힘)\n", 142 | "걸: 3칸 이동 (3개 뒤집힘)\n", 143 | "윷: 4칸 이동 (4개 모두 뒤집힘)\n", 144 | "모: 5칸 이동 (모두 안 뒤집힘)\n", 145 | "4. 말 이동\n", 146 | "\n", 147 | "윷이나 모가 나오면 한 번 더 던질 수 있습니다.\n", 148 | "말을 이동시키며, 자신의 말 4개가 모두 완주하면 승리합니다.\n", 149 | "5. 말 업기\n", 150 | "\n", 151 | "같은 팀의 말이 한 칸에 모이면 말 업기가 가능합니다. 업힌 말은 함께 이동합니다.\n", 152 | "6. 잡기\n", 153 | "\n", 154 | "상대방의 말을 잡으면, 상대방 말은 시작점으로 돌아갑니다. 잡은 플레이어는 한 번 더 윷을 던집니다.\n", 155 | "7. 승리 조건\n", 156 | "\n", 157 | "자신의 말 4개를 모두 완주시키면 승리합니다.\n", 158 | "특별 규칙\n", 159 | "지름길: 중앙으로 가는 지름길을 통해 빠르게 이동할 수 있습니다.\n", 160 | "말의 이동 선택: 윷을 던질 때, 여러 개의 말 중 어느 말이 이동할지 선택할 수 있습니다.\n", 161 | "윷놀이는 간단하면서도 전략적인 게임으로, 운과 실력을 모두 요구하는 한국 전통 놀이입니다.\"\"\"\n", 162 | "\n", 163 | "text_1 =\"\"\"\n", 164 | "제기차기는 한국의 전통 놀이로, 주로 어린이들이 즐기는 활동입니다. 제기차기의 기본 규칙은 다음과 같습니다:\n", 165 | "\n", 166 | "제기 만들기: 제기는 주로 종이나 천으로 만들어진 둥글고 평평한 물체입니다. 흔히 종이로 만든 제기를 사용하며, 발 아래에 적당한 무게가 있는 경우가 많습니다.\n", 167 | "\n", 168 | "차기: 플레이어는 제기를 발로 차서 공중으로 띄웁니다. 제기가 땅에 떨어지기 전에 다시 차서 계속 공중에 띄워야 합니다.\n", 169 | "\n", 170 | "점수 시스템: 제기를 공중에 얼마나 많이 띄우는지에 따라 점수를 매깁니다. 특정 횟수 이상을 차면 점수를 부여할 수 있습니다.\n", 171 | "\n", 172 | "대결: 여러 명이 함께 제기차기를 하며, 서로의 제기를 방해하거나 더 높은 점수를 내는 방식으로 대결할 수 있습니다.\n", 173 | "\n", 174 | "규칙 변형: 지역이나 그룹에 따라 제기차기 방식이나 규칙이 다를 수 있으며, 다양한 변형 규칙이 존재합니다.\n", 175 | "\n", 176 | "제기차기는 신체 운동과 협동심을 기르는 데 도움이 되는 놀이입니다!\n", 177 | "\"\"\"\n", 178 | "\n", 179 | "text_2 =\"\"\"\n", 180 | "식혜는 한국의 전통적인 단 음료로, 주로 명절이나 특별한 날에 즐겨 먹습니다. 식혜 만드는 방법은 다음과 같습니다:\n", 181 | "\n", 182 | "재료\n", 183 | "찹쌀: 1컵\n", 184 | "물: 6컵\n", 185 | "엿기름: 1/2컵 (또는 엿기름 가루)\n", 186 | "설탕: 1/2컵 (취향에 따라 조절)\n", 187 | "소금: 약간\n", 188 | "계피: (선택 사항)\n", 189 | "생강: (선택 사항)\n", 190 | "만들기\n", 191 | "찹쌀 준비: 찹쌀을 깨끗이 씻어 3-4시간 정도 불립니다. 불린 찹쌀은 체에 받쳐 물기를 빼둡니다.\n", 192 | "\n", 193 | "엿기름 추출: 엿기름을 물에 담가 1시간 정도 우려냅니다. 우린 물은 따로 준비해 두고 엿기름은 체에 걸러서 버립니다.\n", 194 | "\n", 195 | "찹쌀 찌기: 불린 찹쌀을 찜통에 넣고 20-30분 정도 쪄서 익힙니다. 완전히 익힌 후에는 식혀 둡니다.\n", 196 | "\n", 197 | "조리: 큰 냄비에 엿기름 물, 물 6컵을 넣고 끓입니다. 끓어오르면 불을 줄이고, 식힌 찹쌀을 넣습니다. 약한 불에서 30분 정도 끓입니다.\n", 198 | "\n", 199 | "설탕과 소금 추가: 끓인 후 설탕과 소금을 넣고, 다시 약한 불에서 10분 정도 더 끓입니다. 이때 계피나 생강을 추가하면 향이 더해집니다.\n", 200 | "\n", 201 | "식히기: 식혜가 완성되면 체에 걸러서 고운 식혜를 만듭니다. 체에 걸러낸 찹쌀은 다른 요리에 활용할 수 있습니다.\n", 202 | "\n", 203 | "냉장 보관: 식혜는 냉장고에 보관하면 더욱 맛있게 즐길 수 있습니다. 차갑게 해서 마시면 좋습니다!\"\"\"\n", 204 | "\n", 205 | "text_3 =\"\"\"\n", 206 | "스타크래프트(StarCraft)는 블리자드 엔터테인먼트가 개발한 실시간 전략(RTS) 게임으로, 1998년에 처음 출시되었습니다. 이 게임은 주로 미래의 우주 전쟁을 배경으로 하며, 세 가지 종족인 테란(Terran), 저그(Zerg), 프로토스(Protoss) 간의 전투를 중심으로 진행됩니다. 주요 특징은 다음과 같습니다:\n", 207 | "\n", 208 | "주요 특징\n", 209 | "종족:\n", 210 | "\n", 211 | "테란: 인간 기반의 종족으로, 기계적 유닛과 다양한 건물을 사용합니다. 전략적인 방어와 기동성이 강점입니다.\n", 212 | "저그: 생물학적 유닛으로 구성된 종족으로, 빠른 생산 속도와 대규모 군대를 특징으로 합니다. 유연한 전술이 가능합니다.\n", 213 | "프로토스: 고도로 발달된 외계 종족으로, 강력한 기술과 방어력을 가진 유닛을 보유하고 있습니다. 자원 관리가 중요합니다.\n", 214 | "게임 모드:\n", 215 | "\n", 216 | "싱글 플레이어: 캠페인 모드에서 스토리를 따라 미션을 수행합니다.\n", 217 | "멀티 플레이어: 다른 플레이어와 대결하거나 팀을 이루어 경쟁하는 방식입니다. e스포츠 대회도 활발하게 열립니다.\n", 218 | "전략: 자원 관리, 유닛 생산, 기술 개발, 전투 전략 등을 결합하여 승리를 목표로 합니다. 각 종족의 특성을 잘 활용하는 것이 중요합니다.\n", 219 | "\n", 220 | "e스포츠: 스타크래프트는 e스포츠의 선두주자로, 다양한 대회와 리그가 열리고 있으며, 많은 프로게이머들이 활동하고 있습니다.\n", 221 | "\n", 222 | "확장팩: 스타크래프트는 이후 스타크래프트: 브루드 워와 같은 확장팩이 출시되어 새로운 유닛과 기능을 추가했습니다.\n", 223 | "\n", 224 | "스타크래프트는 그 깊이 있는 전략성과 독창적인 세계관 덕분에 많은 사랑을 받고 있으며, RTS 장르의 대표작으로 자리잡고 있습니다.\n", 225 | "\"\"\"" 226 | ] 227 | }, 228 | { 229 | "cell_type": "code", 230 | "execution_count": 33, 231 | "metadata": {}, 232 | "outputs": [], 233 | "source": [ 234 | "# 문서 데이터셋 생성\n", 235 | "documents = [\n", 236 | " Document(text=text_0),\n", 237 | " Document(text=text_1),\n", 238 | " Document(text=text_2),\n", 239 | " Document(text=text_3)\n", 240 | "]" 241 | ] 242 | }, 243 | { 244 | "cell_type": "markdown", 245 | "metadata": {}, 246 | "source": [ 247 | "## **4. 질의 및 문서 검색**\n", 248 | "- 사용자 질의와 가장 유사한 참고 문서를 검색하고,\n", 249 | "- 검색된 관련 문서를 바탕으로 LLM 모델 응답을 생성" 250 | ] 251 | }, 252 | { 253 | "cell_type": "markdown", 254 | "metadata": {}, 255 | "source": [ 256 | "### 스타크래프트 관련 질의" 257 | ] 258 | }, 259 | { 260 | "cell_type": "code", 261 | "execution_count": 34, 262 | "metadata": {}, 263 | "outputs": [ 264 | { 265 | "name": "stdout", 266 | "output_type": "stream", 267 | "text": [ 268 | "질문: 스타크래프트 종족별 특징에 대해 알려줘\n", 269 | "관련 문서: ['\\n스타크래프트(StarCraft)는 블리자드 엔터테인먼트가 개발한 실시간 전략(RTS) 게임으로, 1998년에 처음 출시되었습니다. 이 게임은 주로 미래의 우주 전쟁을 배경으로 하며, 세 가지 종족인 테란(Terran), 저그(Zerg), 프로토스(Protoss) 간의 전투를 중심으로 진행됩니다. 주요 특징은 다음과 같습니다:\\n\\n주요 특징\\n종족:\\n\\n테란: 인간 기반의 종족으로, 기계적 유닛과 다양한 건물을 사용합니다. 전략적인 방어와 기동성이 강점입니다.\\n저그: 생물학적 유닛으로 구성된 종족으로, 빠른 생산 속도와 대규모 군대를 특징으로 합니다. 유연한 전술이 가능합니다.\\n프로토스: 고도로 발달된 외계 종족으로, 강력한 기술과 방어력을 가진 유닛을 보유하고 있습니다. 자원 관리가 중요합니다.\\n게임 모드:\\n\\n싱글 플레이어: 캠페인 모드에서 스토리를 따라 미션을 수행합니다.\\n멀티 플레이어: 다른 플레이어와 대결하거나 팀을 이루어 경쟁하는 방식입니다. e스포츠 대회도 활발하게 열립니다.\\n전략: 자원 관리, 유닛 생산, 기술 개발, 전투 전략 등을 결합하여 승리를 목표로 합니다. 각 종족의 특성을 잘 활용하는 것이 중요합니다.\\n\\ne스포츠: 스타크래프트는 e스포츠의 선두주자로, 다양한 대회와 리그가 열리고 있으며, 많은 프로게이머들이 활동하고 있습니다.\\n\\n확장팩: 스타크래프트는 이후 스타크래프트: 브루드 워와 같은 확장팩이 출시되어 새로운 유닛과 기능을 추가했습니다.\\n\\n스타크래프트는 그 깊이 있는 전략성과 독창적인 세계관 덕분에 많은 사랑을 받고 있으며, RTS 장르의 대표작으로 자리잡고 있습니다.\\n', '\\n제기차기는 한국의 전통 놀이로, 주로 어린이들이 즐기는 활동입니다. 제기차기의 기본 규칙은 다음과 같습니다:\\n\\n제기 만들기: 제기는 주로 종이나 천으로 만들어진 둥글고 평평한 물체입니다. 흔히 종이로 만든 제기를 사용하며, 발 아래에 적당한 무게가 있는 경우가 많습니다.\\n\\n차기: 플레이어는 제기를 발로 차서 공중으로 띄웁니다. 제기가 땅에 떨어지기 전에 다시 차서 계속 공중에 띄워야 합니다.\\n\\n점수 시스템: 제기를 공중에 얼마나 많이 띄우는지에 따라 점수를 매깁니다. 특정 횟수 이상을 차면 점수를 부여할 수 있습니다.\\n\\n대결: 여러 명이 함께 제기차기를 하며, 서로의 제기를 방해하거나 더 높은 점수를 내는 방식으로 대결할 수 있습니다.\\n\\n규칙 변형: 지역이나 그룹에 따라 제기차기 방식이나 규칙이 다를 수 있으며, 다양한 변형 규칙이 존재합니다.\\n\\n제기차기는 신체 운동과 협동심을 기르는 데 도움이 되는 놀이입니다!\\n']\n" 270 | ] 271 | } 272 | ], 273 | "source": [ 274 | "query = \"스타크래프트 종족별 특징에 대해 알려줘\"\n", 275 | "related_docs = search_related_docs(embedding_model, query, documents)\n", 276 | "print(\"질문:\", query)\n", 277 | "print(\"관련 문서:\", related_docs)" 278 | ] 279 | }, 280 | { 281 | "cell_type": "code", 282 | "execution_count": 35, 283 | "metadata": {}, 284 | "outputs": [ 285 | { 286 | "data": { 287 | "text/markdown": [ 288 | "## 스타크래프트 종족별 특징 및 정보 \n", 289 | "\n", 290 | "**1. 테란 (Terran):** 인간 종족으로, **기계적 유닛과 다양한 건물을 활용**합니다. 🤖💪 \n", 291 | "\n", 292 | " * **강점:** 전략적인 방어와 기동성이 우수하며, 여러 가지 기술과 유닛들을 사용하여 적극적으로 공격하고 방어할 수 있습니다.\n", 293 | " * **특징:**\n", 294 | " * **인간적인 지휘**: 인공지능을 활용한 다양한 기술로 전략적인 플레이와 실제 상황을 고려하는 경험이 풍부합니다. 🧠 \n", 295 | " * **기계적 강점**: 주력 유닛은 기계적으로 효율적인 공격과 지원 기능을 가집니다.\n", 296 | " * **대규모 군사:** 다양한 전문 지휘관을 통해 병사의 효율성과 공격력을 높여줍니다. ⚔️\n", 297 | "\n", 298 | "**2. 저그 (Zerg):** 생물학적 유닛으로 구성된 종족입니다. 🦠💥 \n", 299 | " * **강점:** 빠른 생산 속도와 대규모 군대를 특징으로 합니다. ⚡️💪 \n", 300 | " * **특징:**\n", 301 | " * **생물학적 강점**: 공격적인 전투 스타일을 통해 적의 유닛을 파괴하고 진행할 수 있습니다. 💥 \n", 302 | " * **공격력**: 생리적으로 능률적이고 폭발적인 공격력으로 상대방을 빠르게 공격합니다. 💣 \n", 303 | "\n", 304 | "**3. 프로토스 (Protoss):** 고도로 발달된 외계 종족입니다. 🌟🌌 \n", 305 | " * **강점:** 강력한 기술과 방어력을 가진 유닛을 보유하고 있습니다. 🛡️💪 \n", 306 | " * **특징:**\n", 307 | " * **지속적인 상대방**: 장기 전투를 통해 생존 확률을 높일 수 있습니다. ⏳\n", 308 | " * **자원 관리**: 전략적 조절과 끊임없는 개발 노력이 필요합니다. ⚙️ \n", 309 | "\n", 310 | "**4. 스타크래프트 종족 특징 요약:**\n", 311 | "\n", 312 | "| 종족 | 유닛 & 기술 | 강점 | 특징 | \n", 313 | "|---|---|---|---| \n", 314 | "| 테란 | 기계적 유닛, 다양한 건물 | 전략적인 방어/기동성 | 인간 지휘와 기술을 활용해 승리 |\n", 315 | "| 저그 | 생물학적 유닛 | 빠른 생산 속도 & 대규모 군대 | 공격적인 전투 스타일 | \n", 316 | "| 프로토스 | 강력한 기술, 방어력 | 지속적인 상대방 및 자원 관리 | 장기전투와 기술적인 우위 |\n", 317 | "\n", 318 | "\n", 319 | "**5. 스타크래프트의 세계관:**\n", 320 | "\n", 321 | "* **다양한 배경 & 역사**: 세 가지 종족 간의 전쟁과 이를 배경으로 한 이야기들이 있습니다.\n", 322 | "* **자연스러운 대결**: 다른 종족들과의 격렬한 전투는 게임을 더욱 매력적인 경험으로 만들어줍니다.\n", 323 | "\n", 324 | "\n", 325 | "\n", 326 | "**6. 스타크래프트는:**\n", 327 | "\n", 328 | "* **RTS 장르의 선두주자:** 다양한 플레이어들을 위한 흥미로운 게임 경험을 제공합니다.\n", 329 | "* **강력한 전략 게임:** 여러 가지 요소를 조절하고 전략적으로 진행해야 하는 게임입니다.\n", 330 | "\n", 331 | "\n", 332 | "**7. 추가 정보**:\n", 333 | "\n", 334 | "* 스타크래프트의 세계관은 매우 풍부하여 다양한 이야기를 통해 만성적인 경험을 제공합니다.\n", 335 | "* 끊임없이 개발되는 스타크래프트는 장기적 관점에서도 게임의 지속 가능성이 높습니다.\n", 336 | "\n", 337 | "\n", 338 | "\n" 339 | ], 340 | "text/plain": [ 341 | "" 342 | ] 343 | }, 344 | "execution_count": 35, 345 | "metadata": {}, 346 | "output_type": "execute_result" 347 | } 348 | ], 349 | "source": [ 350 | "response = llm.predict(f\"질문: {query}\\n관련 문서: {', '.join(related_docs)}\\n응답:\")\n", 351 | "Markdown(response)" 352 | ] 353 | }, 354 | { 355 | "cell_type": "markdown", 356 | "metadata": {}, 357 | "source": [ 358 | "### 윷놀이 관련 질의" 359 | ] 360 | }, 361 | { 362 | "cell_type": "code", 363 | "execution_count": 36, 364 | "metadata": {}, 365 | "outputs": [ 366 | { 367 | "name": "stdout", 368 | "output_type": "stream", 369 | "text": [ 370 | "질문: 윷놀이에서 상대방 말을 잡으면 어떻게 돼?\n", 371 | "관련 문서: ['\\n윷놀이 규칙\\n1. 준비물\\n\\n윷: 앞뒤가 다른 네 개의 막대.\\n윷판: 원형 모양의 판, 중앙으로 가는 지름길이 있습니다.\\n말: 각 팀이 사용할 말 4개.\\n2. 플레이어\\n\\n최소 2명에서 4명까지 팀을 이루어 플레이합니다.\\n3. 윷 던지기 윷은 네 개의 막대로 구성되어 있으며, 던진 결과에 따라 다음과 같은 점수를 얻습니다:\\n\\n도: 1칸 이동 (1개만 뒤집힘)\\n개: 2칸 이동 (2개 뒤집힘)\\n걸: 3칸 이동 (3개 뒤집힘)\\n윷: 4칸 이동 (4개 모두 뒤집힘)\\n모: 5칸 이동 (모두 안 뒤집힘)\\n4. 말 이동\\n\\n윷이나 모가 나오면 한 번 더 던질 수 있습니다.\\n말을 이동시키며, 자신의 말 4개가 모두 완주하면 승리합니다.\\n5. 말 업기\\n\\n같은 팀의 말이 한 칸에 모이면 말 업기가 가능합니다. 업힌 말은 함께 이동합니다.\\n6. 잡기\\n\\n상대방의 말을 잡으면, 상대방 말은 시작점으로 돌아갑니다. 잡은 플레이어는 한 번 더 윷을 던집니다.\\n7. 승리 조건\\n\\n자신의 말 4개를 모두 완주시키면 승리합니다.\\n특별 규칙\\n지름길: 중앙으로 가는 지름길을 통해 빠르게 이동할 수 있습니다.\\n말의 이동 선택: 윷을 던질 때, 여러 개의 말 중 어느 말이 이동할지 선택할 수 있습니다.\\n윷놀이는 간단하면서도 전략적인 게임으로, 운과 실력을 모두 요구하는 한국 전통 놀이입니다.', '\\n제기차기는 한국의 전통 놀이로, 주로 어린이들이 즐기는 활동입니다. 제기차기의 기본 규칙은 다음과 같습니다:\\n\\n제기 만들기: 제기는 주로 종이나 천으로 만들어진 둥글고 평평한 물체입니다. 흔히 종이로 만든 제기를 사용하며, 발 아래에 적당한 무게가 있는 경우가 많습니다.\\n\\n차기: 플레이어는 제기를 발로 차서 공중으로 띄웁니다. 제기가 땅에 떨어지기 전에 다시 차서 계속 공중에 띄워야 합니다.\\n\\n점수 시스템: 제기를 공중에 얼마나 많이 띄우는지에 따라 점수를 매깁니다. 특정 횟수 이상을 차면 점수를 부여할 수 있습니다.\\n\\n대결: 여러 명이 함께 제기차기를 하며, 서로의 제기를 방해하거나 더 높은 점수를 내는 방식으로 대결할 수 있습니다.\\n\\n규칙 변형: 지역이나 그룹에 따라 제기차기 방식이나 규칙이 다를 수 있으며, 다양한 변형 규칙이 존재합니다.\\n\\n제기차기는 신체 운동과 협동심을 기르는 데 도움이 되는 놀이입니다!\\n']\n" 372 | ] 373 | } 374 | ], 375 | "source": [ 376 | "query = \"윷놀이에서 상대방 말을 잡으면 어떻게 돼?\"\n", 377 | "related_docs = search_related_docs(embedding_model, query, documents)\n", 378 | "print(\"질문:\", query)\n", 379 | "print(\"관련 문서:\", related_docs)" 380 | ] 381 | }, 382 | { 383 | "cell_type": "code", 384 | "execution_count": 37, 385 | "metadata": {}, 386 | "outputs": [ 387 | { 388 | "data": { 389 | "text/markdown": [ 390 | "윷놀이는 상대방 말을 잡으면 **상대방의 말은 시작점으로 돌아갑니다.** 그리고 잡은 플레이어는 한 번 더 윷을 던집니다. \n", 391 | "\n", 392 | "\n", 393 | "\n", 394 | "\n", 395 | "**추가 정보:** \n", 396 | "\n", 397 | "\n", 398 | "* 잡기는 윷놀이에서 중요한 요소입니다.\n", 399 | "* 잡기를 통해 상대방의 말을 획득하여 점수를 얻는 방법을 학습하고 실력을 향상할 수 있습니다. \n", 400 | "\n", 401 | "\n", 402 | "\n" 403 | ], 404 | "text/plain": [ 405 | "" 406 | ] 407 | }, 408 | "execution_count": 37, 409 | "metadata": {}, 410 | "output_type": "execute_result" 411 | } 412 | ], 413 | "source": [ 414 | "response = llm.predict(f\"질문: {query}\\n관련 문서: {', '.join(related_docs)}\\n응답:\")\n", 415 | "Markdown(response)" 416 | ] 417 | } 418 | ], 419 | "metadata": { 420 | "kernelspec": { 421 | "display_name": "base", 422 | "language": "python", 423 | "name": "python3" 424 | }, 425 | "language_info": { 426 | "codemirror_mode": { 427 | "name": "ipython", 428 | "version": 3 429 | }, 430 | "file_extension": ".py", 431 | "mimetype": "text/x-python", 432 | "name": "python", 433 | "nbconvert_exporter": "python", 434 | "pygments_lexer": "ipython3", 435 | "version": "3.12.4" 436 | } 437 | }, 438 | "nbformat": 4, 439 | "nbformat_minor": 2 440 | } 441 | -------------------------------------------------------------------------------- /OpenAI/OpenAI_API_call.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "nbformat": 4, 3 | "nbformat_minor": 0, 4 | "metadata": { 5 | "colab": { 6 | "provenance": [], 7 | "authorship_tag": "ABX9TyMVpIolARZBJitDhhsBoEZO", 8 | "include_colab_link": true 9 | }, 10 | "kernelspec": { 11 | "name": "python3", 12 | "display_name": "Python 3" 13 | }, 14 | "language_info": { 15 | "name": "python" 16 | } 17 | }, 18 | "cells": [ 19 | { 20 | "cell_type": "markdown", 21 | "metadata": { 22 | "id": "view-in-github", 23 | "colab_type": "text" 24 | }, 25 | "source": [ 26 | "\"Open" 27 | ] 28 | }, 29 | { 30 | "cell_type": "markdown", 31 | "source": [ 32 | "# **OpenAI API Call**\n", 33 | "\n", 34 | "**OpenAI**의 **Chat API**를 호출해 보는 간단한 실습 코드입니다." 35 | ], 36 | "metadata": { 37 | "id": "IGSKG41yelP_" 38 | } 39 | }, 40 | { 41 | "cell_type": "markdown", 42 | "source": [ 43 | "## **1. 환경 세팅**\n", 44 | "- OpenAI 라이브러리 설치\n", 45 | "- API Key 입력" 46 | ], 47 | "metadata": { 48 | "id": "cml80vUosW3m" 49 | } 50 | }, 51 | { 52 | "cell_type": "code", 53 | "execution_count": null, 54 | "metadata": { 55 | "colab": { 56 | "base_uri": "https://localhost:8080/" 57 | }, 58 | "id": "Lg9EMEGXsK09", 59 | "outputId": "863c5e04-4eff-4e53-94a2-1e689c5a280b" 60 | }, 61 | "outputs": [ 62 | { 63 | "output_type": "stream", 64 | "name": "stdout", 65 | "text": [ 66 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m374.1/374.1 kB\u001b[0m \u001b[31m3.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 67 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m76.4/76.4 kB\u001b[0m \u001b[31m3.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 68 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m77.9/77.9 kB\u001b[0m \u001b[31m3.5 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 69 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m318.9/318.9 kB\u001b[0m \u001b[31m14.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 70 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m58.3/58.3 kB\u001b[0m \u001b[31m723.7 kB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 71 | "\u001b[?25h" 72 | ] 73 | } 74 | ], 75 | "source": [ 76 | "!pip -q install openai" 77 | ] 78 | }, 79 | { 80 | "cell_type": "code", 81 | "source": [ 82 | "from openai import OpenAI\n", 83 | "import os\n", 84 | "from getpass import getpass\n", 85 | "\n", 86 | "# Colab에 API 키를 안전하게 입력받기\n", 87 | "api_key = getpass(\"OpenAI API 키를 입력하세요: \")\n", 88 | "\n", 89 | "# API 키를 환경 변수에 저장\n", 90 | "os.environ['OPENAI_API_KEY'] = api_key" 91 | ], 92 | "metadata": { 93 | "id": "QmIPe8Kvsjav" 94 | }, 95 | "execution_count": null, 96 | "outputs": [] 97 | }, 98 | { 99 | "cell_type": "markdown", 100 | "source": [ 101 | "## **2. OpenAI API 호출 함수**\n", 102 | "- model, message, temperatue, max_tokens를 입력받음" 103 | ], 104 | "metadata": { 105 | "id": "I_Z8rtgr0KGV" 106 | } 107 | }, 108 | { 109 | "cell_type": "code", 110 | "source": [ 111 | "def create_chat_completion(system_input, user_input, model=\"gpt-4o-mini\", temperature=1.15, max_tokens=150):\n", 112 | " try:\n", 113 | " # 메시지 목록을 자동으로 생성해요\n", 114 | " messages = [\n", 115 | " {\"role\": \"system\", \"content\": system_input},\n", 116 | " {\"role\": \"user\", \"content\": user_input}\n", 117 | " ]\n", 118 | "\n", 119 | " response = OpenAI().chat.completions.create(\n", 120 | " model=model,\n", 121 | " messages=messages,\n", 122 | " temperature=temperature,\n", 123 | " max_tokens=max_tokens # 최대 토큰 수를 지정해요\n", 124 | " )\n", 125 | " # 생성된 응답을 반환해요\n", 126 | " return response\n", 127 | " except Exception as e:\n", 128 | " return f\"Error: {str(e)}\"\n" 129 | ], 130 | "metadata": { 131 | "id": "mhT4Uf8-sWj1" 132 | }, 133 | "execution_count": null, 134 | "outputs": [] 135 | }, 136 | { 137 | "cell_type": "code", 138 | "source": [ 139 | "# 메시지 입력\n", 140 | "system_input = \"넌 AI 전문 강사아. AI, 개발에 관련된 질문에만 친절하고 간략하게 답변해줘\"\n", 141 | "user_input = \"LLM으로 무엇을 할 수 있는지 설명해줘.\"\n", 142 | "\n", 143 | "# API 호출 및 결과 출력\n", 144 | "responses = create_chat_completion(system_input, user_input)\n", 145 | "responses" 146 | ], 147 | "metadata": { 148 | "colab": { 149 | "base_uri": "https://localhost:8080/" 150 | }, 151 | "id": "T_hic1hmsWhj", 152 | "outputId": "327e7dff-d2a2-430c-d945-1fb8ab370717" 153 | }, 154 | "execution_count": null, 155 | "outputs": [ 156 | { 157 | "output_type": "execute_result", 158 | "data": { 159 | "text/plain": [ 160 | "ChatCompletion(id='chatcmpl-A7eyRHqCz0wULxRMJ63iq2NrG8Swi', choices=[Choice(finish_reason='length', index=0, logprobs=None, message=ChatCompletionMessage(content='LLM(대형 언어 모델)은 다음과 같은 다양한 용도로 활용할 수 있습니다:\\n\\n1. **텍스트 생성**: 이야기, 기사, 시 등 다양한 유형의 글을 생성할 수 있습니다.\\n2. **질문 답변**: 특정 주제에 대한 질문에 대해 신속하게 답변할 수 있습니다.\\n3. **언어 번역**: 여러 언어 간의 번역을 지원합니다.\\n4. **대화형 인터페이스**: 챗봇 및 가상 비서와 같은 애플리케이션에 통합되어 사용자와 대화할 수 있습니다.\\n5. **텍스트 요약**: 긴 문서나 기사를 간결하게 요약합니다', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1726389163, model='gpt-4o-mini-2024-07-18', object='chat.completion', service_tier=None, system_fingerprint='fp_483d39d857', usage=CompletionUsage(completion_tokens=150, prompt_tokens=51, total_tokens=201, completion_tokens_details=CompletionTokensDetails(reasoning_tokens=0)))" 161 | ] 162 | }, 163 | "metadata": {}, 164 | "execution_count": 30 165 | } 166 | ] 167 | }, 168 | { 169 | "cell_type": "code", 170 | "source": [ 171 | "responses.choices[0].message.content" 172 | ], 173 | "metadata": { 174 | "colab": { 175 | "base_uri": "https://localhost:8080/", 176 | "height": 72 177 | }, 178 | "id": "ZtbfnGbJsWUS", 179 | "outputId": "27c735da-42b9-4bfe-e56f-300f30ac9aae" 180 | }, 181 | "execution_count": null, 182 | "outputs": [ 183 | { 184 | "output_type": "execute_result", 185 | "data": { 186 | "text/plain": [ 187 | "'LLM(대형 언어 모델)은 다음과 같은 다양한 용도로 활용할 수 있습니다:\\n\\n1. **텍스트 생성**: 이야기, 기사, 시 등 다양한 유형의 글을 생성할 수 있습니다.\\n2. **질문 답변**: 특정 주제에 대한 질문에 대해 신속하게 답변할 수 있습니다.\\n3. **언어 번역**: 여러 언어 간의 번역을 지원합니다.\\n4. **대화형 인터페이스**: 챗봇 및 가상 비서와 같은 애플리케이션에 통합되어 사용자와 대화할 수 있습니다.\\n5. **텍스트 요약**: 긴 문서나 기사를 간결하게 요약합니다'" 188 | ], 189 | "application/vnd.google.colaboratory.intrinsic+json": { 190 | "type": "string" 191 | } 192 | }, 193 | "metadata": {}, 194 | "execution_count": 32 195 | } 196 | ] 197 | } 198 | ] 199 | } -------------------------------------------------------------------------------- /OpenAI/OpenAI_RAG_Llama_index.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "nbformat": 4, 3 | "nbformat_minor": 0, 4 | "metadata": { 5 | "colab": { 6 | "provenance": [], 7 | "authorship_tag": "ABX9TyMubx/7mnlQDfzIK11SZY30", 8 | "include_colab_link": true 9 | }, 10 | "kernelspec": { 11 | "name": "python3", 12 | "display_name": "Python 3" 13 | }, 14 | "language_info": { 15 | "name": "python" 16 | } 17 | }, 18 | "cells": [ 19 | { 20 | "cell_type": "markdown", 21 | "metadata": { 22 | "id": "view-in-github", 23 | "colab_type": "text" 24 | }, 25 | "source": [ 26 | "\"Open" 27 | ] 28 | }, 29 | { 30 | "cell_type": "markdown", 31 | "source": [ 32 | "# **OpenAI와 Llama-index를 이용한 RAG 실습**\n", 33 | "\n", 34 | "**OpenAI**와 **Llama-index**를 이용한, 조금 더 다양한 기능의 **RAG** 기능을 구현해보는 실습 코드입니다." 35 | ], 36 | "metadata": { 37 | "id": "IgzEw-9FeGka" 38 | } 39 | }, 40 | { 41 | "cell_type": "markdown", 42 | "source": [ 43 | "## **1. 환경 세팅**\n", 44 | "- 필요 라이브러리 설치\n", 45 | "- API Key 입력\n", 46 | "- 구글 드라이브 마운트" 47 | ], 48 | "metadata": { 49 | "id": "cml80vUosW3m" 50 | } 51 | }, 52 | { 53 | "cell_type": "code", 54 | "source": [ 55 | "!pip install -q openai llama-index llama-index-vector-stores-chroma" 56 | ], 57 | "metadata": { 58 | "id": "igHt8WP8SLxc", 59 | "colab": { 60 | "base_uri": "https://localhost:8080/" 61 | }, 62 | "outputId": "48572a96-b3f6-4c3b-ba48-4a8b0df8357f" 63 | }, 64 | "execution_count": null, 65 | "outputs": [ 66 | { 67 | "output_type": "stream", 68 | "name": "stdout", 69 | "text": [ 70 | "\u001b[?25l \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m0.0/67.3 kB\u001b[0m \u001b[31m?\u001b[0m eta \u001b[36m-:--:--\u001b[0m\r\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m67.3/67.3 kB\u001b[0m \u001b[31m3.1 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 71 | "\u001b[?25h Installing build dependencies ... \u001b[?25l\u001b[?25hdone\n", 72 | " Getting requirements to build wheel ... \u001b[?25l\u001b[?25hdone\n", 73 | " Preparing metadata (pyproject.toml) ... \u001b[?25l\u001b[?25hdone\n", 74 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m50.4/50.4 kB\u001b[0m \u001b[31m1.5 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 75 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m374.2/374.2 kB\u001b[0m \u001b[31m20.1 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 76 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m584.3/584.3 kB\u001b[0m \u001b[31m29.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 77 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m2.4/2.4 MB\u001b[0m \u001b[31m65.2 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 78 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m76.4/76.4 kB\u001b[0m \u001b[31m4.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 79 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m77.9/77.9 kB\u001b[0m \u001b[31m5.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 80 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m318.9/318.9 kB\u001b[0m \u001b[31m20.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 81 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m1.6/1.6 MB\u001b[0m \u001b[31m55.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 82 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m1.2/1.2 MB\u001b[0m \u001b[31m52.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 83 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m1.5/1.5 MB\u001b[0m \u001b[31m51.1 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 84 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m273.8/273.8 kB\u001b[0m \u001b[31m14.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 85 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m94.0/94.0 kB\u001b[0m \u001b[31m4.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 86 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m1.7/1.7 MB\u001b[0m \u001b[31m42.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 87 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m187.4/187.4 kB\u001b[0m \u001b[31m11.3 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 88 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m67.6/67.6 kB\u001b[0m \u001b[31m4.2 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 89 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m13.2/13.2 MB\u001b[0m \u001b[31m84.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 90 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m64.0/64.0 kB\u001b[0m \u001b[31m3.8 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 91 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m52.5/52.5 kB\u001b[0m \u001b[31m3.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 92 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m149.7/149.7 kB\u001b[0m \u001b[31m9.3 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 93 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m110.5/110.5 kB\u001b[0m \u001b[31m6.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 94 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m141.9/141.9 kB\u001b[0m \u001b[31m8.3 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 95 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m54.3/54.3 kB\u001b[0m \u001b[31m3.3 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 96 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m295.8/295.8 kB\u001b[0m \u001b[31m16.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 97 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m1.1/1.1 MB\u001b[0m \u001b[31m41.1 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 98 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m62.8/62.8 kB\u001b[0m \u001b[31m4.2 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 99 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m58.3/58.3 kB\u001b[0m \u001b[31m3.2 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 100 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m341.4/341.4 kB\u001b[0m \u001b[31m21.1 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 101 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m49.3/49.3 kB\u001b[0m \u001b[31m2.9 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 102 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m71.4/71.4 kB\u001b[0m \u001b[31m4.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 103 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m3.4/3.4 MB\u001b[0m \u001b[31m77.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 104 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m425.7/425.7 kB\u001b[0m \u001b[31m22.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 105 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m157.3/157.3 kB\u001b[0m \u001b[31m10.4 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 106 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m46.0/46.0 kB\u001b[0m \u001b[31m2.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 107 | "\u001b[2K \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m86.8/86.8 kB\u001b[0m \u001b[31m6.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n", 108 | "\u001b[?25h Building wheel for pypika (pyproject.toml) ... \u001b[?25l\u001b[?25hdone\n" 109 | ] 110 | } 111 | ] 112 | }, 113 | { 114 | "cell_type": "code", 115 | "source": [ 116 | "from getpass import getpass\n", 117 | "import os\n", 118 | "from openai import OpenAI\n", 119 | "import chromadb\n", 120 | "from chromadb.utils.embedding_functions import OpenAIEmbeddingFunction\n", 121 | "from IPython.display import Markdown, display\n", 122 | "from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, StorageContext, get_response_synthesizer\n", 123 | "from llama_index.core.retrievers import VectorIndexRetriever\n", 124 | "from llama_index.core.query_engine import RetrieverQueryEngine\n", 125 | "from llama_index.core.postprocessor import SimilarityPostprocessor\n", 126 | "from llama_index.vector_stores.chroma import ChromaVectorStore\n", 127 | "from llama_index.embeddings.openai import OpenAIEmbedding" 128 | ], 129 | "metadata": { 130 | "id": "71WAf2fMVKI4" 131 | }, 132 | "execution_count": null, 133 | "outputs": [] 134 | }, 135 | { 136 | "cell_type": "code", 137 | "source": [ 138 | "# Colab에 API 키를 안전하게 입력받기\n", 139 | "api_key = getpass(\"OpenAI API 키를 입력하세요: \")\n", 140 | "os.environ['OPENAI_API_KEY'] = api_key" 141 | ], 142 | "metadata": { 143 | "colab": { 144 | "base_uri": "https://localhost:8080/" 145 | }, 146 | "id": "QmIPe8Kvsjav", 147 | "outputId": "b0593bdc-a09f-4832-b125-9557113adbc8" 148 | }, 149 | "execution_count": null, 150 | "outputs": [ 151 | { 152 | "name": "stdout", 153 | "output_type": "stream", 154 | "text": [ 155 | "OpenAI API 키를 입력하세요: ··········\n" 156 | ] 157 | } 158 | ] 159 | }, 160 | { 161 | "cell_type": "code", 162 | "source": [ 163 | "from google.colab import drive\n", 164 | "drive.mount('/content/drive')" 165 | ], 166 | "metadata": { 167 | "colab": { 168 | "base_uri": "https://localhost:8080/" 169 | }, 170 | "id": "E87KkLX5VIIx", 171 | "outputId": "02f9d032-bb7a-4f43-ee1f-8f0ca716be5e" 172 | }, 173 | "execution_count": null, 174 | "outputs": [ 175 | { 176 | "output_type": "stream", 177 | "name": "stdout", 178 | "text": [ 179 | "Mounted at /content/drive\n" 180 | ] 181 | } 182 | ] 183 | }, 184 | { 185 | "cell_type": "markdown", 186 | "source": [ 187 | "## **2. 기본 예제**\n", 188 | "- 지정된 디렉토리에서 문서를 읽고, 이 문서들로부터 `VectorStoreIndex`를 생성하고, 이 인덱스를 쿼리 엔진으로 변환하여 입력된 쿼리와 관련된 정보를 검색하는 **가장 기본적인 예제**\n", 189 | "- 별도의 임베딩 모델이나 ChromaDB 같은 외부 벡터 저장소를 지정하지 않기 때문에 세밀한 조정은 불가능." 190 | ], 191 | "metadata": { 192 | "id": "uD6KA2m4W7Zu" 193 | } 194 | }, 195 | { 196 | "cell_type": "code", 197 | "source": [ 198 | "# RAG 참조 문서 디렉토리 지정 (각자 지정 필요)\n", 199 | "documents_dir = '/content/drive/MyDrive/코드 예제/LLM/ref_docs_2'" 200 | ], 201 | "metadata": { 202 | "id": "q-4tnJON5SFX" 203 | }, 204 | "execution_count": null, 205 | "outputs": [] 206 | }, 207 | { 208 | "cell_type": "code", 209 | "source": [ 210 | "# 문서를 읽어와 인덱스를 생성하고, 간단한 쿼리 엔진으로 검색하는 기본 예제입니다.\n", 211 | "documents = SimpleDirectoryReader(documents_dir).load_data()\n", 212 | "index = VectorStoreIndex.from_documents(documents)" 213 | ], 214 | "metadata": { 215 | "id": "OZsVKc9mS40S" 216 | }, 217 | "execution_count": null, 218 | "outputs": [] 219 | }, 220 | { 221 | "cell_type": "code", 222 | "source": [ 223 | "# 인덱스를 사용해 간단한 쿼리 엔진을 생성합니다.\n", 224 | "query_engine = index.as_query_engine()\n", 225 | "\n", 226 | "response = query_engine.query(\"KBO 한국 시리즈에서 우승하지 못한 팀을 알려줘\")\n", 227 | "display(Markdown(f\"{response}\"))" 228 | ], 229 | "metadata": { 230 | "colab": { 231 | "base_uri": "https://localhost:8080/" 232 | }, 233 | "id": "U2400DQuS_VM", 234 | "outputId": "505cbca1-cfd8-4ae8-c4e6-6cc5dae03a4c" 235 | }, 236 | "execution_count": null, 237 | "outputs": [ 238 | { 239 | "output_type": "stream", 240 | "name": "stdout", 241 | "text": [ 242 | "삼성 라이온즈\n" 243 | ] 244 | } 245 | ] 246 | }, 247 | { 248 | "cell_type": "markdown", 249 | "source": [ 250 | "## **3. ChromaDB와 OpenAI Embedding 모델 사용 예제**\n", 251 | "\n", 252 | "- 벡터 저장소로 ChromaDB를 통합하고 `OpenAIEmbedding`을 사용하여 커스텀 임베딩 모델을 정의\n", 253 | "- 메모리 상에 ChromaDB 클라이언트와 컬렉션을 초기화하고, `ChromaVectorStore`를 설정하여 데이터를 저장한 후 해당 저장소와 임베딩 모델을 사용하여 인덱스를 생성\n", 254 | "- 기본 예제와 달리, **임베딩 모델**과 **벡터 저장소**를 명시적으로 설정하여 **검색 정확도를 높일 수 있는 방법**" 255 | ], 256 | "metadata": { 257 | "id": "H5Ku_r7MTF_O" 258 | } 259 | }, 260 | { 261 | "cell_type": "code", 262 | "source": [ 263 | "# ChromaDB 클라이언트를 메모리상에 생성하고 새로운 컬렉션을 만듭니다.\n", 264 | "chroma_client = chromadb.EphemeralClient() # 메모리 상에 저장 (세션 간 데이터 유지가 필요 없다면 이 옵션 사용)\n", 265 | "chroma_collection = chroma_client.create_collection(\"quickstart\") # 컬렉션 생성은 최초 1회만 실행합니다." 266 | ], 267 | "metadata": { 268 | "id": "vEpyDRf3THPv" 269 | }, 270 | "execution_count": null, 271 | "outputs": [] 272 | }, 273 | { 274 | "cell_type": "code", 275 | "source": [ 276 | "# OpenAI 임베딩 모델을 정의합니다. (필요에 따라 모델을 변경할 수 있습니다.)\n", 277 | "embed_model = OpenAIEmbedding(model=\"text-embedding-ada-002\")\n", 278 | "\n", 279 | "# 문서들을 지정된 디렉토리에서 불러옵니다.\n", 280 | "documents = SimpleDirectoryReader(documents_dir).load_data()\n", 281 | "\n", 282 | "# ChromaVectorStore를 설정하고 데이터를 저장합니다.\n", 283 | "vector_store = ChromaVectorStore(chroma_collection=chroma_collection)\n", 284 | "storage_context = StorageContext.from_defaults(vector_store=vector_store)\n", 285 | "\n", 286 | "# 문서들로부터 인덱스를 생성합니다. 이때 ChromaDB와 임베딩 모델을 사용합니다.\n", 287 | "index = VectorStoreIndex.from_documents(\n", 288 | " documents, storage_context=storage_context, embed_model=embed_model\n", 289 | ")" 290 | ], 291 | "metadata": { 292 | "id": "_ZEiL7wJwYd2" 293 | }, 294 | "execution_count": null, 295 | "outputs": [] 296 | }, 297 | { 298 | "cell_type": "code", 299 | "source": [ 300 | "# 쿼리 엔진을 사용하여 질문에 답변합니다.\n", 301 | "query_engine = index.as_query_engine()\n", 302 | "\n", 303 | "# 예시 쿼리: 한국 시리즈에서 우승하지 못한 팀을 알려줘\n", 304 | "response = query_engine.query(\"한국 시리즈에서 우승하지 못한 팀을 알려줘\")\n", 305 | "display(Markdown(f\"{response}\"))" 306 | ], 307 | "metadata": { 308 | "colab": { 309 | "base_uri": "https://localhost:8080/", 310 | "height": 46 311 | }, 312 | "id": "VIFycIgDwlaA", 313 | "outputId": "b4e35f0a-9412-4683-de4a-a7948804f91a" 314 | }, 315 | "execution_count": null, 316 | "outputs": [ 317 | { 318 | "output_type": "display_data", 319 | "data": { 320 | "text/plain": [ 321 | "" 322 | ], 323 | "text/markdown": "키움 히어로즈" 324 | }, 325 | "metadata": {} 326 | } 327 | ] 328 | }, 329 | { 330 | "cell_type": "markdown", 331 | "source": [ 332 | "## **4. 고급 검색 및 후처리 사용 예제**\n", 333 | "- 검색 프로세스에 대해 더 세밀한 제어를 제공하는 방법\n", 334 | "- `VectorIndexRetriever`를 설정하여 **`similarity_top_k`** 파라미터 조절\n", 335 | "- `get_response_synthesizer()`를 사용하여 검색된 문서와 쿼리를 합치는 합성기를 정의\n", 336 | "- `SimilarityPostprocessor`의 **`similarity_cutoff`** 로 결과 필터링\n", 337 | "\n", 338 | "- **`similarity_top_k`**\n", 339 | " - 유사한 문서의 개수를 조절\n", 340 | " - 값이 높으면 더 많은 문서를 검색하지만, 불필요한 정보가 포함될 수 있음\n", 341 | "- **`similarity_cutoff`**\n", 342 | " - 검색된 문서 중 유사도가 일정 수준 이상인 것만 포함\n", 343 | " - 값을 낮추면 더 많은 결과를 포함하지만, 정확도가 떨어질 수 있음" 344 | ], 345 | "metadata": { 346 | "id": "aJ9prQ-fTUcX" 347 | } 348 | }, 349 | { 350 | "cell_type": "code", 351 | "source": [ 352 | "# 리트리버를 설정합니다. 'similarity_top_k'로 유사한 문서의 개수를 조절할 수 있습니다.\n", 353 | "retriever = VectorIndexRetriever(\n", 354 | " index=index, # 기존에 생성한 인덱스를 불러옵니다.\n", 355 | " similarity_top_k=10, # 유사한 문서 최대 10개를 선택합니다.\n", 356 | ")\n", 357 | "\n", 358 | "# 검색된 문서와 쿼리를 합성해주는 합성기를 가져옵니다.\n", 359 | "response_synthesizer = get_response_synthesizer()\n", 360 | "\n", 361 | "# 쿼리 엔진을 생성합니다. 후처리 단계에서 'similarity_cutoff'를 설정하여 유사도가 낮은 결과를 필터링할 수 있습니다.\n", 362 | "query_engine = RetrieverQueryEngine(\n", 363 | " retriever=retriever,\n", 364 | " response_synthesizer=response_synthesizer,\n", 365 | " node_postprocessors=[SimilarityPostprocessor(similarity_cutoff=0.1)], # 유사도가 0.1 이하인 결과는 제외\n", 366 | ")" 367 | ], 368 | "metadata": { 369 | "id": "dFdUJrJBTJBQ" 370 | }, 371 | "execution_count": null, 372 | "outputs": [] 373 | }, 374 | { 375 | "cell_type": "code", 376 | "source": [ 377 | "response = query_engine.query(\"KBO에서 가장 유명한 사건 3개를 알려줘\")\n", 378 | "display(Markdown(f\"{response}\"))" 379 | ], 380 | "metadata": { 381 | "colab": { 382 | "base_uri": "https://localhost:8080/", 383 | "height": 64 384 | }, 385 | "id": "uPks9NsRXoT6", 386 | "outputId": "283facf2-8569-4dd7-b10d-b411f0e21f24" 387 | }, 388 | "execution_count": null, 389 | "outputs": [ 390 | { 391 | "output_type": "display_data", 392 | "data": { 393 | "text/plain": [ 394 | "" 395 | ], 396 | "text/markdown": "삼청태, 삼성의 대구 유니폼, 그리고 2023 월드 베이스볼 클래식에서의 이강철호의 3대회 연속 1라운드 탈락이 KBO에서 가장 유명한 사건 3개입니다." 397 | }, 398 | "metadata": {} 399 | } 400 | ] 401 | } 402 | ] 403 | } -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # LLM-Tutorials 2 | 3 | 누구나 쉽게 따라할 수 있는 다양한 LLM(Language Model) 관련 예제를 소개하고 실습할 수 있는 공간입니다. 4 | 5 | 점점 많은 예제를 추가할 예정이니 많은 관심 부탁드립니다 🤗 6 | 7 | ## 📌 OpenAI 8 | - [OpenAI_API_call](OpenAI/OpenAI_API_call.ipynb) [Colab] 9 | - OpenAI API를 사용해 보고 싶다면? 10 | - [OpenAI_RAG_ChatAPI](OpenAI/OpenAI_RAG_ChatAPI.ipynb) [Colab] 11 | - **Chat API**와 **ChromaDB**를 사용하여, 간단한 **RAG** 기능을 구현해보는 예제 12 | - [OpenAI_RAG_Llama_index](OpenAI/OpenAI_RAG_Llama_index.ipynb) [Colab] 13 | - **OpenAI**와 **Llama-index**를 이용한, 조금 더 다양한 기능의 **RAG** 기능을 구현해보는 예제 14 | - **ChromaDB**, **OpenAI Embedding 모델** 사용 15 | - 고급 검색 및 후처리 적용 (**`similarity_top_k`**, **`similarity_cutoff`** 사용) 16 |
17 | 18 | 19 | ## 📌 오픈소스 LLM 20 | ### ✅ Basic Chat 21 | - [huggingface_LLM_chat](Open-source_LLM/basic_chat/huggingface_LLM_chat.ipynb) [Colab] 22 | - Huggingface Open-source LLM으로 **기본적인 질의 응답** 기능을 구현하는 예제 23 | - [langchain_ollama_QnA](Open-source_LLM/basic_chat/langchain_ollama_QnA.ipynb) 24 | - Langchain과 Ollama를 이용하여 기본적인 **Q&A 시스템**을 구현하는 예제 (대화 내용 기억 X) 25 | - [langchain_ollama_chatbot](Open-source_LLM/basic_chat/langchain_ollama_chatbot.ipynb) 26 | - Langchain과 Ollama를 이용하여 **대화형 챗봇**을 구현하는 예제 (대화 내용 기억 O) 27 | - [langchain_ollama_prompting](Open-source_LLM/basic_chat/langchain_ollama_prompting.ipynb) 28 | - Langchain과 Ollama를 이용하여 기본적인 **프롬프트 엔니어링**을 구현하는 예제 29 | 30 | ### ✅ RAG 31 | - [llama-index_huggingface_RAG_basicce_llama-index_RAG_basic](Open-source_LLM/rag/llama-index_huggingface_RAG_basic.ipynb) [Colab] 32 | - llama-index와 **huggingface** LLM을 이용하여 **기본적인 RAG** 기능을 구현하는 예제 33 | - [llama-index_ollama_RAG_basic](Open-source_LLM/rag/llama-index_ollama_RAG_basic.ipynb) 34 | - llama-index와 **ollama** LLM을 이용하여 **기본적인 RAG** 기능을 구현하는 예제 35 |
36 | 37 | 38 | ## 📌 공부 자료 39 | - [LangChain 한국어 튜토리얼](https://github.com/teddylee777/langchain-kr) 40 | - Teddy Lee님이 운영하는 레포지토리로 다양한 랭체인 한국어 튜토리얼을 제공해요 (1.2k stars) 41 | - [Large Language Model Course](https://github.com/mlabonne/llm-course) 42 | - 다양한 LLM 공부 자료와 LLM Scientist, LLM Engineer 로드맵을 제공해요 (38.8k stars) 43 | - [Building A Generative AI Platform](https://huyenchip.com/2024/07/25/genai-platform.html) 44 | - LLM 플랫폼을 구축하는 과정에 대한 포괄적인 설명을 제공하는 포스트예요. 45 | - 이 포스트는 기업들이 생성적 AI 애플리케이션을 어떻게 배포하는지에 대한 공통된 아키텍처와 그 구성 요소들을 다루고 있어요. 46 | - 기본적인 구조에서 출발하여, 필요에 따라 'Enhance Context', 'Put in Guardrails', 'Add Model Router and Gateway', 'Reduce Latency with Cache'와 같은 컴포넌트들을 추가하는 방법을 설명해줘요. 47 | - [Unsloth AI Fine-tuning](https://huggingface.co/unsloth) 48 | - Colab 환경에서 Fine-tuning 예제를 제공하는 Unsloth AI 49 |
50 | 51 | 52 | ## 🙋🏻‍♂️ 추가 설명 53 | - 예제는 구글 코랩 환경과 로컬 주피터 노트북 환경으로 구성되어 있어요. 54 | - 로컬 주피터 노트북 환경의 경우 개발 환경 세팅(라이브러리 설치 등)가 필요합니다. 55 | - Google Colab 환경의 예제는 [Colab] 표기 56 | --------------------------------------------------------------------------------