OpenAI
GPT-4V(ision)를 이용한 이미지 기반 추론 - (Python)
GPT-4V(ision)를 이용한 이미지 기반 추론 - (Python)
2023.12.03이미지 기반 추론은 이미지 내의 객체나 요소들을 기반으로 논리적인 결론이나 추정을 도출하는 과정입니다. GPT-4V를 활용하면, 이미지 내의 정보를 분석하여 구체적인 추론을 수행할 수 있습니다. #1. 필수 패키지 설치 및 준비 GPT-4V를 활용한 이미지 인식 프로젝트를 시작하기 전에, 필요한 Python 패키지들을 설치하고 준비하는 과정이 필요합니다. 1) 패키지 설치 먼저, 필요한 Python 라이브러리를 설치해야 합니다. 이를 위해 Python의 패키지 관리자인 pip를 사용합니다. 다음 명령어를 통해 필요한 패키지들을 설치할 수 있습니다. pip install openai requests pillow matplotlib 이 명령어는 OpenAI의 API를 사용하기 위한 openai, 웹에서 이미..
GPT-4V(ision)를 이용한 얼굴 인식(Face Recognition) - (Python)
GPT-4V(ision)를 이용한 얼굴 인식(Face Recognition) - (Python)
2023.11.27얼굴 인식(Face Recognition)은 이미지 내의 인물을 식별하고 구별하는 기술입니다. GPT-4V를 활용하면, 다양한 이미지에서 특정 인물을 식별하고 관련 정보를 추출하는 것이 가능해집니다. #1. 필수 패키지 설치 및 준비 GPT-4V를 활용한 이미지 인식 프로젝트를 시작하기 전에, 필요한 Python 패키지들을 설치하고 준비하는 과정이 필요합니다. 1) 패키지 설치 먼저, 필요한 Python 라이브러리를 설치해야 합니다. 이를 위해 Python의 패키지 관리자인 pip를 사용합니다. 다음 명령어를 통해 필요한 패키지들을 설치할 수 있습니다. pip install openai requests pillow matplotlib 이 명령어는 OpenAI의 API를 사용하기 위한 openai, 웹에서..
GPT-4V(ision)를 이용한 OCR - (Python)
GPT-4V(ision)를 이용한 OCR - (Python)
2023.11.26이번 글에서는 GPT-4V를 활용한 OCR에 대해 알아보겠습니다. OCR (Optical Character Recognition)은 이미지에서 텍스트를 추출하고 인식하는 기술입니다. 이 기술은 문서 스캔, 명함 인식, 자동 번호판 인식 등 다양한 분야에서 활용됩니다. GPT-4V를 이용하면, 이미지 내의 텍스트를 효과적으로 추출하고 처리할 수 있습니다. #1. 필수 패키지 설치 및 준비 GPT-4V를 활용한 이미지 인식 프로젝트를 시작하기 전에, 필요한 Python 패키지들을 설치하고 준비하는 과정이 필요합니다. 1) 패키지 설치 먼저, 필요한 Python 라이브러리를 설치해야 합니다. 이를 위해 Python의 패키지 관리자인 pip를 사용합니다. 다음 명령어를 통해 필요한 패키지들을 설치할 수 있습니다..
GPT-4V(ision)를 이용한 객체 탐지(Object Detection) - (Python)
GPT-4V(ision)를 이용한 객체 탐지(Object Detection) - (Python)
2023.11.26이번 글에서는 GPT-4V를 활용하여 객체 탐지(Object Detection)에 대해 알아보겠습니다. 객체 탐지(Object Detection)는 이미지 내 특정 객체를 식별하고, 그 위치를 정확하게 파악하는 과정을 말하며 이미지 분류(Classification)와 위치 파악(Localization)을 동시에 수행하는 이미지 인식 기술입니다. 이미지 분류(Classification)는 이미지 내의 객체가 무엇인지 식별하고 위치 파악(Localization)은 그 객체가 이미지 내 어디 곳에 위치해 있는지를 나타냅니다. #1. 필수 패키지 설치 및 준비 GPT-4V를 활용한 이미지 인식 프로젝트를 시작하기 전에, 필요한 Python 패키지들을 설치하고 준비하는 과정이 필요합니다. 1) 패키지 설치 먼저,..
GPT-4V(ision)를 이용한 이미지 분류(Classification) - (Python)
GPT-4V(ision)를 이용한 이미지 분류(Classification) - (Python)
2023.11.24AI의 발전은 끊임없이 우리의 기술적 지평을 확장시키고 있습니다. 특히, 이미지 인식 분야는 딥러닝의 발전과 함께 급속도로 진화해 왔습니다. 딥러닝 모델들은 이미지 인식, 객체 탐지, 얼굴 인식 등 다양한 분야에서 혁신적인 성과를 이루어냈지만 이러한 모델들은 주로 단일 모달리티, 이미지 데이터만을 처리하는 데 집중했습니다. 이번 글에서는 GPT-4V를 활용하여 딥러닝 모델에서 시도했던 다양한 이미지 인식 방법들을 재해석하고 적용해보려고 합니다. 구체적으로, Classification, Object Detection, Face Recognition, OCR 그리고 이미지 기반 추론 등의 주제를 다룰 예정입니다. 이를 통해 GPT-4V가 딥러닝 모델의 기능을 어떻게 향상할 수 있는지, 그리고 이미지와 텍스트..
샘 알트만: 인공지능으로 세상을 바꾸는 사람
샘 알트만: 인공지능으로 세상을 바꾸는 사람
2023.10.22세상은 변화하고 있습니다. 우리의 삶, 일, 심지어 생각하는 방식마저 기술의 급격한 진보로 인해 달라지고 있습니다. 이 변화의 최전선에는 여러 인물들이 있지만, 그중에서도 특히 '샘 알트만(Sam Altman)'이라는 이름을 빼놓을 수 없습니다. 샘 알트만은 어떻게 기술 천재로부터 혁신의 아이콘으로 변모했을까요? 그리고 그는 어떻게 인공지능의 미래를 바라보고 있을까요? 이 글에서는 인공지능을 통해 인류에게 미칠 영향을 깊이 이해하려는 샘 알트만의 독특한 철학과 접근 방식을 알아보겠습니다. 그의 생각과 행동이 왜 중요한지, 그리고 우리 모두에게 어떤 의미를 갖고 있는지를 파악하기 위해 그의 과거와 현재, 그리고 그가 추구하는 미래에 대해 소개하겠습니다. 유년기 및 교육 샘 알트만은 자신의 컴퓨터 과학에 대..
나만의 ChatGPT Plugin 만들기: NAVER 검색엔진
나만의 ChatGPT Plugin 만들기: NAVER 검색엔진
2023.10.19ChatGPT의 Plugin은 사용자가 자신만의 맞춤형 기능을 개발할 수 있는 강력한 도구입니다. 이전 글에서는 간단하게 Local DB에 저장하는 TODO 리스트 Plugin을 만드는 방법을 소개했습니다. 나만의 ChatGPT Plugin 만들기: TODO List (No Auth) OpenAI의 ChatGPT는 확장 가능한 구조를 가지고 있습니다. 특히 OpenAI는 Plugin이라는 기능을 제공하는데 이는 사용자가 매우 빠르고 간단하게 나만의 기능을 구축할 수 있게 해줍니다. OpenAI에서 소개 yunwoong.tistory.com ChatGPT는 2021년 9월까지의 데이터로 생성된 모델로, 그 이후의 정보나 실시간 업데이트 되는 정보에는 제한이 있었습니다. 이러한 한계를 극복하기 위해, Cha..
ChatGPT: 'Voice Conversations'으로 이젠 듣고 말한다 (사용법)
ChatGPT: 'Voice Conversations'으로 이젠 듣고 말한다 (사용법)
2023.10.14이전에는 "ChatGPT: 'Chat with Images'로 이젠 본다"라는 주제로 이미지와의 대화 기능을 소개했었습니다. 이번에는 ChatGPT가 어떻게 '듣고 말한다'는 것인지 대해 다루려 합니다. ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)AI 분야는 지속적인 혁신과 발전의 흐름 속에서 또 다른 역사적인 순간을 맞이하였습니다. 2023년 3월 14일, OpenAI는 GPT-4를 세상에 공개하였는데, 이는 AI의 대화 능력이 단순한 텍스트 기반에서 벗yunwoong.tistory.com 사실, 저를 포함해 많은 사람들이 이 기능에 대해 엄청난 기대감을 갖고 있을 것입니다. '언제쯤 이 기능을 직접 사용해 볼 수 있을까?'라는 생각으로 기다렸는데, 제가 오해를 하고 있었습..
ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)
ChatGPT: 'Chat with Images'로 이젠 본다 (사용법)
2023.10.14AI 분야는 지속적인 혁신과 발전의 흐름 속에서 또 다른 역사적인 순간을 맞이하였습니다. 2023년 3월 14일, OpenAI는 GPT-4를 세상에 공개하였는데, 이는 AI의 대화 능력이 단순한 텍스트 기반에서 벗어나 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 시스템으로 발전했음을 의미했습니다. 더 똑똑해진 GPT-4 발표! 무엇이 달라졌을까?독일 마이크로소프트 CTO 안드레아스 브라운은 2023년 3월 9일 독일에서 개최한 이벤트(AI in Focus-Digital Kickoff)에서 "다음 주 GPT-4가 공개될 예정이다"라고 깜짝 발표를 했습니다. 텍스트뿐만 아니라yunwoong.tistory.com ChatGPT의 진화: 이제 보고 듣고 말한다세상은 끊임없이 변화하고 있으며, 그 중심에는 ..
ChatGPT의 DALL·E3 사용법
ChatGPT의 DALL·E3 사용법
2023.10.09지난 9월 21일, OpenAI는 이미지 생성 AI 'DALL·E3'를 발표하였습니다. 이후 Bing Image Creator를 통해 이 기술을 체험해 볼 수 있었으나, ChatGPT 내에서는 사용할 수 없는 상태였습니다. 10월 5일부터 ChatGPT Plus 및 Enterprise 사용자들을 대상으로 DALL·E3의 사용이 순차적으로 공개되기 시작했습니다. DALL·E3의 상세 내용은 아래 글을 참고하시기 바랍니다. OpenAI DALL·E 3 발표: ChatGPT와 통합으로 이미지 생성 AI의 진화 최근 몇 년 동안 AI(인공지능) 분야는 빠른 속도로 발전하고 있으며, 그 중심에는 이미지 및 텍스트 생성 기술이 있습니다. 이미지 생성 영역에서는 Midjourney, leonardo.ai, Adobe..
ChatGPT의 진화: 이제 보고 듣고 말한다
ChatGPT의 진화: 이제 보고 듣고 말한다
2023.09.26세상은 끊임없이 변화하고 있으며, 그 중심에는 기술의 발전이 있습니다. 특히 인공 지능 분야에서의 혁신은 우리의 일상을 크게 바꾸고 있습니다. 그중에서도 대화형 AI, 챗봇의 발전은 눈에 띄게 진화하고 있습니다. 특히, OpenAI의 ChatGPT는 그 선봉에 서 있습니다. OpenAI는 현지시간으로 25일 새로운 음성과 이미지 기능을 ChatGPT에 출시할 것이라고 발표했습니다. ChatGPT can now see, hear, and speak We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to ha..
나만의 ChatGPT Plugin 만들기: TODO List (No Auth)
나만의 ChatGPT Plugin 만들기: TODO List (No Auth)
2023.09.24OpenAI의 ChatGPT는 확장 가능한 구조를 가지고 있습니다. 특히 OpenAI는 Plugin이라는 기능을 제공하는데 이는 사용자가 매우 빠르고 간단하게 나만의 기능을 구축할 수 있게 해줍니다. OpenAI에서 소개하는 기본 예제 중 Todo 리스트를 이용하여 나만의 Plugin을 만들어보도록 하겠습니다. 기본 예제는 리스트에 데이터를 저장하는 방식을 사용하지만, 이 글에서는 데이터를 Sqlite DB에 저장하는 방식으로 조금 더 발전시켜 보겠습니다. ChatGPT의 Todo Plugin을 직접 만들어보며, 로컬 환경에서 어떻게 설정하고 사용하는지에 대한 과정을 단계별로 알아보겠습니다. #1. 환경구성 1) python은 3.10 버전 설치 (가상환경) conda create -n test_env ..