본문 바로가기
AI

[AI] ChatGPT 사용법 (22) - Image input (이미지 분석)

by 노력남자 2023. 10. 14.
반응형

이번 포스팅은 9월 25일에 공개된 Image input (이미지 분석)에 대해 알아보려고 한다.
 
오랜만에 ChatGPT에 재밌는 기능이 생겼다. 가자!

 

Image Input (이미지 분석)이란?

 

이미지와 이미지에 대한 질의를 작성해서 질문을 하면 ChatGPT가 답을 해준다.

 

수학 문제를 풀어준다든지, 내가 모르는 언어를 찍어서 올리면 번역해준다든지 이것저것 무궁무진하게 활용할 수 있는 기능이다.

 

사진으로 계속 대화를 이어나갈 수 있다는 점이 정말 흥미로운 거 같다.

 

안드로이드와 IOS 앱에서 Plus와 Enterprise Plan인 유저만 GPT-4를 선택해서 사용할 수 있는 기능이다.

 

공식 홈페이지에 있는 설명은 아래와 같다.

 

이제 ChatGPT에게 하나 이상의 이미지를 보여줄 수 있습니다. 그릴이 왜 작동하지 않는지 문제 해결하거나 식사 계획을 위해 냉장고 내용물을 살펴보거나 업무 관련 데이터를 분석하기 위해 복잡한 그래프를 살펴볼 수 있습니다. 이미지의 특정 부분에 집중하려면 모바일 앱의 그리기 도구를 사용할 수 있습니다.

 

시각 기반 모델은 인간에 대한 환상부터 고립된 이미지의 모델 해석에 의존하는 고위험 도메인에서의 리스크와 같은 새로운 과제를 제시합니다. 보다 넓은 배포 이전에, 우리는 모델을 고위험 도메인에서의 리스크에 대한 레드 팀 테스트 및 다양한 알파 테스터 집단과 함께 테스트했습니다. 우리의 연구는 책임 있는 사용을 위한 몇 가지 중요한 세부 정보를 조율하는 데 도움이 되었습니다.

 

Image Input 사용법

 

0. ChatGPT 앱 접속

 

1. 상단에 GPT-4를 클릭한 후 왼쪽 하단에 사진 촬영, 앨범에서 찾기 둘 중 하나를 눌러 질문할 이미지를 준비

 

왼쪽: 사진 촬영, 오른쪽: 앨범에서 이미지 선택

 

2. 선택한 이미지와 질문을 작성 후 질문 버튼 클릭

 

 

ChatGPT 공식 홈페이지 글을 바로 찍어서 번역해달라고 요청해봤다.

 

 

3. 질문의 답을 잘 해준다

 

근데 아직 많이 느린 거 같다.

 

이 기능 소개 홈페이지에선 엄청 빠르게 되던데 아직은 느리다.

 

한글로 질문해서 늦었나 해서 영어로 해봤더니 똑같다.

 

 

Image Input 활용법

 

1. 모르는 언어 번역

 

근데 아직은 많이 느려서 구글 렌즈를 쓰는 게 더 좋겠다는 생각이 든다.

 

2. 수학 계산식 풀이

 

3. 장비 수리

 

 

ChatGPT can now see, hear, and speak

We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about.

openai.com

 

이미지 분석 기능을 소개하는 동영상을 보면 자전거 수리 방법에 대해서 사진으로 대화하는 게 나오는데 사진으로 계속 대화를 이어 나갈 수 있다는 점이 너무 좋은 거 같다.

 

 

이외에도 정말 무궁무진하게 활용할 수 있을 것으로 보인다.

 

계속 발전해나가는 ChatGPT 너무 좋다. 파이팅

반응형

댓글