오픈AI GPT-4o, 애플 시리 통합 가능성과 새로운 기능 소개
오픈AI가 새로운 멀티모달 모델(LMM) ‘GPT-4o‘를 공개했습니다. 이 모델은 음성 비서 기능을 대폭 강화하여 텍스트, 이미지, 오디오로 실시간 대화가 가능합니다. GPT-4o의 평균 응답 시간은 232밀리초로 이는 평균 320밀리초로 대답하는 인간의 응답 …
오픈AI가 새로운 멀티모달 모델(LMM) ‘GPT-4o‘를 공개했습니다. 이 모델은 음성 비서 기능을 대폭 강화하여 텍스트, 이미지, 오디오로 실시간 대화가 가능합니다. GPT-4o의 평균 응답 시간은 232밀리초로 이는 평균 320밀리초로 대답하는 인간의 응답 …
스테이블 아티장(Stable Artisan)은 스테이블 디퓨전 개발 회사인 stability.ai가 제공하는 Discord 기반의 이미지 생성 서비스로, 사용자가 텍스트 명령어를 통해 이미지와 비디오를 생성할 수 있습니다. 스테이블 아티장을 이용하면 스테이블 디퓨전 사용을 위해 …
스테이블 디퓨전 사용 시 PC 그래픽 카드 및 CPU 등의 하드웨어 사양이 좋지 못해 이미지 생성에 오래 걸릴 경우 다음과 같이 xformers 설정을 하면 보다 더 빠르게 이미지를 생성하실 수 …
스테이블 디퓨전은 AI를 기반으로 하는 이미지 생성 도구로, 사용자가 원하는 스타일과 내용의 이미지를 생성할 수 있습니다. 복잡한 프로그래밍 없이도 높은 품질의 이미지를 만들 수 있습니다. 이 글에서는 스테이블 디퓨전을 이용해 …
스테이블 디퓨전(Stable Diffusion)은 AI 기반 이미지 생성 모델입니다. 지난 글을 통해 🔗스테이블 디퓨전 설치 방법부터 🔗WebUI 화면 설명, 🔗프롬프트 공유 사이트 및 🔗그래픽카드 사양에 따른 VRAM 설정 방법까지 알아보았습니다. 이번 …
OpenAI Sora의 최신 소식입니다. OpenAI가 개발한 AI 동영상 생성 모델인 Sora를 이용하여 제작된 세계 최초 뮤직비디오가 공개되어 주목 받고 있습니다. Sora는 지난 2월 OpenAI의 커뮤니티에 처음 공개된 Text-to-Video AI 생성 …
2024년 4월 30일, 미드저니 공지로 미드저니 알파 버전을 오픈했다는 공지가 나왔습니다. 미드저니 알파는 디스코드를 통한 접근 방식에서 벗어나 웹 기반 인터페이스로 전환하면서 사용자 편리성을 대폭 개선한 미드저니 웹 버전 플랫폼입니다. …
이전 글에선 스테이블 디퓨전 설치 방법부터 프롬프트 공유 사이트 모음까지 확인해 보았습니다. 아직 스테이블 디퓨전을 설치하지 못하셨거나 사용 준비가 안되신 분들은 이전 글을 참고해 주시기 부탁드립니다. 그럼 이제부터 그래픽 카드의 …
오픈AI의 텍스트-투-비디오(Text-To-Video) 모델인 ‘소라(Sora)‘에 버금가는 새로운 영상 생성 기술이 중국에서 등장했습니다. ‘셍슈 테크놀로지(ShengShu Technology)‘와 칭화대학이 협력하여 개발한 이 기술은, 간단한 텍스트 입력만으로 최대 16초 길이의 고품질 1080p 비디오를 생성할 수 …
스테이블 디퓨전(Stable Diffusion)은 텍스트 입력을 통해 원하는 이미지를 생성할 수 있는 AI 이미지 생성 도구입니다. 텍스트 입력만으로 원하는 이미지를 생성할 수 있어 많은 사용자들이 사용하고 있습니다. 하지만 처음 사용할 때는 …