NBA 결승전 2차전에서 마이애미 히트가 덴버 너게츠를 상대로 승리를 거둔 4가지 요점
Jun 07, 2023전문가가 선정한 2023년 최고의 서지 보호기 및 멀티탭 6개
Oct 24, 2023ACME Lithium은 테스트 웰 TW 설치 후 펌핑 테스트를 위해 증가합니다.
May 24, 2023오하이오주 보드맨의 DeBartolo Commons에서 열린 American Cancer Society의 Relay for Life 이벤트에는 저녁 식사, 자동차 크루즈가 포함됩니다.
Apr 13, 2023에이미 저스트: 네브라스카의 '신데렐라' 릴레이 팀; 가슴 아픈 호프만 소식; 등산객 업데이트
Apr 17, 2023Google Muse AI는 어떻게 작동하나요? 안인
Google Muse AI 뒤에 숨은 마법을 발견해보세요! 우리의 포괄적인 가이드는 이 획기적인 도구가 AI를 활용하여 창의성을 촉발하고 디지털 경험을 변화시키는 방법을 설명합니다.
Google Muse AI는 이미지 생성 분야에 혁명을 일으킬 수 있는 잠재력을 지닌 최첨단 텍스트-이미지 변환기 모델입니다. 이 혁신적인 모델은 Imagen, DALL-E 2 및 Parti와 같은 경쟁사보다 더 효율적이고 빠르다고 주장합니다.
다양한 작업에 사용할 수 있는 최고의 AI 도구 모음입니다.
이 포괄적이고 심층적인 개요에서는 Google Muse AI의 내부 작동 방식, 기능, 기술 사양 및 시중의 다른 인공 지능(AI) 도구와의 차이점을 살펴보겠습니다.
구글 뮤즈 AI
Google Muse AI는 고급 변환기 기반 아키텍처를 활용하는 최첨단 텍스트-이미지 생성 모델입니다. 이 모델은 Stable Diffusion 및 DALL-E 2와 같은 기존 확산 모델이나 Google Parti와 같은 자동 회귀 모델보다 훨씬 효율적으로 설계되었습니다.
Muse AI는 사전 훈련된 LLM(대형 언어 모델)과 개별 토큰 공간을 활용하여 더 빠른 이미지 생성 시간과 고품질 출력을 달성합니다.
AI 생성 예술 분야는 DALL-E 및 Midjourney와 같은 도구가 큰 주목을 받는 등 눈에 띄는 발전을 보였습니다. Google의 Muse AI는 이 혁신적인 도구 목록에 최근 추가된 제품으로, 이전 제품보다 훨씬 더 나은 이미지 생성 기능과 효율성을 약속합니다.
이 모델은 Google Research의 연구원들이 개발했으며 경쟁 우위를 점할 수 있는 다양하고 독특한 기능을 자랑합니다.
Muse AI는 사전 훈련된 LLM인 T5 언어 모델에서 얻은 텍스트 임베딩을 사용하도록 훈련되었습니다.
이 접근 방식을 통해 Muse는 픽셀 대신 개별 토큰을 사용하여 이미지를 생성하는 텍스트 프롬프트를 기반으로 이미지 토큰(이미지의 일부)을 예측하고 생성할 수 있습니다.
Muse AI는 개별 토큰을 사용하여 더 적은 샘플링 반복이나 텍스트 프롬프트로 이미지를 생성할 수 있습니다. 그 결과 Imagen 및 DALL-E 2와 같은 픽셀 공간 확산 모델에 비해 이미지 생성 프로세스가 더 정확하고 효율적이며 더 빠릅니다.
Parti와 같은 기존 자동 회귀 모델과 달리 Muse AI는 병렬 디코딩 아키텍처를 사용합니다. 이러한 접근 방식을 통해 Muse는 더 작은 샘플 크기로도 고품질 이미지를 생성하여 모델을 더 빠르고 효율적으로 만들 수 있습니다.
Muse AI는 T5-XXL 대규모 언어 모델을 활용하여 언어의 뉘앙스를 이해합니다. 이 사전 훈련된 언어 모델을 통해 Muse는 기본 컨텍스트를 이해하고 충실도가 높은 이미지를 생성할 수 있습니다.
또한 객체, 주변 환경과의 관계, 포즈 및 카디널리티와 같은 시각적 개념을 이해합니다.
이 섹션에서는 모델 유형, 사용된 언어 모델, 디코딩 방법, 하위 모델 및 기능을 강조하면서 Muse AI의 기술적 측면을 살펴보겠습니다.
Muse AI는 VQGAN 토크나이저 모델, 기본 마스크 이미지 모델, T5-XXL 임베딩을 기반으로 한 초고해상도 변환기 모델을 포함한 여러 구성 요소 모델로 구성됩니다.
이러한 하위 모델은 텍스트를 인코딩 및 디코딩하고, 토큰 분포를 예측하고, 저해상도 이미지의 품질을 향상시키는 데 사용됩니다.
Google Muse AI를 활용하는 사용자 – Freepik을 통한 이미지
Google Muse AI는 DALL-E 2 및 Midjourney와 같은 다른 텍스트-이미지 생성기 모델과 구별되는 몇 가지 주목할만한 기능을 자랑합니다. 이러한 고유한 기능 중 일부는 다음과 같습니다.
Muse AI는 주어진 텍스트 프롬프트를 기반으로 그림 토큰의 반복적 리샘플링이라는 기술을 사용합니다.
이 접근 방식을 사용하면 모델은 다른 영역을 마스킹할 필요 없이 텍스트 프롬프트를 기반으로 이미지의 모든 영역을 변경할 수 있습니다. 이러한 제로샷 및 마스크 없는 편집 기능은 Midjourney 및 DALL-E 2와 같은 모델에는 없습니다.
Muse 3B 모델은 TPUv4에서 단 1.3초 만에 512×512 이미지를 생성할 수 있어 다른 텍스트-이미지 생성 도구보다 빠릅니다.