Близнецы 1 про

Обновление Gemini 1.5 Pro позволяет ИИ слушать и генерировать контент

Аватар Жоау Лукаса Батисты
Благодаря новому обновлению искусственный интеллект Google теперь понимает и анализирует звук. Imagen 2 теперь может добавлять и удалять элементы изображения и создавать 4-секундные GIF-файлы.

A Google Искусственный интеллектили Gemini, получил новое инновационное обновление во вторник, 9 апреля, во время Google Cloud Next. Благодаря обновлению Близнецы 1.5 Про, получил возможность понимать и анализировать аудио и видео строки, создавая контент на основе того, что введено в приложение.

Изначально новая функция доступна только пользователям Вершинный ИИ, программное обеспечение, предназначенное для обучение с помощью машины (машинное обучение), используемое программистами и учеными для разработки новых ИИ.

Что делает Gemini, ИИ Google?

Обновление Gemini 1 pro позволяет слушать и генерировать контент. Благодаря новому обновлению искусственный интеллект Google теперь понимает и анализирует звук. Imagen 5 теперь может добавлять и удалять элементы изображения и создавать 2-секундные GIF-изображения.
Интерфейс Близнецов. Изображение: Лукас Гомес/Showmetech

O Gemini, искусственный интеллект Google, был запущен в декабре прошлого года. замена Барда, и выделяется своей способностью решать очень сложные задачи, от кодирования до отточенных логических рассуждений.

Искусственный интеллект имеет функции, которые могут помочь пользователю в самых разнообразных задачах, манипулируя самыми разными файлами с целью объединения различных типов информации, а также их организации. Его возможности позволяют использовать разные форматы контента, в том числе:

  • тексты;
  • картинки;
  • аудио;
  • видео; Это
  • языки программирования.

O Gemini Он имеет три режима работы с разными особенностями:

  • Близнецы Ультра — более крупный и способный решать весьма сложные задачи;
  • Близнецы Pro — лучше всего подходит для масштабирования широкого спектра задач;
  • Близнецы Нано — более эффективен для мобильных задач.

Обновление Gemini 1.5 Pro и его новые функции

Обновление Gemini 1 pro позволяет слушать и генерировать контент. Благодаря новому обновлению искусственный интеллект Google теперь понимает и анализирует звук. Imagen 5 теперь может добавлять и удалять элементы изображения и создавать 2-секундные GIF-изображения.
Близнецы ИА. Изображение: rafares/Shutterstock)

Эта новая модель, представленная технологическим гигантом, представляет собой значительный шаг вперед по сравнению с предыдущей моделью за счет улучшения производительности и понимания длинных контекстов. Близнецы 1.5 Про, который является начальной версией, доступной для тестирования, оптимизирован для различных задач и более эффективен с точки зрения вычислений, являясь более надежной версией и способной удовлетворить требования даже более сложных действий.

Кроме того, Близнецы 1.5 Про содержит экспериментальный ресурс, который теоретически может обрабатывать до 1 миллион токенов для крупномасштабных базовых моделей, которые будут революционными. По данным Google, эта огромная сумма представляет собой 700.000 30.000 слов и XNUMX XNUMX строк кода, что эквивалентно один час видео ou 11 часов аудио.

Новые инструменты Gemini 1.5 Pro позволяют приложению различать изображения (кадры) и звук (речь) для видео, загруженных на Google AI-студия, что облегчит производство контента. По официальной информации, обновление AI от Google доступно более чем в 180 страны через Gemini API (интерфейс прикладного программирования на португальском языке) с беспрецедентной встроенной способностью понимать аудио и новым API, который упрощает обработку файлов.

В выпуске также представлены новые системные инструкции и функции режима. JSON (облегченный формат данных для обмена информацией между компьютерными системами). Веря в потенциал нового обновления, Google обещает, что модель встраивания текста превосходит конкурентов с аналогичными функциями.

O Близнецы 1.5 Про в настоящее время доступен только через Вертексный ИИ.

Imagen 2 может создавать GIF-файлы

во время мероприятия Google Cloud NextGoogle сделал еще один важный анонс: модель искусственного интеллекта Imagen 2, который может генерировать изображения и короткие видеоролики из наводящие текста. Благодаря этому можно создавать GIF-файлы продолжительностью до четырех секунд с разных ракурсов, а также показывать движение.

Отличие этого инструмента заключается именно в возможности изучения разные углы, с большей динамикой сцен, выходящей далеко за рамки видеороликов AI, созданных из статичных фотографий и ограниченных движений.

Пример творений из Imagen 2 в Vertex IA. Видео: Google Cloud/YouTube

O Imagen 2 имеет возможность создавать видеоклипы, также известные как живые изображения, с низким разрешением. 640 х 360. Кроме того, Google использует свою технику SynthID применить невидимый водяной знак в клипах и изображениях, созданных искусственным интеллектом. Компания утверждает, что SynthID может поддерживать редактирование и даже сжатие, меры, направленные на продвижение безопасность данных.

На сегодняшний день ресурсы Imagen 2 доступны только через Вертексный ИИ, который теперь включает поддержку внутреннего и внешнего рисования, а также возможность редактировать изображения с помощью ИИ, позволяя расширять границы или добавлять/удалять определенные части изображения. Инструменты, предназначенные для профессионалов в области маркетинга и создания контента для кампаний, среди других рекламных материалов и видеоплатформ.

Вертексный ИИ

Обновление Gemini 1 pro позволяет слушать и генерировать контент. Благодаря новому обновлению искусственный интеллект Google теперь понимает и анализирует звук. Imagen 5 теперь может добавлять и удалять элементы изображения и создавать 2-секундные GIF-изображения.
Платформа Vertex AI. Изображение: Google/Репродукция

O Вертексный ИИ это платформа обучение с помощью машины (ML), который позволяет обучать и развертывать инструменты и приложения искусственного интеллекта, включая настройку больших языковых моделей (LLM) для использования в приложениях на базе искусственного интеллекта.

Платформа объединяет разнообразные возможности и приложения Google, интегрируя рабочие процессы обработки данных, науки о данных и разработки данных. обучение с помощью машины, обеспечивая совместную работу между командами с помощью общего набора инструментов, а также масштабирование приложений с помощью преимуществ Google Cloud.

A Вершинный ИИ предлагает несколько вариантов обучения и развертывания моделей:

  • AutoML позволяет обучать табличные, графические, текстовые или видеоданные без необходимости написания кода или подготовки разделения данных.
  • Персонализированное обучение дает вам полный контроль над тренировочным процессом, включая использование рамки предпочтительный код ML, собственный код обучения и выбор вариантов настройки гиперпараметров.
  • Модельный сад Обеспечивает обнаружение, тестирование, настройку и развертывание моделей Vertex AI, включая выбор модели и ресурсы с открытым исходным кодом (OSS).
  • A Генеративный ИИ предлагает доступ к большим генеративным моделям искусственного интеллекта Google в различных модальностях (текст, код, изображения, речь). Вы можете настроить LLM Google в соответствии со своими потребностями и развернуть их для использования в своих приложениях на базе искусственного интеллекта.

источник: Грань, Google для разработчиков, Гид Тома, Beebom, Google Cloud

См. также:

Рассмотрено Главкон Витал от 10.


Узнайте больше о Showmetech

Подпишитесь, чтобы получать наши последние новости по электронной почте.

Похожие сообщения
Миссии Артемиды на Луну 3

Возвращение на Луну: узнайте о 5 этапах миссии «Артемида».

Программа НАСА предусматривает как высадку на Луну, так и создание постоянной базы на Луне. Ознакомьтесь с хронологией миссии и разберитесь в назначении каждого этапа.
Виктор Пачеко аватар
Читать дальше
Топ-5 лучших приложений с искусственным интеллектом для записи совещаний

Топ-5 лучших приложений с искусственным интеллектом для записи совещаний

Ознакомьтесь с приложениями и расширениями для Google Chrome, которые с помощью искусственного интеллекта будут записывать, расшифровывать и даже подводить итоги совещаний.
Александр Маркес Аватар
Читать дальше